Google於18日發表旗下最強AI模型Gemini 3。路透
Google於18日發表旗下最強AI模型Gemini 3,推理與編寫程式能力大躍進,號稱更能理解用戶查詢的背後脈絡與意圖,從過往的閱讀文字、圖像,進化到會「讀懂空氣」,並整合到整體Google生態系。
Gemini 3不僅具備解決問題,更具備分析、判斷及思考能力,從過往的「聊天機器人」晉升為「數位同事」等級。業界認為,Gemini 3大進化,象徵AI模型已進入全新世代,後續需更強大算力支援,Google勢必加大投資AI伺服器力道,助益鴻海、廣達、英業達等代工夥伴後市。
法人指出,鴻海、廣達、英業達等代工廠都已打入Google AI伺服器的L6、L10、L11等相關組件供應鏈,目前Google釋出的訂單能見度直達2026年底。
Gemini 3於18日推出後,OpenAI執行長奧特曼及特斯拉執行長馬斯克都相繼送上祝賀,顯示Gemini 3備受市場關注。股神巴菲特持有的波克夏海瑟威更加碼投資Google股票43億美元,顯示巴菲特同樣看好未來AI運算需求將成為市場上一大商機。
Google表示,Gemini 3的推理和多模態能力提升,解釋與視覺化告想的能力提高,不只是個別處理文字或圖像,編寫程式能力也強化,能創建簡報檔或互動試圖向,說明複雜的想法,並將改善針對Gemini應用程式(App)與Google搜尋引擎AI模式提問的回答精密度,且能轉換文字與生成圖像的資訊、或來自App的單一提示詞。
例如,若有用戶詢問旅遊計畫,Gemini 3能生成視覺圖像,涵蓋可點擊的互動元素,在查詢比較不同房貸利率與頭期款時,Gemini 3能即時生成互動式比較工具,並附上各方案的利弊分析。Google說,「重點不只是Gemini 3理解輸入詞的方式,而是能以全新的方式呈現」。
此外,Gemini Pro與Ultra的美國付費用戶現在將能在Google的搜尋模式下,看到採用Gemini 3模型的「思考」新選項,能夠更精細拆解用戶的查詢字詞,從而回應用戶日益複雜的提問。Google表示,「思考」功能將在近期擴及所有搜尋服務。
Google執行長皮伽說,Gemini 3是要理解深度與文字微妙,「更能理解脈絡和查詢背後的意圖」,「想想只花兩年,AI就從單純讀文字和圖表,演進到會『讀懂空氣』,真的很不可思議」。
這也凸顯Google正運用自家資源雄厚的「全棧式」技術優勢,追趕OpenAI。Google有DeepMind研究員創建模型,運用自家TPU晶片訓練模型,擁有託管模型並提供給開發者的雲端服務,還能透過搜尋、YouTube、Gemini等受歡迎的App通路,直接送到顧客手上。