輝達執行長於美西時間十六日在GTC大會發表專題演說,宣布輝達推出NemoClaw,透過多層安全機制,協助企業在內網安全部署AI代理。(法新社)
AI需求熱度不減,輝達執行長黃仁勳表示,預估AI基礎建設需求到二○二七年將為輝達帶來一兆美元營收,較先前預估的五千億美元翻倍;此外,AI產業已從過去的模型訓練階段,正式跨入「推論(Inference)」與「代理型AI」時代。這也象徵全球科技產業正進入「算力經濟」新紀元。
輝達GTC年度技術大會美西時間十六日在加州聖荷西登場,黃仁勳發表主題演說,他再度提出強勁的AI基礎建設需求,粉碎AI泡沫化的疑慮。他說,「不久前在同樣的發布場合上,我很確定AI基礎建設將帶來高達五千億美元需求,但今天我再告訴大家,這個需求到二○二七年將突破一兆美元,甚至比這個金額還高。」主因為AI發展已從模型訓練為核心的初期階段,邁入以推論運算為主的商業化時代。
黃仁勳說,在過去一年中,AI跨越一個重要的門檻,也就是模型的能力首次達到足以大規模應用的程度。推理能力提升、AI幻覺顯著減少,基於AI的應用也首次開始產生真正的經濟價值。
黃仁勳表示,ChatGPT的出現開啟生成式AI時代,並推動人工智慧從生成式AI進一步邁向代理型AI,使電腦運算模式從傳統搜尋逐步轉向生成與推論。相較於單純的問答工具,生成式AI能直接創造生產力,也帶動全球對算力需求快速攀升,推論需求在過去兩年間已大幅成長,暴增約一百萬倍。
黃仁勳認為,AI仍處於非常早期的階段,但方向明確。他說,他看到全球各地正看到晶片工廠、電腦組裝廠及AI工廠,以前所未有的規模興建,這正成為人類史上規模最大的基礎設施建設工程。
黃仁勳說,從輝達業務結構來看,約有六成營收來自大型雲端服務供應商,主要集中在全球前五大雲端業者,而很多需求來自企業內部應用,包含推薦系統與搜尋服務,正逐漸從傳統演算法轉向深度學習與大型語言模型;其他四成收入來自機器人、邊緣運算、超級電腦以及企業伺服器等不同應用場景,顯示AI應用範圍正在快速擴大,不再只是單一應用,而是逐漸成為新一代的重要運算平台。
輝達也在GTC大會大秀技術實力。包括首度整合七顆晶片組成的全新Vera Rubin機架,並首度釋出下一代Feynman架構的CPU名稱,取名為Rosa。
黃仁勳還提出「Token(詞元)工廠經濟學」概念,強調AI資料中心的競爭關鍵,不再只是算力規模,反而是每單位電力可產出的Token數量(Tokens per Watt)。由於資料中心的電力供給具備上限,在固定功率條件下,誰能以更高效率生成更多Token,誰就能以更低成本提供AI服務並取得更高利潤。此外,未來Token將成為全新的大宗商品(Commodity)。