news-details

陸國產AI模型升級 大車拚

大陸國產AI大模型正在「拚升級」。 路透

大陸雲端服務供應商(CSP)阿里巴巴昨(2)日更新圖片生成及編輯模型Qwen-Image,且新版本已首發接入千問App;DeepSeek也在前一日發布兩款新模型DeepSeek-V3.2和DeepSeek-V3.2-Speciale,號稱達到GPT-5水準。大陸國產AI模型大戰正在「拚升級」,但一般認為要追趕美國閉源模型仍有差距。

阿里更新版Qwen-Image解決了中文圖內處理、亞洲人像真實度等痛點,且支持多語言。而接入千問App,意味阿里正透過高頻迭代與低門檻體驗,加速AI技術從實驗室走向大眾的步伐。

與此同時,DeepSeek推出的兩款新模型有不同的定位:一款DeepSeek-V3.2的目標是平衡推理能力與輸出長度,適合日常使用;另一款DeepSeek-V3.2-Speciale則是重頭戲,其目標是「將開源模型的推理能力推向極致,探索模型能力的邊界」,具備出色指令跟隨、嚴謹數學證明與邏輯驗證能力。

不過,DeepSeek在技術報告中承認,與Google最新一代大型語言模型(LLM)Gemini 3 Pro等前沿閉源模型相比,自家模型仍存在一定的局限性:一是V3.2的世界知識廣度仍落後於領先的專有模型;二是在安全權杖(Token)效率方面,V3.2通常需要更多的權杖才能達到像Gemini3 Pro這樣的模型輸出質量。在解決複雜任務方面也不如前沿模型。也承認開源與閉源模型差距未縮小,反而在拉大,閉源性能增長速度更快。

快手AI團隊「可靈AI」2日也發布全新產品「可靈O1」,號稱全球首個大一統的多模態視頻、圖片創作工具。可靈O1基於MVL(多模態視覺語言)理念,打破傳統單一視頻生成任務的模型邊界,整合文字、視頻、圖片、主體等多模態輸入等。用戶無需在多個模型及工具間跳轉,即可一站式完成從生成到修改的全部創作流程。

富比士中國(Forbes China )引述分析報導,不同於美國以閉源模型和API服務為主導的發展路徑。大陸AI模型正透過應用生態、終端硬體滲透「雙線作戰」:應用生態方面,字節跳動的豆包手機助手選擇了系統級融合的路徑;硬體滲透上,阿里巴巴推出夸克AI眼鏡、將AI能力延伸至可穿戴硬體。