人民網
人民網>>經濟·科技

中國科技公司押注“春節檔” 除夕再迎重磅開源模型

2026年02月18日08:37 | 來源:中國新聞網222
訂閱已訂閱已收藏收藏小字號

點擊播報本文,約

  中新網北京2月17日電 (記者 尹倩芸)中國科技公司又“過大年”。

  除夕當天,阿裡巴巴開源全新一代大模型千問Qwen3.5-Plus,該版本總參數3970億,激活僅170億,部署顯存佔用降低60%,在保持能力的同時優化速度與成本。

  Qwen3.5-Plus整體能力媲美Gemini3 Pro,在多項權威基准測試中刷新開源模型紀錄,API(應用程序接口)價格每百萬Token(字符)低至0.8元,僅為Gemini3 Pro的1/18。

  值得注意的是,千問3.5在文本和視覺的混合數據上預訓練,實現了原生多模態的新突破,在推理、編程、Agent智能體等全方位基准評估中均表現優異,並在視覺理解能力的權威評測中斬獲數項性能最佳。

  在春節假期到來前,中國科技公司就已開始密集“上新”:智譜宣布上線並開源GLM-5,並稱這款模型為“Agentic Engineering時代最好的開源模型”﹔科大訊飛和MiniMax也帶來新模型,分別是基於全國產算力訓練的星火X2大模型和M2.5模型,而M2.5在處理復雜任務時展現出了更高的決策成熟度。

  字節跳動新一代AI視頻生成模型Seedance2.0近期也站到了聚光燈下,其憑借多模態創作方式、自帶運鏡的呈現效果,迅速在全球范圍內引發高度關注。

  這並非中國科技公司第一押注“春節檔”,回望2025年的春節假期,彼時阿裡雲通義團隊發布Qwen2.5-Max,這是其大模型的全新版本升級,DeepSeek(深度求索)迎來大量新平台的接入上架,熱度持續升溫。

  上海財經大學特聘教授胡延平認為,今年發的新模型都越來越“多能實用”,原生多模態+智能體能力,代碼、多語言等方面表現均衡,甚至空間智能、視覺推理也可用,同等“質素”隻需過去三分之一的體量,解碼吞吐量卻又數倍增長,這些都讓部署和使用省去很多麻煩,效率也提高很多。

  業界認為,Qwen3.5的意義不止於“又刷新了一次榜單”。過去兩年,大模型行業信奉“大力出奇跡”,參數從千億堆向萬億,性能在漲,但代價也在漲。部署應用專用集群,推理要燒算力,中小企業用不起,技術越來越強,但離真正好用越來越遠。Qwen3.5的思路則是,不比誰更大,而是比誰更聰明,比誰能用相對更小的模型,借助技術創新,獲得更大的智能。

  融合亦是另一大看點,也遠遠超出“讀懂一張圖”。Qwen3.5能對圖像進行像素級空間定位與代碼級精細處理,能理解長達2小時視頻中的時序演變與因果關系,能將一張手繪草圖直接轉化為可運行的前端代碼,甚至可以作為視覺智能體自主操控手機與電腦、跨應用完成多步驟復雜任務。

  如此從識別到理解、從單模態到跨模態推理,這料將為后續更自然、更一致的多模態生成與推理打下了堅實基礎。

  目前,千問模型的開源數量超400個,衍生模型數量突破20萬個,下載量突破10億次,遠超美國的Llama,包括李飛飛團隊、愛彼迎等全球公司和機構都在使用千問模型。

  中國工程院院士倪光南近期就表示,開源已經成為全球信息技術發展的強大動力,在新興的、大模型引領的人工智能領域,開源表現強勁。中國已經成為全球開源大模型的最大提供者,如中國的 Qwen、DeepSeek、Kimi等都在 AI模型評估平台 LMArena的排名中名列前茅。

  他還提到,一些中國企業引領的開源社區在國際上蓬勃發展,在 AI時代展現出勃勃生機。中國企業積極擁抱開源理念,成為全球開源大模型創新的引領者。(完)

(責編:王震、陳鍵)
關注公眾號:人民網財經關注公眾號:人民網財經

分享讓更多人看到

推薦閱讀
返回頂部