人民網
人民網>>經濟·科技

基礎大模型新技術、新產品密集推出——

中國AI產業創新步伐加快

2026年02月05日09:19 | 來源:科技日報222
訂閱已訂閱已收藏收藏小字號

點擊播報本文,約

新春臨近,AI產業競爭日漸升溫。今年以來,百度、阿裡、DeepSeek圍繞基礎大模型密集發布新技術、新產品,加速搶佔AI創新制高點。

1月22日,百度上線採用原生全模態統一建模技術的文心大模型5.0正式版,支持文本、圖像、音頻、視頻等多種信息的輸入與輸出﹔1月26日,阿裡發布千問旗艦推理模型Qwen3-Max-Thinking,創新推理技術,實現性能躍升﹔隨后,DeepSeek推出全新DeepSeek-OCR-2模型並開源。業內專家認為,短時間內,中國AI“進入三足鼎立格局”,創新步伐明顯加快。

基礎大模型的演進決定了AI應用能力的上限。文心大模型5.0正式版以原生全模態架構引領技術革新,塑造競爭優勢。百度相關負責人介紹,與業界多數採用“后期融合”的多模態方案不同,文心大模型5.0正式版採用統一的自回歸架構進行原生全模態建模,將文本、圖像、視頻、音頻等多源數據在同一模型框架中進行聯合訓練,使得多模態特征在統一架構下充分融合並協同優化,實現原生的全模態統一理解與生成。此前公布的LMArena全球大模型競技場榜單中,文心大模型5.0正式版多次位居文本榜和視覺理解榜國內第一,躋身國際第一梯隊。

阿裡同樣圍繞千問大模型持續發力。其最新發布的推理模型Qwen3-Max-Thinking採用了一種全新的測試時擴展機制,可在相同上下文中實現更高效的推理計算,獲得更智能的推理結果且更加經濟。除此以外,阿裡以應用生態為抓手,憑借自身流量入口優勢,推動千問大模型打通電商、酒旅、支付等自身優勢領域,深度接入淘寶、支付寶、飛豬等平台,實現技術與場景高效協同。

業內專家表示,與百度、阿裡背靠強大自有業務生態全面發力不同,DeepSeek立足開源優勢,專注於模型底層能力與開放生態建設,通過“模型權重+訓練框架+部署工具”的全棧開源,將性價比優勢“發揮到極致”。

DeepSeek最新推出的DeepSeek-OCR-2採用創新的DeepEncoder V2方法,讓模型可根據圖像含義動態重排圖像各部分,模擬了人類觀看場景的邏輯流程,使得其在處理復雜圖片時更智能、更有邏輯,展現出獨特的技術創新巧思。

1月29日,對標DeepSeek-OCR-2,百度也迅速發布並開源了文心衍生模型Paddle OCR-VL-1.5,首創OCR(光學字符識別)模型的“異形框定位”技術,能精准識別拍歪、折角、卷邊的不規則文檔。

百度相關負責人介紹,作為極少數具備全棧AI能力的企業,百度也在軟硬協同、場景落地方面有著更為持久的投入,在此輪“頭部玩家”的競爭中展現出強勁韌性。

在底層硬件方面,始於自身業務對算力的極限需求,百度孵化出的AI芯片品牌昆侖芯走過了從專用到通用、從內部支撐到對外服務的完整路徑,驗証了場景定義芯片的可行性,並於近期啟動獨立上市進程,加速多領域布局。目前,百度已點亮國內首個全自研三萬卡昆侖芯集群,可同時支撐多個千億參數大模型訓練,實現自研算力從“可用”到“規模化可復制”的跨越。

可靠的底層算力、領先的雲服務,以及強大的模型能力,催生出更加豐富的產品服務。基於文心基礎大模型,百度構建了矩陣模型和專精模型。矩陣模型面向產品級應用和通用場景快速落地﹔專精模型面向行業應用和垂直場景,例如文心數字人大模型已在直播電商等領域實現規模應用,創造出新的交互體驗與內容形態。2025年“雙11”期間,數字人直播商品交易總額同比增長91%,開播直播間數增長119%,超10萬商家使用。

自2025年春節期間DeepSeek走紅以來,中國AI便一直是國際科技領域的熱門話題。經過一年多時間發展,AI技術正在我國邁入規模化落地新階段,AI的價值也在驅動產業變革、創造更廣泛社會效益中得到進一步驗証。企業發展路徑雖各有不同,但其背后是一條清晰可見的創新能力升級之路,共同推動中國AI產業從“追趕”邁向“領跑”。

(責編:羅知之、陳鍵)
關注公眾號:人民網財經關注公眾號:人民網財經

分享讓更多人看到

推薦閱讀
返回頂部