領軍企業密集推出新技術 AI產業創新步伐加快
222
訂閱已訂閱已收藏
收藏點擊播報本文,約
新春臨近,AI產業競爭也日漸升溫。
1月22日,百度正式上線採用原生全模態統一建模技術的文心5.0正式版,支持文本、圖像、音頻、視頻等多種信息的輸入與輸出﹔1月26日,阿裡也正式發布千問旗艦推理模型Qwen3-Max-Thinking,創新推理技術,實現性能躍升﹔隨后,DeepSeek推出全新DeepSeek-OCR 2模型並開源。短時間內,中國AI進入三足鼎立格局,創新步伐明顯加快。
基礎大模型的演進,決定了AI應用能力的上限。今年以來,百度、阿裡、DeepSeek圍繞基礎大模型密集發布新技術、新產品,加速搶佔AI創新制高點。
不久前上線的文心大模型5.0正式版以原生全模態架構引領技術革新,塑造競爭優勢。百度相關負責人介紹,與業界多數採用“后期融合”的多模態方案不同,文心5.0採用統一的自回歸架構進行原生全模態建模,將文本、圖像、視頻、音頻等多源數據在同一模型框架中進行聯合訓練,使得多模態特征在統一架構下充分融合並協同優化,實現原生的全模態統一理解與生成。此前公布的LMArena全球大模型競技場榜單中,文心5.0多次位居文本榜和視覺理解榜國內第一,躋身國際第一梯隊。
阿裡則在推理模型Qwen3-Max-Thinking中採用了一種全新的測試時擴展機制,在提升推理性能的同時還更加經濟。這一新機制,可對此前推理的結果進行“經驗提取”式的提煉,並據此進行多輪自我迭代,在相同的上下文中實現更高效的推理計算,獲得更智能的推理結果。除此以外,阿裡以應用生態為抓手,憑借自身流量入口優勢,推動千問大模型打通電商、酒旅、支付等自身優勢領域,深度接入淘寶、支付寶、飛豬等平台,實現技術與場景高效協同。
與百度、阿裡背靠強大自有業務生態全面發力不同,DeepSeek立足開源優勢,專注於底層能力與開放生態建設,通過“模型權重+訓練框架+部署工具”的全棧開源,將性價比優勢發揮到極致。
DeepSeek最新發布的DeepSeek-OCR 2採用創新的DeepEncoder V2方法,讓模型可根據圖像含義動態重排圖像各部分,模擬了人類觀看場景的邏輯流程,使得其在處理復雜圖片時更智能、更有邏輯,展現出獨特的技術創新巧思。目前,其開源技術已融入眾多垂直場景,推動AI技術向千行百業低成本滲透。
隨后的1月29日,百度也趁熱發布並開源了文心衍生模型Paddle OCR-VL-1.5,直接對標DeepSeek-OCR-2,不僅在相關權威榜單中位列全球第一,還首創OCR(光學字符識別)模型的“異形框定位”技術,能精准識別拍歪、折角、卷邊的不規則文檔。
作為極少數具備全棧AI能力的企業,百度也在軟硬協同、場景落地方面有著更為持久的投入,在此輪“頭部玩家”的競爭中展現出強勁韌性。
在底層硬件方面,始於自身業務對算力的極限需求,百度孵化出的AI芯片品牌昆侖芯走過了從專用到通用、從內部支撐到對外服務的完整路徑,驗証了場景定義芯片的可行性,並於近期啟動獨立上市進程,加速多領域布局。目前,百度已點亮國內首個全自研三萬卡昆侖芯集群,可同時支撐多個千億參數大模型訓練,實現自研算力從“可用”到“規模化可復制”的跨越。
可靠的底層算力,領先的雲服務,以及強大的模型能力,催生出更加豐富的產品服務。基於文心基礎大模型,百度構建了矩陣模型和專精模型。矩陣模型面向產品級應用和通用場景快速落地﹔專精模型面向行業應用和垂直場景,例如文心數字人大模型已在直播電商等領域實現規模應用,創造出新的交互體驗與內容形態。2025年“雙11”期間,數字人直播商品交易總額同比增長91%,開播直播間數增長119%,超10萬商家使用。
自2025年春節DeepSeek走紅以來,中國AI便一直是國際科技領域的熱門話題。轉眼新春又至,經過一年多時間的發展,如今,AI技術正在我國正邁入規模化落地新階段,AI的價值也在驅動產業變革、創造更廣泛社會效益中得到進一步驗証。雖企業發展路徑各有不同,但其背后是一條清晰可見的創新能力升級之路,共同推動中國AI產業從“追趕”邁向“領跑”。(記者 都芃)
關注公眾號:人民網財經
分享讓更多人看到
- 評論
- 關注































微信掃一掃


第一時間為您推送權威資訊
報道全球 傳播中國
關注人民網,傳播正能量