人民網
人民網>>經濟·科技

大模型從工具走向伙伴

2026年04月18日08:53 | 來源:經濟日報222
訂閱已訂閱已收藏收藏小字號

點擊播報本文,約

原標題:大模型從工具走向伙伴

從“養蝦”到“殺蝦”,一款名叫“龍蝦”的開源AI智能體OpenClaw近期持續成為社交平台熱門話題。近年來,大模型驅動的智能體已成為人工智能開發機構爭相布局的戰略高地。從最初的“能對話”,到如今“可動手操作”,不斷迭代的大模型將走向何方?

提升推理能力是關鍵

在相繼推出旗艦模型GLM—4.5、GLM—4.6后,去年12月,北京智譜華章科技股份有限公司上線並推出新一代視覺推理模型GLM—4.6V,核心目標之一是提升推理能力。

“讓AI像人類一樣綜合感知、理解與決策,多模態推理能力的突破很關鍵,這也是大模型向通用人工智能演進的必由之路。”智譜聯合創始人、董事長劉德兵說。

無論是通用大模型還是行業大模型,推理能力是打造未來競爭力的關鍵指標,一定程度上決定了其應用廣度和深度。

北京航空航天大學人工智能研究院副研究員胡堃解釋說,推理能力可理解為模型不僅知道“是什麼”,還能判斷“為什麼”和“如何做”,並在復雜邏輯或跨領域條件下給出合理答案。“如果將大模型作為助手,傳統大模型近似知識庫型助手,回答用戶提出的事實性問題﹔推理能力強的大模型更像策略型顧問,不僅能回答常規的經驗問題,還能分析利弊、推演后果並綜合多種因素給出具體建議”。

對科學基礎大模型來說,推理能力尤為重要。一方面,在數學、物理等領域,推理能力是解決定理証明和理論發現的關鍵基礎﹔另一方面,面向各學科領域的復雜科研任務,推理能力是任務理解和規劃決策的重要前提。

“磐石·科學基礎大模型一直堅持和重視推理能力的學習與強化。”中國科學院自動化研究所研究員張家俊介紹,如今磐石·科學基礎大模型將數字幻覺(大模型生成看似合理但實則虛構或失真的信息)從30%降至11%,科學模態數據分析和理解能力全面提升。

“隨著應用場景日趨復雜,用戶更需要大模型在不確定的條件下進行綜合分析並作出合理判斷與決策。眼下,推理能力是大模型規模化應用的競爭焦點。”胡堃表示。

智能體成重要形態

智能體是一個由“大模型+記憶系統+工具調用+規劃能力”構成的智能系統,已成為開發機構發力重點:磐石大模型新增創新評估科學智能體,為科研選題、技術方案等科研決策提供支持﹔海康威視將AI和大模型融入研發、生產決策全流程,打造了系列智能體﹔北航在智能無人機系統中引入智能體,使無人機自主完成復雜的飛行任務……

“當前,深化與拓展大模型核心能力,業內主要聚焦3個方面尋求突破。”胡堃介紹,一是進一步提升多步推理和因果推理能力﹔二是持續創新高效訓練與推理算法,通過優化模型結構、改進訓練策略等,顯著降低大模型對高昂算力的依賴,推動其向更廣泛的應用場景普及﹔三是不斷增強大模型智能體化與自動化任務執行能力,讓大模型能自主接收任務目標、規劃執行路徑、動態調整策略並完成連貫的復雜流程。

“智能體能力意味著大模型不僅能給出實際可行的方案,還可從被動的信息提供者轉變為主動的任務執行者。”胡堃說。

在生產端,面對每日上萬個訂單,海康威視的計劃智能體可快速下達生產計劃和物料需求計劃,實現訂單24小時快速響應﹔其工藝智能體可自動推薦最優工藝,提升工藝設計效率。“大模型光有聰明的‘大腦’是不夠的,從感知認知走向決策執行,智能體正成為大模型產品落地的重要應用形態。”張家俊說。

在科研和工業領域,智能體帶來的變革同樣深刻。例如,為改變材料研發“大海撈針”式的局面,中國科學院基於磐石大模型構建的材料逆向設計系統智能體,已成功從2000萬種新型析氫反應合金催化材料候選配方中,快速鎖定13種高性能材料,並將原本需耗時數月的材料設計周期縮短至30分鐘。

提供更好交互體驗

“今天,用戶早已不滿足於簡單的文字對話或文本生成,下一代大模型不僅可以理解文本、圖像、視頻、聲音等多模態信息,還可理解現實世界的因果關系。”劉德兵說,當它具備了多模態理解能力和因果推理能力,就可以感知環境變化並主動調整行為,為用戶提供更自然、直觀和沉浸式的交互體驗。

劉德兵介紹,通用人工智能可分為L1預訓練大模型、L2對齊與推理、L3自我學習、L4自我認知、L5意識智能5個等級。未來3年到5年,大模型領域的突破將主要圍繞如何實現通用人工智能從L3自我學習向L4自我認知推進。最值得關注的是“沉思級”推理的實現,即模型能夠自主分析復雜問題、生成優化方案,並在決策中進行自我批評和反思,而不再完全依賴人類輸入。

這需要堅實的技術支撐。張家俊表示,除了當前備受關注的推理能力、智能體外,大模型還在朝著多模態、后訓練、通專融合(通用能力與專業能力融合)、代碼生成等技術方向演進。

其中,多模態旨在讓模型從底層架構上學會同時理解和生成文本、音頻、圖像、視頻以及其他模態信息﹔后訓練旨在通過投入更多后訓練資源,突破模型推理能力的上限﹔通專融合旨在充分利用超大模型的超強通用能力與領域模型的高效專業能力﹔代碼生成既可提升軟件研發等任務的效率,也是模型推理能力和智能體能力躍升的關鍵因素。

科技創新的落腳點是滿足人民對美好生活的向往。胡堃表示,要關注大模型的安全可解釋性、隱私保護,以及社會接受度。“在不久的將來,大模型將進一步成為人類可靠的智能伙伴。”劉德兵說。

(責編:郝帥、陳鍵)
關注公眾號:人民網財經關注公眾號:人民網財經

分享讓更多人看到

推薦閱讀
返回頂部