生數科技發布通用世界模型戰略 加速物理AI布局
222
訂閱已訂閱已收藏
收藏點擊播報本文,約
近日,由北京市海澱區人民政府與北京國有資本運營管理有限公司聯合主辦的2026中關村論壇年會“人工智能主題日”特色主題論壇“AI未來論壇:躍遷·投資·共生”在中關村國際創新中心成功舉辦。論壇匯聚全球頂級投資人、產業領袖與前沿創新者,圍繞人工智能從技術突破邁向產業價值的關鍵路徑展開深入探討。
在“前沿Tech Show”環節,北京生數科技有限公司(以下簡稱“生數科技”)創始人、清華大學人工智能研究院副院長朱軍教授發表題為《通用世界模型:連接數字世界與物理世界的橋梁》的主題演講,系統闡述了生數科技在通用世界模型方向的戰略布局與技術路徑。
通用世界模型戰略布局越發清晰
在長期的視頻大模型的技術積累上,生數科技逐步構建起一條清晰的通用世界模型的戰略布局:以基座世界模型為核心底層,向上延展出貫通數字空間與物理空間的雙軌體系,形成面向通用智能的核心基礎架構。
在底層能力上,該基座世界模型基於全球首創的U-ViT架構,積累視覺、聽覺、觸覺等多模態信息,構建對世界的統一認知與建模能力,為上層應用提供統一的智能底座。
在數字空間,生數科技基於世界生成模型(WGM)打造視頻大模型產品Vidu。Vidu生成模型聚焦單時點模擬世界,賦能AI在數字世界的生產力。流式生成模型,聚焦多時點模擬世界,實現實時陪伴和交互。Vidu顯著提升了數字內容的生產效率,最終實現數字世界的AGI。
在物理空間,生數科技基於世界行動模型(WAM)構建統一世界模型產品Motus。Motus作為真實世界具身智能的“大腦”,致力於解決傳統具身智能鏈路割裂、數據稀缺、泛化能力弱等核心痛點,可實現真實世界下的零樣本泛化與跨本體適配,推動機器人從“模塊化執行”向“統一智能體”躍遷,最終實現物理世界的AGI。
由此,生數科技構建起貫通理解世界、生成世界與行動於世界的完整技術閉環,使通用世界模型真正成為連接數字世界與物理世界的橋梁。
通用世界模型正成為通向AGI的重要方向
而當前的AI系統,雖然在單點能力上取得了突破,但整體上仍然是“割裂”的。有的擅長生成,有的擅長理解,有的用於執行,但很少有系統能夠統一完成這三件事。如果機器要真正具備智能,就必須具備類似人類的世界模型能力。
在此基礎上,朱軍指出,通用世界模型正在成為通向AGI的重要方向。
長期以來,具身智能面臨“數據牆”:真實世界的軌跡數據成本高、規模小,難以支撐模型泛化。對此,朱軍提出一個關鍵判斷:視頻,是當前最接近真實世界的數據形態。
基於這一判斷,生數科技構建了以視頻為核心的數據體系——從海量互聯網視頻,到第一視角操作視頻,再到機器人數據,形成一個可擴展的數據金字塔。在這一體系下,即使缺乏大量標注數據,模型依然能夠學習到有效的行動能力。
業內人士認為,在數據利用與規模擴展方面,Motus展現出顯著優勢。在數據規模擴展實驗中,相較國際領先的VLA模型Pi0.5,Motus能夠從更廣泛的異構數據中學習,並有效融合預訓練基座模型中的多模態先驗能力。在長程、多步驟的復雜真機任務中,Motus進一步呈現出接近人類水平的決策邏輯與執行穩定性。
面向未來,生數科技將繼續堅持以原創技術為底座,圍繞通用世界模型持續推進底層架構、數據體系與應用場景的協同突破。
從視頻模型到世界模型,從數字空間到物理空間,生數科技正在探索一條更完整的通用智能路徑。隨著相關技術持續演進,通用世界模型也將加快走向真實產業場景,釋放更大的技術價值與應用潛力。(記者 賈麗)
關注公眾號:人民網財經
分享讓更多人看到
- 評論
- 關注































微信掃一掃


第一時間為您推送權威資訊
報道全球 傳播中國
關注人民網,傳播正能量