“AI管家”時代加速到來
222
點擊播報本文,約
過去一年,你可能已經被能寫詩、會聊天的AI大模型刷屏了。那些“聰明”的AI,是從互聯網上海量的文字、圖像中“學”出來的。但如果你想讓一個機器人學會“收拾房間”或“端茶倒水”,這條捷徑就走不通了——你總不能讓它在現實世界裡砸壞無數個杯子、碰倒無數件家具來學習吧?
這正是今天機器人(具身智能)發展的最大瓶頸:沒有足夠又好又便宜的“學習資料”——數據。
1月20日,跨維智能公司正式開源了一款名為EmbodiChain的“智能生產線”,它有望徹底解決這個難題。簡單來說,它的核心理念是:既然現實世界的數據這麼難獲取,那我們就在電腦裡,為機器人搭建一個無限逼真的“虛擬世界”來學習。
傳統訓練機器人,需要工程師用真機反復演示、採集海量視頻和動作數據,耗時數月,成本極高,還容易過擬合(是指機器學習或統計模型中,模型在訓練數據上表現過於優秀如,准確率高,但在新數據測試集或實際應用上表現顯著下降的現象)到特定的燈光、桌布等無關細節上。
EmbodiChain的做法完全不同。在電腦裡造世界,你隻需給它一張真實桌子的照片,或直接告訴它“生成一個廚房”,它就能在3D仿真引擎裡,自動構建出一個物理規則逼真的虛擬場景。物體可以摔碎,水可以傾倒,一切都遵循物理定律﹔機器人的虛擬化身在這個世界裡可以7×24小時不間斷地訓練,嘗試抓取、擺放等各種操作。失敗了沒關系,系統會自動分析原因,生成糾正動作,形成“犯錯-學習”的完美閉環﹔在虛擬世界裡,系統可以給機器人提供真實世界沒有的“上帝視角”信息,比如,物體的精確輪廓、距離、能不能被抓握(可供性)。這迫使機器人理解物體的物理本質,而不是隻記住像素圖案,學到的本領更加扎實可靠。
最令人驚訝的是其訓練效果,完全使用100%虛擬數據訓練出一個視覺語言動作模型,然后直接部署到真實機器人上。結果,這個“純虛擬畢業生”在完成如“把蘋果放進碗裡”等真實任務時,成功率顯著超過了那些用大量真實數據訓練出來的主流方法。即使更換桌布、移動物品位置制造干擾,它依然穩健可靠。這証明,高質量的仿真數據不僅能用了,甚至可能因為避免了真實噪聲的干擾而表現更好。
這裡需要特別區分,Sora生成的是連續的像素畫面,而EmbodiChain構建的是可交互、可計算、物理精確的3D仿真環境。機器人是在一個真正能交互的數字宇宙裡學習物理規律和動作技能,確保學到的策略能無縫遷移到現實。
EmbodiChain全面開源,是希望把它打造成具身智能領域的基礎設施,像水電煤一樣供所有研究者和開發者使用。對研究者,從此告別耗時費力的數據採集與清洗,將精力專注於算法與創新﹔對行業,大幅降低機器人訓練的成本與門檻,加速服務機器人、工業自動化等應用的落地進程。
展望未來,我們或許可以期待:那個曾經科幻的“AI管家”時代,正因技術底座的革新而加速到來。
關注公眾號:人民網財經
分享讓更多人看到
- 評論
- 關注































微信掃一掃


第一時間為您推送權威資訊
報道全球 傳播中國
關注人民網,傳播正能量