人民網
人民網>>經濟·科技

中國AI新突破:在奧數幾何領域實現“自主出題”

2026年01月28日10:16 | 來源:人民網222
訂閱已訂閱已收藏收藏小字號

點擊播報本文,約

人民網北京1月28日電 (記者趙竹青)1月26日,由北京通用人工智能研究院(BIGAI)、北京大學心理與認知科學學院、北京大學智能學院、北京大學人工智能研究院以及北京大學武漢人工智能研究院聯合組成的科研團隊,研發出的“基於引導樹搜索的奧數幾何問題提出與解答系統”,成果發表於國際學術期刊《自然·機器智能》。

團隊開發的“通矩模型”(TongGeometry)是全球首個同時具備自主出題和自動解題雙重能力的通用人工智能系統。這一研究成果標志著中國科研團隊在自動化推理的邏輯核心領域實現關鍵技術自研,為人工智能輔助數學研究及AI輔助教育邁出了堅實一步。

長期以來,奧林匹克數學競賽被視為人工智能邏輯推理能力的“試金石”。2024年初,DeepMind開發的AlphaGeometry曾引起全球轟動,展示了AI在解題方面的巨大潛力。然而,AlphaGeometry本質上是一個“被動解題者”,其訓練極度依賴於大規模的合成數據和昂貴的計算資源。與之相比,我國科研團隊自主研發的“通矩模型”不僅是一個能夠滿分交卷的“優等生”,更是一位能夠創造優美、新穎題目的“出題名師”。

論文第一作者、北京通用人工智能研究院張馳博士介紹:“我們在研究中發現了一個深刻的對偶性。當一個幾何命題的証明難度顯著高於其構建復雜度時,它便具備了作為奧賽題目的‘審美價值’。通過這種對偶關系的建模,‘通矩模型’能夠從浩如煙海的空間組合中,精准捕捉到那些具備人類數學家審美標准的高質量題目。這在國際上尚屬首次,實現了從‘模仿解題’到‘自主創造’的范式轉變。”

在具體性能上,“通矩模型”也展現了顯著的效率優勢。相比AlphaGeometry需要龐大的算力集群,“通矩模型”僅需單張消費級顯卡(如RTX 4090)即可在最多38分鐘內,解決近25年所有的國際數學奧林匹克(IMO)幾何難題,其推理效率和准確率均達到世界頂尖水平。此外,該系統通過創新的“規范化表示”技術,將搜索空間壓縮了幾個數量級,有效解決了傳統方法中的路徑爆炸問題。

目前,“通矩模型”的原創能力已得到實際驗証與認可。系統自主生成的3道幾何新題,已正式入選2024年全國中學生數學聯賽(北京賽區)及美國精英奧賽(Ersatz Math Olympiad),這是AI原創題目首次進入高規格人類數學競賽。

“‘通矩模型’的意義遠超數學競賽本身。”論文共同通訊作者、北京大學心理與認知科學學院助理教授朱毅鑫表示,“它通過‘小數據、大任務’的范式轉換,証明了人工智能可以不再單純依賴暴力計算,而是通過理解邏輯底層的對稱性與美感,實現自主的科學發現。這對於未來具身智能在復雜環境下的邏輯決策、自動化定理証明以及個性化教育,都具有深遠的戰略價值。”

(責編:趙竹青、呂騫)
關注公眾號:人民網財經關注公眾號:人民網財經

分享讓更多人看到

推薦閱讀
中國AI新突破:在奧數幾何領域實現“自主出題”
  人民網北京1月28日電 (記者趙竹青)1月26日,由北京通用人工智能研究院(BIGAI)、北京大學心理與認知科學學院、北京大學智能學院、北京大學人工智能研究院以及北京大學武漢人工智能研究院聯合組成的科研團隊,研發出的“基於引導樹搜索的奧數幾何問題提出與解答系統”,成果發表於國際學術期刊《自然·機器智能》。 團隊開發的“通矩模型”(TongGeometry)是全球首個同時具備自主出題和自動解題雙重能力的通用人工智能系統。…
市場監管總局批復同意長三角地區開展醫療器械廣告跨區域審查試點
  人民網北京1月28日電 (記者郝帥)據市場監管總局網站消息,為縱深推進全國統一大市場建設,推動長三角市場監管一體化發展,近日,市場監管總局批復同意上海市、江蘇省、浙江省、安徽省市場監管局在長三角地區開展醫療器械廣告跨區域審查試點工作。 試點工作聚焦醫療器械廣告審查中的堵點問題,通過創新審批模式,對符合條件的醫療器械廣告審查申請,在長三角地區實行“一次申請、一地審查、一號核發”,從“小切口”入手,通過務實舉措,切實降低廣告申請人辦事成本,持續優化營商環境,提高服務企業效能,為改革完善廣告審查管理制度探索積累可復制、可推廣的經驗。…
推薦閱讀
返回頂部