AI遇上化學:“不可能”變為“可能”
中國科學技術大學一名博士研究生在實驗室調試機器化學家系統“小來”。新華社記者 張端攝
8天完成688次化學實驗,7天研究1000種催化配方……人類夜以繼日多年才能完成的工作,人工智能(AI)在短時間內就能完成。
“AI從一個研究領域變成了一類賦能技術。”在12月9日至10日召開的香山科學會議第768次學術討論會上,中國科學院院士白春禮說,在化學領域,得益於AI的應用,化學反應預測與新化學物質的發現、化學試驗的自動化與智能化等方面均取得了顯著突破。
AI將如何改變化學研究?如何進一步推進AI與化學的深度融合?這些問題引發與會專家學者熱議。
2個月內完成2000年的工作
AI讓枯燥、危險、重復的化學實驗來了個“大變身”:機器人自動操作化學合成平台,甚至具備觀察、分析實驗結果的能力。
中國科學技術大學研發的機器化學家系統“小來”,可以完成文獻讀取、合成、表征、性能測試、機器學習模型建立和優化等全流程任務。中國科學技術大學教授羅毅介紹,通過運用“小來”系統,團隊加速了新材料的發現過程,2個月內就完成了需要驗証2000年才能完成的復雜優化工作,利用火星隕石制備出實用的產氧電催化劑。
面向“遠方”,AI能幫助人類探索出一條在地球外星系就地取材研制化學品的新路﹔聚焦“眼前”,有研究單位僅用一年時間,便利用高精准的預訓練模型,從6000萬個有機小分子的結構中篩選出符合冷卻液不同性質和要求的目標分子,並成功完成這些分子的合成及實際產品的測試工作。
“科學研究的基本工具來自理論、實驗和科學文獻三方面。受工具的限制,過去的化學研究採取依賴經驗和不斷試錯的方法,組織形式也往往是作坊模式。”中國科學院院士鄂維南說,AI將助力打造有效的理論、實驗和文獻工具平台,使科學研究邁向平台化模式。
中國科學院院士張錦也認為,利用AI、大數據、虛擬現實等工具,人類能夠擴展思維,提升理解力,不斷突破認知邊界。通過構建覆蓋研發全流程的一系列智能體來彌補短板,可以讓科學家有工程思維、工程師有產品思維,打破實驗室研究與產業化要求難以匹配的困境。
高效表達復雜微觀世界
微觀層面,AI在化學研究中的優勢進一步顯現。電子自旋、電荷密度、分子勢能等與化學性質息息相關的參數,都變得可預測、可求解。
阿爾法折疊3這種模型為什麼能准確預測蛋白質、DNA、RNA、配體等生命分子的結構及相互作用?白春禮介紹,它通過分析大量的輸入和輸出數據尋找規律,掌握分子間相互作用的力、角度等參數,再模擬出現實情況,預測可能的情況。
從讀懂現象到摸清規律、再到高效表達復雜的微觀世界,AI在化學領域讓“不可能”的探索成為“可能”。
“在化學動力學理論研究方面,AI展現了巨大潛力。”中國科學院院士張東輝說,化學理論中的分子體系勢能面構造存在“指數牆”困難,即計算量會隨分子體系中原子個數增長而呈指數級增長。AI神經網絡能高效表達復雜的高維函數,解決了這個難題。借助AI,團隊解決了包含十幾個原子的分子體系高精度勢能面構造問題。
張東輝介紹,近年來,神經網絡在求解電子運動薛定諤方程的基態波函數方面也取得了重要進展。在不存在費米共振的情況下,團隊僅使用15000個參數,就能精確求解丙烷分子(包含11個原子)的振動能量。而這在此前被認為是難以求解的。
針對求解多電子薛定諤方程這一量子化學領域的核心問題,AI提供的新范式有望突破計算消耗隨體系擴大呈指數級增長的瓶頸。中國科學院院士楊金龍介紹,基於生成式AI的“乾坤網絡”(QiankunNet)可實現多電子薛定諤方程的直接求解。“化整為零、分而治之”的策略,使較復雜材料體系的計算從“不可能”逐步走向“可能”和“精准”。
模型建構需“垂直發力”
“化學是唯一能夠獲得穩定新物質的科學。”白春禮說,AI將為發現更多前所未有的反應類型與合成方法帶來無限可能。
然而,要擔負起“從0到1”的創新任務,AI仍面臨巨大挑戰。
一方面是化學數據的質量與可用性問題。“化學研究數據類型復雜且高度多樣化,涵蓋分子表征、光譜圖像、實驗記錄等多模態數據。”中國科學院自動化研究所所長徐波解釋,現有模型往往難以高效表征、難以整合不同模態數據裡的信息。化學研究還需AI具備更高階的推理能力,以完成化學反應預測、分子逆向設計、多步合成路徑規劃等任務。
另一方面是AI化學知識儲備問題。現有算法多為“黑箱式”模型,融入的化學知識不夠。換句話說,要拿下“化學博士學位”,AI還需“垂直發力”。徐波說,當前許多AI系統主要依賴數據驅動的方法,與不同領域知識結合程度不足。為解決這個問題,AI領域學者與化學學者正在進行跨領域合作,為化學領域開發專用算法和模型,發展各類科學化學語言表征等基本能力,以構建更強大的模型。
中國科學院院士、南京大學黨委書記譚鐵牛認為,應在基座大模型的基礎上,著力建構以知識和數據雙驅動的多任務多目標垂直模型。
白春禮也認為,加快AI和自動化實驗的深度融合,亟需構建高質量、開放共享的化學基礎數據庫,並考慮數據安全管理等因素。他建議,應建立自主可控、開放共享的基礎大模型,開發針對化學復雜問題的專用AI算法等,進一步加強學科交叉並重視AI化學領域的人才培養,加快建設AI化學生態平台。
分享讓更多人看到
- 評論
- 關注