AI為藥物研發按下“快進鍵”
不久前,國家衛生健康委、國家中醫藥局、國家疾控局聯合發布《衛生健康行業人工智能應用場景參考指引》,列出藥物研發等84種具體應用場景,為人工智能(AI)技術賦能藥物研發按下了“快進鍵”。
長期以來,在藥物研發行業存在一個著名的“雙十”魔咒,即新藥研發需要花費10年時間、10億美元。如何打破這一魔咒,AI被寄予厚望。在日前召開的學術會議上,中國科學院院士陳凱先表示,AI將為半導體行業帶來5550億美元的價值,而為制藥行業帶來的價值可達1.2萬億美元。
近年來,生成式AI在垂直產業持續發力。它給新藥創制帶來什麼?記者了解到,一系列AI技術的應用和平台建設正不斷提高藥物研發效率,人工智能技術或將引發醫藥產業的顛覆性變革。
提升研發效率
在藥物研發全鏈條發揮作用
2023年底,困擾業界60年的新抗生素發現難題被AI破題。《自然》雜志刊文講述了科學家運用AI技術首次發現抗耐甲氧西林金黃色葡萄球菌(MRSA)的新抗生素的歷程。
以3.9萬種化合物對MRSA的抗菌活性數據作為訓練“腳本”,麻省理工學院研究團隊獲得了抗菌能力的評估預測模型。隨后以3個深度學習模型為基礎,團隊又“塑造”出化合物人類細胞毒性的“鑒定師”,對1200萬種化合物進行“篩選”,最終獲得能對抗MRSA又對人體安全的化合物。
這樣的實驗,僅靠人力幾乎難以完成。然而,AI憑借“硬核”實力,大大縮短了對每一個分子進行評價和驗証的時間。
以往,針對靶點設計藥物的成功率非常低。數據顯示,即便是《細胞》《自然》等權威期刊上報道過的原始靶點,其成藥幾率也小於10%。
靶點有了,為什麼設計藥物還是難?以小分子化學藥物為例,依據“鑰匙開鎖”的原理,針對靶點設計化合物,化合物庫中的備選分子多達成百上千種,篩選耗時耗力。
“新藥研究實踐表明,要在老靶點上尋找更好的新藥越來越不容易。”陳凱先說,與此同時,新靶點發現難度也越來越大,需要新思路新技術“破局”。
而人工智能在新靶點的發現和預測方面能為人類提供前所未有的幫助。
陳凱先介紹,國外研究數據顯示,人工智能技術應用可以使藥物設計時間縮短70%、藥物設計成功率提升10倍。
“理論上AI可以對藥物研發的全鏈條發揮作用。”陳凱先告訴記者,在新藥研發的整個鏈條中,一個新靶點的發現往往會帶動一批新藥產生,推動臨床治療的突破。
“我國尤其需要抓住AI助力醫藥原創發展的機遇期。”陳凱先表示,相關數據顯示,過去十幾年,我國每年發現的潛在藥物靶標數量始終徘徊在6個以下,我國新藥研究仍以追趕、跟隨為主。
近年來,人工智能技術正成為發現新靶點的利器。例如,中國科學院上海藥物研究所鄭明月等研究團隊發展“臉譜識別”新算法,通過提取化學結構特征、基因變化特征、藥物活性特征來關聯比對查明新靶點。這一技術成功用於尋找抗腫瘤老藥甲氨蝶呤的免疫靶點。
AI在從文獻知識中發現新靶點方面也頗有優勢。陳凱先表示,過往基礎和臨床研究積累了大量數據,這些發現“互不關聯”地分散存儲在研究文獻中,它們之間的潛在關聯難以被人類發現。人工智能具有強大、高效的學習分析能力,能夠將散布在大量文獻中的關聯關系挖掘出來,推動新機制、新靶點的識別。
“盡管我國現在還沒有AI輔助研發的新藥獲批上市,但已經有不少新藥在AI協助下快速進入臨床試驗階段。”陳凱先說。
降低研發成本
藥物試驗費用不再高昂
2024年年底,斯坦福大學等研究團隊在《細胞》雜志發文稱,多尺度、多模態的大型神經網絡模型已經具備表示和模擬分子、細胞和組織在不同狀態下行為的能力。在此基礎上,AI虛擬細胞有了高保真模擬、加速發現、指導研究的可信性。
此前,《美國國家科學院院刊》發文稱,研究者用硅基“病人”替代生命形式的碳基“病人”,模擬結果與真實數據高度一致。
研究中,1635個“活在電腦裡”的“虛擬病人”,患上了乳腺癌且癌細胞已發生轉移。通過試驗,研究者找到了生物標志物指導乳腺癌臨床治療的優化路徑。
基於體外、體內、臨床、人群水平和多組學等數據,研究者對患者的藥物反應進行“數字孿生”,生成“虛擬病人”豐富的藥效藥理數據,用於生物標記物、藥物等方面的測試。
“人類對生命活動的想象和思考,能夠以數據的方式傳遞給算力,這是實現虛擬生命或細胞的基礎。”北京大學未來技術學院副院長席建忠告訴科技日報記者,在半個世紀的發展歷程中,分子生物學通過不同層面的組學數據“解讀”生命,如基因組學、蛋白組學、轉錄組學等,積累了大量生命科學數據。
隨著技術融合發展,人類的數據獲取能力越來越強。“光學成像技術現在已達到納米級別,可以看到細胞中的細胞器動態‘錄像’。”席建忠說,大量新數據、新研究衍生出成像組學等新學科。這些突破在深入解讀生命的同時,也成為數字生命的基礎。
事實上,我國科研團隊已在基礎設施、科研課題等方面早有布局。例如在北京懷柔,耗資數十億元的多模態跨尺度生物醫學成像設施已初具規模,細胞成像樓、醫學成像樓、全尺度整合中心等組成具有硬實力的科技“航母”,其中,全尺度數據處理中心將為相關研究提供強大算力支持。
“不同團隊正在開展一些關鍵器官數字化的工作。我們希望實現腫瘤細胞數字化。”席建忠表示,腫瘤具有高度異質性和動態性,人人不同、時時在變,有效的藥物篩選十分困難。
“虛擬腫瘤細胞能夠告訴我們,在某一藥物作用下,細胞內部信號通路如何變化。”席建忠說,要實現這樣的目標,需要基於現有數據和基礎模型進行腫瘤細胞“雛形”的構建,然后對其進行訓練。
“現實生活中,要進行藥物試驗。如果一位患者吃一種藥,幾千種藥至少需要幾千位患者來試驗。這樣一來,實施困難、成本高。”席建忠說,虛擬細胞在一套模型中可以同時“吃”幾千種藥,獲得幾千套數據,實現高通量和高保真,將極大提升腫瘤藥物的篩選效率。
生成式人工智能最令研究者著迷的是它的“出其不意”。席建忠表示,在科學探索方面,AI能夠打破不同領域的邊界限制。例如,對心血管、傳染病的交叉研究,可能會發現抗病毒藥物具有降血壓潛力之類的“驚喜”。
縮短研發周期
啃下罕見病藥物研發“硬骨頭”
在藥物研發領域,罕見病藥物研發是塊難啃的“硬骨頭”。正因為如此,藥物審評審批為它專門開設了“孤兒藥”綠色通道。
4年到5年,這是當前罕見病診斷的平均耗費周期。患者少形成了“無米之炊”的困局——罕見病難以“被看見”,臨床試驗病例數少是罕見病藥物研發的難題之一。
現代醫學發展至今,為什麼確診一個病還要耗時這麼久?
“罕見病並不會帶著‘銘牌’而來。”華大基因AI專項負責人梁倫綱告訴記者,它會被當作一種常見病,如孩子發育明顯落后同齡人時,往往會問診營養科。
“罕見病診斷面臨症狀、基因變異兩端都‘開放’的問題,而確診是要通過各種方法實現兩端‘收斂’,最終得到匹配的‘連線’。”梁倫綱說,患者經過各種試錯仍無法找到病因后,才有可能被確診患有罕見病。如今當人工智能邁入生成式大模型階段,能夠回答各種開放式問題之后,罕見病診斷有望跳過“試錯”階段。
日前,北京協和醫院院長張抒揚在國家衛生健康委醫藥領域科技創新發布會上介紹,首個罕見病人工智能大模型GeneT上線,協助基層醫生做罕見病的診療。
從回答“是”或“否”的判斷題,到能夠解答“這是什麼,為什麼”的復雜問答題,AI提升了罕見病的診斷能力。
“和其他應用領域一樣,AI先是快速掌握罕見病領域的專業知識。”梁倫綱介紹,公開罕見病數據集和文獻,以及華大在檢測服務中的數據都會轉化為AI的“知識”。最重要的是,華大基因與北京協和醫院開展合作,及時應用罕見病臨床診療中的一線經驗,讓AI具備臨床“經驗”。
“我們不僅給AI輸入了罕見病的海量知識,還教會它如何像遺傳專家一樣思考。”梁倫綱介紹,華大基因通過將專家的思考過程轉化為AI能理解的語言,讓新模型GeneT學會精准篩選導致罕見病的基因變異,效率提升20倍,且在模擬和真實病例中的准確率分別達到99%和98%。
梁倫綱表示,目前GeneT在完成初步分析后,最終確診還需要專家把關。
資料顯示,在人工智能大模型的助力下,罕見病患者的確診時間有望從數年縮短到4周以內,這使得絕大部分罕見病無特效藥的“冰山”開始鬆動。
數據顯示,我國2017—2022年期間的在研罕見病藥物數量大幅增加,年均增長率達34%。然而,《中國臨床藥學雜志》的一項研究顯示,約43.9%罕見病藥物臨床試驗實際入組人數小於目標入組人數。
在國家罕見病登記系統的支持下,罕見病臨床隊列相繼建立,以推動相關領域藥物研發。“這讓罕見病患者得到早診斷。”梁倫綱表示,罕見病“被看見”,將緩解罕見病藥物研發臨床隊列稀缺的問題,為罕見病藥物研發提供有力支撐。
專家認為,未來3—5年,我國將進入AI藥物研發快速發展階段,人工智能技術將肩負起分子優化、合成路線設計以及自動生成、自動分析、自動篩選的全流程研究工作。
“我們期待第一個AI設計研發的藥物能夠盡快獲批上市。成果轉化和落地應用仍舊是醫藥產業實現高質量發展的‘命門’。”席建忠說。
【深瞳工作室出品】
採寫:本報記者 張佳星
策劃:劉 恕 李 坤
分享讓更多人看到
- 評論
- 關注