人工智能大模型應用落地 算力需求該如何滿足?

在算力基礎設施高質量發展2025年目標時間表的大政策背景下,我國生成式人工智能(AIGC)服務和大模型產業生態發展現狀如何?通用大模型和行業大模型產業發展的核心競爭力到底是什麼?在產業數字化進程中,國產大模型的“千模大戰”狀態會持續多久?
想要回答上述問題,我們可以從剛剛在遼寧沈陽閉幕的中國計算機大會(CNCC2023)上尋找答案。作為中國計算機學會主辦的計算機領域級別高、規模大的高端學術會議,CNCC今年以“發展數字基礎設施,支撐數字中國建設”為主題,在130個技術論壇和20余場專題活動中,有近30場活動都對近來火熱的人工智能與大模型做了深層次解析。記者在同期舉辦的“超智融合AI大模型應用落地發展,高效計算新范式”專題論壇中,找到了一些可以回答這些問題的觀點和建議。
算力、算法、數據——AIGC技術發展與安全並重
“無算力、不模型”。自生成式人工智能服務(AIGC)和GPT大模型訓練爆火后,圍繞算力、算法和數據相關的討論此起彼伏,中文語境下的國產大模型應用更是呈現出“千模大戰”的狀態。
今年,我國先后出台了《生成式人工智能服務管理暫行辦法》和《算力基礎設施高質量發展行動計劃》,對AIGC技術與產業發展背后的算力基礎設施做了詳細規劃。其中,《行動計劃》從計算力、運載力、存儲力以及應用賦能四個方面提出了到2025年算力基礎設施發展的量化指標,計算力方面,算力規模超過300EFLOPS,智能算力佔比達到35%﹔存儲力方面,存儲總量超過1800EB,先進存儲容量佔比達到30%以上。
智能算力是上述專題活動探討的主題。圍繞人工智能大模型算法優化以及應用落地過程中面臨的現實問題,來自中國科學院、中國信息通信研究院、中國人民大學、北京超級雲計算中心等產學研用機構的嘉賓共同討論了技術應用、人才培養、行業創新、內容安全等焦點話題。
“人工智能大模型在業務訓練過程中從推理、問答、檢測到描述,重點在於解決連續性問題。”中國人民大學高瓴人工智能學院教授、博導盧志武表示,通用大模型在文本、圖片、音視頻等多模態內容生成能力上還存在許多需要解決的問題,“從多圖理解、物體定位、OCR等業務功能上,多模態大模型對於任務預訓練和數據指令微調等都需要完善升級,在應用場景落地時,如何通過大模型訓練去解決用戶的多元化復雜需求非常重要。”
“數據對於大模型的訓練和應用來說是至關重要的,現在大模型需要的數據是用哪些數據和指令集類型來讓大模型具備什麼樣的能力。本質上它是一個多樣性和覆蓋面的研究性問題,這與記憶學習和深度學習的數據有所區別。”中國科學院自動化所副研究員孔慶超認為,人工智能大模型在國內的發展仍需要投入研發力量,行業大模型在不同行業的應用探索是否一定會產生成果,這就需要通過大量的算法去做邏輯推理,例如,金融行業大模型是否有更多算法來支持生成投資決策參考意見,這樣的大模型是否具備迭代和學習等能力,都需要做充足的預訓練和技術研發。
專家指出,數據、算法和算力是新型信息基礎設施的重要組成部分,算力基礎設施呈現多元泛在、智能敏捷、安全可靠、綠色低碳等特征,對於助推產業轉型升級、賦能科技創新進步等具有重要意義。在生成式人工智能技術方面,打造並完善算力、數據和算法三位一體的協同應用生態,通用大模型和行業大模型都在做應用“減法”,讓大模型從“玩具”到“工具”轉變。讓技術落地、讓成果產生價值、讓服務匹配業務,這或許就是人們正在討論的大模型未來生態。
中國科學院計算機網絡信息中心人工智能部副主任王玨認為,國產大模型在應用落地和業務適配方面,關鍵在於數據清洗。“我們也在嘗試各種模型,無論是准確度還是計算效率,面臨的挑戰就是國產開源大模型的穩定性,這方面我們做了很多工作,通過文獻數據促進各學科科研發展。同時,讓國產大模型好用也是我們的研究方向。”
“人工智能、大數據、雲計算等新一代信息技術加速了大模型的發展。通用或行業大模型研究訓練離不開大量的算力支撐。”並行科技董事長陳健博士認為,從產業發展的角度來看,算力是工業產品,行業大模型訓練對於算力的需求需要找准方向才好發力。
技術、應用、生態——提升大模型准確率與效率
大模型應用對於高頻次的算力資源需求,往往與大模型升級迭代的多元場景應用能力建設息息相關。當前、中文語境下的大模型生態還面臨哪些問題,交叉學科人才培養合作機制和產業鏈上下游能為大模型帶來哪些深層次變革?在接受記者提問時,多位嘉賓也談到了目前大模型所提供服務過程中亟待解決的一些行業性問題。
早期AIGC技術的發展,從各個鏈條和語義理解上產生了大量的大模型內容生成的“幻覺”問題,即“一本正經的胡說八道”。在中國信息通信研究院融創中心主任田輝看來,新興技術的行業應用一定是需要產學研用結合才能健康的狀態,“AIGC技術的分工角色更細,產業應用的開發、部署和應用都是需要產業鏈共同合作。如大模型的二次開發,迭代升級、運維服務等領域的人才培養機制,都需要細分與合作。”
AIGC技術產業進入“千模大戰”狀態后,最終我們所依靠的核心競爭力是什麼?業內人士認為,AIGC技術產業的發展方向或路徑是從人工智能技術升級方面,提升大模型的理解、生成、邏輯推理和記憶等核心基礎能力﹔在場景應用落地方面,強化大模型的學習能力,提升生成服務准確率和效率﹔在行業生態建設方面,提升大模型的智能化水平和生態應用空間,打造成為輔助決策的實操性工具。
“北京超級雲計算中心採用超算架構模式構建智能算力資源,將分布在國內的各大算力中心資源進行整合,可以最大限度地利用現有資源,降低因空閑資源浪費而產生的損失。同時也可以有效滿足人工智能大模型訓練對算力的高頻次需求。”北京超級雲計算中心吳迪介紹說,以超級計算機為代表的超算架構能夠提供更加全面高效的並行計算能力,為大模型訓練處理提供算力服務支持,實現更高效的模型訓練以及更好的預測准確度。
王玨表示,行業大模型的發展離開算力就會拉大行業差距。“讓算力資源能更好地去跑這些大模型,保持其精度或者泛化能力不變,提升大模型訓練的速度和效率,能夠真正並盡快在大模型訓練上實現全棧國產化,這是研究的熱點。”
“希望大模型的行業應用發展看到有百花齊放的生態,但需要關注的是低水平重復工作的問題。無論是數量還是類型,大模型的產品或商業形態還有很多探索空間。”田輝認為,AIGC技術的發展最終的落地在於內容服務。“如何提升准確率和效率,誰的平台投入的力量足夠,大模型訓練的速度和效率,以及應用適配更強,誰就能突破成功。”

分享讓更多人看到
- 評論
- 關注