我們究竟需要什麼樣的大模型?
大模型展現出的通用智能能力具有重要的現實意義和影響力,是人工智能發展中裡程碑式的進展。大模型帶來的智能革命,將媲美工業革命和電力革命,深刻改變人類社會的生產生活方式。大模型,或許正是開啟智能時代的那一台“蒸汽機”。
要問今年最熱的科技熱點是什麼,許多人會脫口而出——大模型。從年初ChatGPT引發的大模型浪潮,到相關科技企業上線自家大模型產品,“百模大戰”不斷升級,它所引發的人工智能“地震”還在持續。
進入9月,國內科技廠商在大模型領域動作頻頻。9月初,此前一直處於內測階段的多款大模型產品完成備案,正式上線,面向公眾開放。9月21日,在華為全聯接大會2023上,因在眾多領域展示了大模型發展的更多可能,盤古大模型成為當之無愧的主角。
“百模大戰”也好,“群模起舞”也罷,技術進步和創新噴涌的熱潮中,人們關注的焦點集中於,我們究竟需要什麼樣的大模型?何種大模型是通向人工智能的最終答案?
智能時代的“蒸汽機”
現在到底有多少個大模型產品?似乎沒有人能給出准確的答案。
賽迪顧問發布的《2023大模型現狀調查報告》顯示,截至2023年7月底,國外累計發布大模型138個,中國則累計有130個大模型問世。
但這股浪潮的源頭很清楚,正是ChatGPT。
2022年末,由名不見經傳的人工智能公司Open AI打造的大語言模型ChatGPT橫空出世,人們可以使用最日常的語言與其對話,讓它回答各種問題、完成各類書面任務,聊天、畫圖、敲代碼……人們第一次如此近距離地感受到人工智能帶來的震撼,也讓“大模型”這個此前隻為少數人工智能領域從業者所知的專業概念,成為了被人們挂在嘴邊、反復提及的詞匯。
輸入內容、進行計算、產出結果,這是人工智能模型的本質,但大模型的與眾不同之處正在於其足夠“大”。
巨大的參數數量、龐大復雜的算法結構、海量的訓練數據以及強大的算力支撐,決定了大模型不同於普通的人工智能模型,其擁有強大的通用智能。
以ChatGPT為例,其早期3.0版本的參數數量已達到1750億個,4.0版本的參數量更是指數級增加,達到1.8萬億個,訓練數據的單位數量更是達到驚人的13萬億。相比之下,早期如圍棋機器人AlphaGo等專用人工智能模型,其參數量往往僅為百萬級,與大模型相去甚遠。
海量的參數、復雜的算法、強大的訓練能力,讓大模型成為具備橫跨多領域學習能力的通用人工智能,實現了所謂的“智能涌現”,即擁有觸類旁通、舉一反三的學習能力。如果說此前的人工智能模型還只是經過訓練后可以完成某些特殊任務的“馬戲團猴子”,那大模型則可以說已經是一個接受完義務教育的“中學畢業生”。
在北京智源人工智能研究院院長、北京大學計算機學院教授黃鐵軍看來,大模型展現出的通用智能能力具有重要的現實意義和影響力,是人工智能發展中裡程碑式的進展,放眼人類歷史、展望人類未來,大模型帶來的智能革命,將媲美工業革命和電力革命,深刻改變人類社會的生產生活方式。大模型,或許正是開啟智能時代的那一台“蒸汽機”。
哪條賽道通“羅馬”
ChatGPT引發的大模型熱潮讓許多科技巨頭坐不住了,紛紛將自家“壓箱底”的大模型成果公之於眾。
谷歌緊隨ChatGPT腳步,發布了基於自家大語言模型的聊天機器人“Bard”,互動媒體與服務公司Meta也不甘落后,發布了同類大模型“Llama”。國內同樣熱鬧非凡,3月份,百度率先發布研發十余年的知識增強大語言模型“文心一言”。隨后,360發布“360智腦”,阿裡巴巴上線“通義千問”,科大訊飛推出“訊飛星火”,騰訊推出“混元”,華為推出“盤古”……一眾科技公司不甘落后地推出了各自的大模型產品。
彼時,面向公眾發布的大模型產品均為內測使用,公眾需提出申請,獲得內測資格后才能進行體驗。7月10日,國家網信辦聯合國家發改委、教育部、科技部等七部門審議通過並發布《生成式人工智能服務管理暫行辦法》(以下簡稱《辦法》),該《辦法》8月15日起正式施行。《辦法》明確規定,提供具有輿論屬性或者社會動員能力的生成式人工智能服務的,應當按照國家有關規定開展安全評估,並履行算法備案等手續。8月底,一批完成算法備案的大模型產品陸續上線,正式面向公眾開放。
或許是ChatGPT帶來的震撼過於強烈,以自然語言對話為主要功能體驗的大語言模型產品成為許多科技廠商的首選,甚至一度成為大模型的代名詞。首批通過備案上線的大模型產品中有百度的“文心一言”、字節跳動的“豆包”、智譜華章的“智譜清言”等。截至9月底,已有十余家大語言模型產品官宣上線,大部分均提供聊天對話、創意寫作、代碼生成等服務。
但在大語言模型之外,也有廠商選擇了另一條道路,不“戀戰”大語言模型,而是直面行業具體問題。
在9月21日舉辦的華為全聯接大會2023上,華為常務董事、華為雲CEO張平安表示,盤古大模型要幫助各行各業的客戶解最難的題。例如,在礦山領域,精煤產率是困擾業界多年的難題,山東能源集團已將“盤古”礦山大模型全面應用到採、掘、機、運、通等9大業務系統、21個場景中。在“盤古”的助力下,濟寧二號煤礦每年能多產出8000噸精煤,精煤產率提升千分之二,增收約2000萬元。
在正在舉辦的亞運會上,也少不了大模型的身影。由浙江移動打造的亞運保障網絡運維大模型在幕后為亞運會保駕護航。它讓保障人員“無論在哪,無論何時”都能以“對話”方式獲取保障情況,全面提升了亞運會保障的工作效率,降低了保障工作的技術門檻。
浙江移動網管中心副總經理方煒告訴科技日報記者,無論是面向具體行業的垂直大模型,還是直面公眾的大語言模型,從底層技術來看,二者並不沖突。“這兩種選擇就像是此前的互聯網發展,既有改變人們生活的移動互聯網,也有改變社會、改變行業的產業互聯網。大模型也是基於通用的底層技術,衍生出了不同用途。比如浙江移動的網絡運維大模型就是使用通用大模型通過微調和提示工程來滿足亞運網絡保障的場景。”
垂直大模型和通用大模型,究竟哪條賽道能夠通向終極人工智能的“羅馬城”,答案或許是——條條大路通羅馬。
“萬模群舞”或在不遠的將來
無論是何種類型的大模型,在“百模大戰”的背景下,其功能、用途、場景的重復都無法避免。但在業內人士看來,大模型的發展還遠未觸及天花板,不僅“百模大戰”不是終點,“萬模群舞”或許就在不遠的將來。
“大模型的研發是一個拼細節的過程。從技術路線上看,目前各家基本上都是基於Transformer架構來做,方法很類似,但效果確實不一樣,決定成敗的是細節。”騰訊有關負責人接受採訪時說,由於資源投入程度、細節把握程度的不同,最后不同產品的差異會逐漸顯現。“從應用領域來說,會迎來一個‘百花齊放’的場景,比如有的專注於自然語言處理,有的專注於醫療領域,有的專注於教育領域等。就目前而言,大模型的天花板還遠遠沒有觸到,技術體系和應用場景都在不斷演進。”騰訊有關負責人說。
無論是“百模大戰”還是“萬模群舞”,要避免低水平的雷同復制,杜絕“重復造輪子”帶來的資源浪費,關鍵仍在於不斷豐富大模型的應用生態。今年5月,國際期刊《自然》發表了一項百度在生物計算領域的突破性研究成果,其提出的mRNA序列優化算法LinearDesign,對生物醫學領域創新具有重要價值,這也是中國互聯網科技企業首次以第一完成單位的身份在《自然》正刊發表成果。而在這背后,是百度在2022年5月便推出的“文心”生物計算大模型。借助大模型,人類能夠快速找到並設計出活性更好、性質更優的候選藥物分子,從而大幅提升新藥研發和疫苗設計效率,讓新藥研發從單點突破的“手工作坊”階段進入到規模開發階段。目前,基於“文心”生物計算大模型和飛槳深度學習框架搭建的面向小分子、大分子和RNA的藥物設計平台——飛槳螺旋槳PaddleHelix,已經應用於超過30家醫藥企業。
“無論是從技術層面還是產品層面,百花齊放、百家爭鳴對於當下大模型發展都更加有利。算法研究階段可能五花八門,但到工程選型階段,可能會逐漸聚焦到一個或少數幾個類型。而到了具體產品選型層面,面向不同市場、不同行業,產品形態可能又是多種多樣的。”清華大學計算機系教授唐杰認為,無論哪種大模型都有各自的局限性,各種模型互相學習、競爭,在市場中大浪淘沙是必經之路。
給大模型發展更多耐心
“百模大戰”雖然激發出了更多可能,但也帶來了不少負面影響。當眾多廠商蜂擁而上大模型時,參差不齊的產品讓人眼花繚亂,其中暗藏的法律、道德風險也應引起人們的警惕。
例如,在面向公眾的大語言模型產品中,“一本正經胡說八道”現象已經多次引發質疑。“我們常說大模型會產生‘幻覺’,就是因為大模型的內容准確性還不高、專業性能力不足,如果大模型產生的內容直接公開在互聯網,會使當前良莠不齊的互聯網信息質量更加低下。”方煒認為,大模型目前在內容安全、版權、主體責任等方面還存在多種風險。
而當深入到具體行業時,不同行業的不同特點也對大模型在准確度、安全性、專業性等方面提出更高要求。360創始人周鴻祎接受採訪時表示,雖然公開的大模型是通用的,甚至是萬能的,但是當深入到具體行業時仍然面臨著缺乏行業深度、不懂企業內部知識、易導致企業內部數據泄露、無法控制成本等問題。方煒也同意這種說法:“例如大模型應用在通信網絡保障方面時,就不允許有任何差錯,目前准確性還有待提升。”
除了目前大模型自身仍然存在的缺陷,隨著競爭的逐漸激烈,我國在相關數據、算力、算法等方面的困境也逐漸暴露。
例如,在訓練數據方面,唐杰指出,目前我國的數據開放態勢並不強,“大多數機構還是想把數據握在自己手裡”。但唐杰也坦承,即使機構有數據開源的意願,在目前環境下,仍然存在多重風險。他建議,我國關於大模型訓練數據應用、開源的相關法律法規還需要進一步細化、健全,讓有開源意願的機構能夠放心地進行數據開源,充分激發互聯網精神。
而在算力方面,“百模大戰”對算力的高需求也讓我國本就緊張的算力資源更加捉襟見肘。在“東數西算”基礎上建立起的算力互聯網或許有望成為解決這一問題的答案。通過對不同地區的算力資源進行調度,實現算力資源的均衡分配。但目前仍然需要在高帶寬、低延遲的算力網絡建設方面突破更多技術瓶頸。
如果說數據和算力是大模型的硬件“基礎設施”,算法則體現著更多“人”的因素。小冰公司首席執行官李笛認為,就訓練大模型而言,參數的數量並不是最重要的,工程化過程中的調優才是真正的考驗。“研發、訓練一個大模型可能隻需要一個月,但調優可能需要一年的時間。這個過程格外需要謹慎、細致、耐心,有足夠的定力和專注力,也是一種‘工匠精神’的體現。”
耐心,是談及大模型發展時多位業內專家反復提及的關鍵詞。“大模型不是把數據‘喂’進去,算力一跑就有了。這其中有許多復雜細致的工作要做。”唐杰表示,人工智能自20世紀50年代被提出至今,其發展已經歷過多次起伏,任何技術的發展都不是一蹴而就的,要對其有充分耐心。
(記者手記)
◎劉 艷
不要等大模型“無所不能”時才入局
ChatGPT讓公眾再一次體驗到現代人工智能的強大功能,它背后的大模型技術及應用范式,將極大沖擊現有人工智能產業研發路線、發展方式,並有望成為新一輪科技革命與產業變革的核心驅動力和新入口。
這一范式的變化,引發了全球大模型競逐。中國工程院院士鄭緯民認為,大模型是新型基礎設施的關鍵底座之一,大模型的競爭也是國家科技戰略的競爭。
誰都不想錯過這一機遇,全球科技企業紛紛下場投身這一科技新賽道。在這一輪AI競賽中,中國不能掉隊。
《中國人工智能大模型地圖研究報告》顯示,從全球已發布的大模型分布看,中國和美國大幅領先,超過全球總數的80%,中國已形成了緊跟世界前沿的大模型技術群。
隨著我國數字科技領軍企業大模型悉數登場,各方思辨與爭論不斷,“百模大戰”是否存在重復建設?垂直類大模型是否有建設的必要?
在百度創始人、董事長兼首席執行官李彥宏看來,新的國際競爭戰略關鍵點,不是一個國家有多少個大模型,而是大模型上有多少原生的AI應用,這些應用在多大程度上提升了生產效率。他點出了一個淺顯的道理,科技作用於社會、造福於人類,必會向不同行業延展。
先發者不一定制人。在大模型角逐中,全球基本形成了各有優勢的中美兩大集群,中國企業在推進大模型中表現得更加務實,依托中國強大的工業基礎和豐富的行業應用場景,切入實體經濟、制造業等行業,形成了“以場景架構大模型,以場景訓練大模型”的路徑。
大模型賽道上擠著形形色色的中美企業。有志於此的機構、產業在科技誕生促動期階段“蜂擁而上”是技術發展的必然,也正因此,才有可能迎來技術的成熟和廣泛應用,這種熱情值得鼓勵和包容。
技術的落地和產業的發展需要百花齊放,誰也不知道大模型未來的潛力到底有多大、其邊界到底在哪。“百模大戰”說到底是對不同發展路徑的探索,也為大家提供了更多選項,人們樂見其成。即便有一小部分公司盲目跟風,市場也會優勝劣汰。
生成式人工智能進步速度驚人,我們是否需要擔心它作惡?
不可否認,大模型的可控、安全至關重要,大模型熱潮下社會各界的種種憂慮和思考無不切中要害。無論技術創新還是業務創新,“合規”是底線。在我國相關管理辦法逐步出台的同時,針對大模型的通用能力應用到各場景,有可能發生的新安全隱私問題。產業各方已開始著手為大模型戴上“緊箍咒”,即用技術手段解決技術的“胡作非為”。
有抗拒有擔憂,卻也激發出更多創新可能。顯然,積極擁抱這一未來服務載體和入口形式的重大變化,從國家到行業,皆已有跡可循。
就像有人說的,不要在新的工業革命到來之際袖手旁觀,不要等大模型“無所不能”時才入局,現在就可以開始干了。(來源:科技日報)
分享讓更多人看到
- 評論
- 關注