解決人工智能模型通用性低問題——
全球首個知識增強千億大模型亮相
12月8日,鵬城實驗室與百度聯合發布全球首個知識增強千億大模型——鵬城—百度·文心。
為什麼大模型在產學界持續走熱,越來越多的技術公司入場?
如中國工程院院士、鵬城實驗室主任高文所言,預訓練模型賦能人工智能衍生更多的應用,而不局限於某個領域,是人工智能自身發展並作用於社會及科學創新的重要工具。
當人工智能的需求呈現出碎片化、多樣化的特點,人工智能模型卻存在很多挑戰,通用性低是首要問題。也就是說,A模型往往專用於特定A領域,應用到B領域便差強人意。
百度首席技術官王海峰介紹,鵬城—百度·文心是全球首個知識增強千億大模型,參數規模達2600億。在機器閱讀理解、文本分類、語義相似度計算等60多項任務上取得最好效果,並在30余項小樣本和零樣本任務上刷新基准。
百度集團副總裁、深度學習技術及應用國家工程實驗室副主任吳甜說:“60多項不同的任務,說明大模型的通用性很強,30余項小樣本和零樣本任務刷新基准,則意味著大模型泛化能力更強,對支撐各行各業非常重要。”
鵬城—百度·文心希望解決傳統人工智能模型泛化性差、強依賴昂貴人工標注數據、落地成本高等應用問題,希望成為千行百業人工智能開發的首選基座大模型。
而鵬城實驗室的算力系統“鵬城雲腦Ⅱ”和飛槳深度學習平台就是鵬城—百度·文心理想實現的關鍵支撐,解決了超大模型訓練的多個公認技術難題。
作為產業級知識增強大模型,文心包含自然語言理解大模型、計算機視覺大模型和跨模態大模型,既指向基礎通用的,也面向重點領域和重點任務,還有豐富的工具與平台。“知識增強”是它的核心特色。
知識是人類智慧的結晶,是人類進步的重要推動力。通過知識增強,計算機有了學習並運用知識,像人一樣理解和認知世界的可能。
吳甜強調:“我們希望人工智能系統通過對知識的學習,能夠提升學習效率,具有更好的可解釋性,更符合人對事物的理解。”
文心大模型正通過百度飛槳平台陸續對外開源開放,已大規模應用於百度搜索、信息流、智能音箱等互聯網產品,並賦能工業、能源、金融、通信、媒體、教育等各行業。
分享讓更多人看到
推薦閱讀
相關新聞
- 評論
- 關注