度小滿發布“軒轅70B”金融大模型

9月22日,度小滿宣布“軒轅70B”金融大模型開源,所有用戶均可自由下載和試用,並公布了“軒轅70B”在C-Eval、CMMLU兩大權威大語言模型評測基准的成績。數據顯示, 在C-Eval榜單上,XuanYuan-70B的總成績達到71.9分﹔在CMMLU榜單中,以71.05分的高分位居榜首,在兩大權威榜單上的所有開源模型中排名第一,也是國內首個同時在兩大權威榜單排名第一的金融大模型。
C-Eval榜單是由清華大學、上海交通大學和愛丁堡大學合作構建的綜合性考試評測集,幾乎囊括了所有國內外的主流模型,覆蓋人文、社科、理工、其他專業四個大方向的52個學科,共有13948個多項選擇題和中學、本科、研究生、職業等四個難度級別,是目前對模型潛力判斷最具權威性的大模型榜單之一。
CMMLU 數據集是一個綜合性的中文評估基准,由MBZUAI、上海交通大學、微軟亞洲研究院共同推出,專門用於評估語言模型在中文語境下的知識和推理能力,共涵蓋了67個主題,涉及自然科學、社會科學、工程、人文以及常識等。
金融行業場景豐富,數字化程度高,是大模型落地應用的最佳場景之一。但金融又是一個高合規要求的行業,業務決策復雜,大模型真正在金融業務中做到實際應用還面臨不少挑戰。
度小滿CTO許冬亮表示,“相比通用大模型,‘軒轅70B’金融大模型經過度小滿業務場景中沉澱的海量金融數據訓練,對金融知識理解更專業、更精准,可控性、安全性更高。我們把大模型開源,希望能夠降低大模型在金融行業的部署和應用門檻,促進金融行業服務效率和服務體驗的突破性革新”。
今年5月份,度小滿開源了國內首個千億參數的金融大模型,已經有上百家金融機構申請試用。本次發布的新版大模型相較於上一個版本能力全面提升:在增量預訓練和指令微調階段,加入了度小滿業務場景中的海量金融數據,對金融問題回復更專業,金融知識理解能力提升明顯﹔同時在預訓練階段,"軒轅70B”的模型上下文長度擴充到8k,能夠處理更長的金融報告、研究和分析。

分享讓更多人看到
- 評論
- 關注