人民網
人民網>>經濟·科技

奇富科技發布信貸多模態評測基准 構筑信貸AI研究與落地關鍵橋梁

2026年01月09日11:23 | 來源:中國網財經222
小字號

點擊播報本文,約

原標題:奇富科技發布首個信貸多模態評測基准,構筑信貸AI研究與落地關鍵橋梁

近日,奇富科技聯合復旦大學與華南理工大學研究人員共同發布面向信貸場景的多模態評測基准FCMBench-V1.0 (Financial Credit Multimodal Benchmarks)。該基准基於真實信貸業務場景,抽象科學問題,設計多模態評估任務與挑戰,以期構建來源於業務、服務於業務的實用性評測體系,推動信貸AI的學術研究與應用落地。同時,奇富科技宣布開源數據集與評測工具,為行業共建AI基礎設施提供關鍵支撐。

FCMBench 不僅是當前金融信貸領域樣本量最大、最符合真實應用場景的多模態大模型評測基准,更創新推出"感知-推理-魯棒性"三維評測體系,全面評估信貸AI模型的實戰能力。與傳統側重單一識別或理解能力的評測不同,FCMBench所評測出的模型能力,能夠直接對應小微企業授信過程中對多証件識別、信息一致性校驗與風險線索發現等核心環節,為模型是否具備實際可用性提供清晰、可量化的參考依據。

該基准旨在提供一個標准的評測平台,以促進學術界和產業界之間的協作發展,推動AI更好地賦能信貸場景。一方面,金融機構不再缺乏公平比較信貸領域AI模型能力的標准﹔另一方面,學術界和金融科技公司的研究人員能夠對信貸領域的關鍵難題開展深入研究。這打破了行業內數據和領域知識壁壘,推動信貸人工智能從“單點優化”邁向“產學研協同創新”。

奇富科技多模態負責人楊葉輝介紹:"金融信貸審核涉及幾十類証件、每類証件有多種模版、審核流程涉及多個環節和任務、以及多証件的交叉推理驗証,用戶拍攝的場景和上傳的文件也多種多樣。信貸場景的這些挑戰對於多模態大模型的能力也是非常好的試金石。FCMBench-V1.0 只是一個開始,我們會持續完善這個評測基准,希望打磨好一把公平、公正,面向實戰需求的尺子:如果你的模型在FCMBench上取得了好成績,理論上就可以面向實際落地,而不僅僅是滿足了實驗室指標。"

FCMBench-V1.0構建了與真實銀行審核流程高度一致的評測框架,涵蓋18類核心信貸証件,如身份証、收入証明、銀行流水、房產証等,包含4043張合規圖像和 8446個測試樣本,問題覆蓋信貸審核全鏈條。其創新的"感知-推理-魯棒性"三維評測體系,對金融信貸 AI 模型所需的實戰核心能力提出了全面的考核。

通過對23個主流多模態模型(來自14家頂尖AI企業及科研機構)的全面評測,FCMBench展現出強大的鑒別能力。結果顯示, Google DeepMind的Gemini 3 Pro(64.61)位列商業模型榜首,阿裡巴巴Qwen3-VL-235B(57.27)成為最佳的開源基模。而奇富科技自研的信貸垂類多模態大模型Qfin-VL-Instruct以64.92的F1分數斬獲綜合第一,該模型基於奇富實際業務場景進行研發,彰顯了垂類領域定制化訓練的優勢,該模型的試用接口已向公眾開放。

作為該評測基准的核心研究人員,復旦大學與上海創智學院的雙聘教授陳濤表示:“FCMBench的發布不僅填補了金融信貸領域多模態評測基准的空白,更構建了金融大模型學術研究與產業應用的溝通橋梁。隨著該基准的開源與推廣,將吸引更多研究者關注金融AI領域,加速技術創新與落地應用,為行業帶來更高效、更可靠的智能解決方案。”

作為該評測基准的主要參與人之一,華南理工大學未來技術學院教授、人工智能與數字經濟廣東省實驗室研究員許言午表示:“通過不斷打磨FCMBench 來指引信貸AI模型的開發,不僅有助於推動多模態智能技術在數字金融和實體經濟中的安全、合規與高質量應用,也為人工智能與數字經濟領域的前沿研究和復合型人才培養提供了重要支撐。希望FCMBench能夠加速金融大模型從實驗室走向真實業務場景,釋放更大的產業價值。”

目前,FCMBench的數據集、評測工具以及Qfin-VL-Instruct的試用接口已開放獲取,相關細節已在學術論文中全面披露。奇富科技表示,將持續攜手產學研伙伴,推動金融AI技術的標准化與規范化發展,助力金融機構數智化轉型與小微企業融資服務能力的持續提升。

(責編:董童、李源)
關注公眾號:人民網財經關注公眾號:人民網財經

分享讓更多人看到

推薦閱讀
返回頂部