人民網
人民網>>經濟·科技

國內首張大模型高階通用能力測試証書頒發

2026年01月07日08:29 | 來源:中國消費者報·中國消費網222
小字號

點擊播報本文,約

原標題:國內首張大模型高階通用能力測試証書頒發

近日,在海南省海口市舉辦的全國信標委人工智能分委會“標准周”活動期間,國內首張大模型高階通用能力國家標准符合性測試証書正式頒發,標志著我國大模型高階通用能力評測實現標准化落地,為大模型產業規范化發展樹立了關鍵裡程碑。

為破解大模型高階能力評測缺乏統一標准的行業痛點,中國電子技術標准化研究院於2025年9月啟動“求索”大模型高階通用能力測試工作。其中,大模型高階通用能力聚焦復雜邏輯處理、代碼應用實踐、多模態交互等產業核心需求場景,構建了涵蓋深度推理與復雜問題求解(含數學推理、圖表推理)、代碼理解與生成(含意圖優化、多語言代碼生成)、多模態理解與生成(含行為識別、視頻問答、文本生成視頻等)的全維度評測框架。測試全過程嚴格遵循國家標准GB/T 45288.2-2025《人工智能 第2部分:評測指標與方法》,通過科學量化的指標體系,確保評測結果的權威性、公正性與可比性,為行業提供了清晰的技術發展導向。

中國電信自主研發的星辰語義大模型依托國產算力與訓練框架研制,是國內唯一全國產、全尺寸、全開源的基礎大模型。模型訓練攻克國產萬卡集群長穩訓練技術難題,國產萬卡集群利用率高達98%,訓練效能較英偉達同等算力達93%。模型綜合能力達到業界較高水平,當前已成功研發的多款核心基礎模型中,2025年上半年的TeleChat2.5系列35B、115B模型綜合能力表現優異,2025年12月TeleChat3-105B正式開源,為國內首個全國產化訓練的千億參數細粒度 MoE模型,同步開源稠密參數模型TeleChat3-36B,綜合能力在MMLU-Pro、Math-500等多項權威評測基准中位列同等規模參數開源模型TOP3。模型競爭力獲得行業廣泛認可,開源社區累計下載量超50萬次,斬獲中國通信學會《2024年度十大科技進展》、2025世界人工智能大會卓越人工智能引領者獎(SAIL獎)等多項權威榮譽。

目前星辰系列語義大模型已實現規模化應用,全面支撐了各類toC、toH和產數類項目的交付。toC、toH方面,包括星小辰、AI眼鏡、雲智手機在內的多款產品中,上線了意圖理解、AI代接、自由對話等多項自主研發能力,在實際業務中為用戶帶來了較好的交互體驗。產數業務在電信集團內部的知識採編、通信助理、數字人客服等場景落地,覆蓋全國31省,對外賦能中車、國能、航天等企業,真正推動芯片、模型、應用全鏈條自主可控,全面提升了我國在通用人工智能領域的自主創新能力。(記者 董芳忠)

(責編:曹淼、李源)
關注公眾號:人民網財經關注公眾號:人民網財經

分享讓更多人看到

推薦閱讀
返回頂部