國內首張大模型高階通用能力測試証書頒發

2026年01月07日08:29 | 來源：中國消費者報·中國消費網222

小字號

點擊播報本文，約

原標題：國內首張大模型高階通用能力測試証書頒發

近日，在海南省海口市舉辦的全國信標委人工智能分委會“標准周”活動期間，國內首張大模型高階通用能力國家標准符合性測試証書正式頒發，標志著我國大模型高階通用能力評測實現標准化落地，為大模型產業規范化發展樹立了關鍵裡程碑。

為破解大模型高階能力評測缺乏統一標准的行業痛點，中國電子技術標准化研究院於2025年9月啟動“求索”大模型高階通用能力測試工作。其中，大模型高階通用能力聚焦復雜邏輯處理、代碼應用實踐、多模態交互等產業核心需求場景，構建了涵蓋深度推理與復雜問題求解（含數學推理、圖表推理）、代碼理解與生成（含意圖優化、多語言代碼生成）、多模態理解與生成（含行為識別、視頻問答、文本生成視頻等）的全維度評測框架。測試全過程嚴格遵循國家標准GB/T 45288.2-2025《人工智能第2部分：評測指標與方法》，通過科學量化的指標體系，確保評測結果的權威性、公正性與可比性，為行業提供了清晰的技術發展導向。

中國電信自主研發的星辰語義大模型依托國產算力與訓練框架研制，是國內唯一全國產、全尺寸、全開源的基礎大模型。模型訓練攻克國產萬卡集群長穩訓練技術難題，國產萬卡集群利用率高達98%，訓練效能較英偉達同等算力達93%。模型綜合能力達到業界較高水平，當前已成功研發的多款核心基礎模型中，2025年上半年的TeleChat2.5系列35B、115B模型綜合能力表現優異，2025年12月TeleChat3-105B正式開源，為國內首個全國產化訓練的千億參數細粒度 MoE模型，同步開源稠密參數模型TeleChat3-36B，綜合能力在MMLU-Pro、Math-500等多項權威評測基准中位列同等規模參數開源模型TOP3。模型競爭力獲得行業廣泛認可，開源社區累計下載量超50萬次，斬獲中國通信學會《2024年度十大科技進展》、2025世界人工智能大會卓越人工智能引領者獎（SAIL獎）等多項權威榮譽。

目前星辰系列語義大模型已實現規模化應用，全面支撐了各類toC、toH和產數類項目的交付。toC、toH方面，包括星小辰、AI眼鏡、雲智手機在內的多款產品中，上線了意圖理解、AI代接、自由對話等多項自主研發能力，在實際業務中為用戶帶來了較好的交互體驗。產數業務在電信集團內部的知識採編、通信助理、數字人客服等場景落地，覆蓋全國31省，對外賦能中車、國能、航天等企業，真正推動芯片、模型、應用全鏈條自主可控，全面提升了我國在通用人工智能領域的自主創新能力。（記者董芳忠）

(責編：曹淼、李源)

關注公眾號：人民網財經