人民网
人民网>>经济·科技

大语言模型“安全体检”报告为AI治理提供参考

2026年07月04日08:18 | 来源:新华社222
订阅已订阅已收藏收藏小字号

点击播报本文,约

当AI回答一个专业科技问题时,能否确保内容可靠且安全?7月2日发布的全球大语言模型科技安全防范能力测评报告显示,在某些语境下,部分测试模型仍存在多重安全隐患。

在当天举行的2026全球数字经济大会云智算安全论坛上,东壁科技数据有限责任公司联合上海财经大学数字经济学院共同发布了这份测评报告。

据介绍,测评方构建了包含313条问题的测试集,覆盖生物化学、网络安全等前沿领域,对全球38个大语言模型进行了全景式扫描。为评估科技内容的可靠性,测评方还从东壁全球科技文献数据平台选取了近10万份科技文献材料作为参考。

上海财经大学数字经济学院院长赵琳介绍,测评发现,科技内容的可靠性越高,不一定越安全,关键在于能否把可靠知识限制在合规范围内。

我国高度重视完善人工智能治理,近年来不仅将其写入政府工作报告,还向世界提出《全球人工智能治理倡议》,推动人工智能向善发展。

东壁科技数据创始人吴登生表示,大模型安全测评正从单一的“关键词屏蔽”转向综合的风险评价。持续完善测评体系,未来将为全球人工智能的健康发展和精准治理提供借鉴。(记者刘祯)

(责编:赵竹青、申佳平)
关注公众号:人民网财经关注公众号:人民网财经

分享让更多人看到

推荐阅读
返回顶部