打造安全防火墙,前瞻人工智能安全评估体系与基座平台发布
创始人
2026-01-06 06:03:05

一堵人工智能“防火墙”在京西智谷建起。1月5日,北京前瞻人工智能安全与治理研究院发布了前瞻人工智能安全评估体系与基座平台,包含人工智能安全评估框架、技术工具和价值参考等。

北京是公认的“人工智能第一城”,但随着技术飞速迭代,人工智能的安全风险也与日俱增,构建完善的人工智能安全评估与治理体系刻不容缓。该院院长曾毅介绍,此次发布的“前瞻安全基准”安全评估体系,不局限于传统安全评估的单一维度,而是在根植基础安全的基础上,延伸至具身智能安全、科学智能安全、社会安全、环境安全、灾难性与生存性风险五大维度。

这套体系可覆盖教育科研、医疗健康、金融经济、信息传媒、工业基建、政务民生等关键领域,重点聚焦评估和解决隐私与数据保护、滥用恶用、虚假信息防范等难题。

在此基础上,一座人工智能大模型的“练兵场”建立。“前瞻·灵御”人工智能安全攻防平台通过模拟真实攻防场景,实现对模型安全性能的全面“体检”。目前,该平台已支持60余种主流大模型、20余种攻击方法和10余种防御机制。

“测试发现,近几年的大模型在安全性上并没有明显提升,平台对部分新模型的攻击成功率甚至更高。”曾毅直言,人工智能模型构筑防御工事并不一定要重新训练,部署在线推理阶段的安全护栏,就能显著提升模型安全水平。而灵御平台就是通过提供针对性的防御方案和“加固”建议,实现主动防御、精准防护。

“前瞻·灵度”平台同步搭建,关注点侧重对人工智能伦理进行智能评估与价值校准。它能在6个维度、90个细分类别中,对上百个大模型进行实时动态监控和测试。“灵度平台集成了以中国价值观为核心的大规模中文价值语料库,累计定义了25万余条规则。”曾毅说,这能有效解决现有伦理评估中文价值适应性不足、边界覆盖不全的问题。

“人工智能安全应成为‘第一性原理’,是不可删除,也无法违背的底线要求。”曾毅认为,构建安全治理能力基座,是北京引领人工智能稳健发展的基础。前瞻院研发的人工智能安全评估体系和基座平台,不仅解决了“评什么、怎么评”的疑问,还回答了“怎样攻、如何防”,并明确了人工智能安全将“向何处去”的价值导向。

来源:北京日报客户端

记者:刘苏雅

相关内容

热门资讯

安徽省应急广播深夜误播5分钟节... 安徽省广播电视局调查组通报:1月9日0时7分,省应急广播部分终端播发5分钟广播节目,给群众正常生活造...
新里程:兰考妇儿医院为国家爱婴... 每经AI快讯,有投资者在投资者互动平台提问:请问公司在三胎和婴童领域有哪些相关业务? 新里程(002...
台前县市场监管局:三项行动齐发... 大象新闻记者 张松涛 通讯员 王传帅 王飞 刘小玉 为深入贯彻落实国家、省、市关于安全生产和市场监督...
宁德时代申请圆柱电池单体专利提... 国家知识产权局信息显示,宁德时代新能源科技股份有限公司申请一项名为“圆柱电池单体、电池、用电设备、集...
“感觉喘不上气,快要晕过去了!... 不到10分钟,救护车抵达,孕妇被送往嘉定区妇幼保健院。