AI安全的红线在后退?Anthropic与OpenAI的安全承诺变味了
创始人
2026-02-28 06:04:24

曾被视作AI安全标杆的Anthropic,最近悄悄改写了自己的核心承诺。

当地时间2月24日,Anthropic发布《负责任扩展政策》第三版(RSP 3.0),那条“模型触及危险阈值就暂停训练”的硬性红线,从文件中彻底消失,取而代之的是“透明披露”的柔性框架。无独有偶,OpenAI也在2024年度IRS表格中,删掉了使命陈述里的“safely(安全地)”一词。

两家全球顶尖AI公司的默契动作,让“AI安全”这个严肃话题,蒙上了一层商业博弈的阴影。

曾经高举“安全优先”大旗的领航者,为何在此时集体松绑?这背后,是资本压力、行业竞争与监管真空共同作用的结果,更折射出AI行业发展的深层困境。

Anthropic的转变最具戏剧性。这家由前OpenAI核心成员创立的公司,成立初衷就是担心AI失控,“安全”是它区别于其他玩家的核心招牌。2023年版RSP政策中,明确写入“if-then”约束机制:若无法部署对应安全措施,就必须暂停训练更强模型,相当于给自己上了一道不可逾越的安全锁。

但在RSP 3.0中,这道锁被换成了旋转门。新框架以安全路线图、风险报告和外部评审为核心,从“做不到就不许动”变成了“边做边说”。Anthropic给出的解释是,AI安全级别越高,预设具体防护措施就越困难,模型能力是连续增长的,不存在清晰的红线。

这个说法看似合理,却无法解答外界的疑问:如果边界本就模糊,为何当初要将其作为核心承诺?又为何偏偏在完成300亿美元融资、估值升至3800亿美元的节点修改?

答案,或许藏在商业竞争的现实里。

Anthropic首席科学家Jared Kaplan的一句话道破天机:“如果竞争对手飞速前进,我们单方面承诺暂停训练没有意义。”

如今的AI竞赛早已不是几家公司的博弈,开源社区、各国企业都在加速推进,没有哪家愿意为了安全主动放慢脚步。Anthropic曾设想由自己设立安全标准、带动行业跟进,但现实是,多数公司的安全框架只是形式对标,而非实质约束。

OpenAI的动作同样耐人寻味。其旧使命“构建安全的、造福全人类的通用人工智能”中,“safely”一词是说服外界的最后防线——即便从非营利转型为“封顶利润公司”,仍坚守安全底线。但如今这个词的消失,让不少人担忧:当估值冲向8300亿美元,商业利益是否已凌驾于安全之上?

有人认为删改一个副词是小题大做,但在AI行业,这种表述变化绝非偶然。两家公司的默契调整,本质上是在资本压力下的理性选择:暂停训练意味着暂停产品迭代、商业落地和估值增长,这对于背负巨大市值预期的商业实体而言,代价过于沉重。

更现实的是,当前政治气候对AI监管不友好,政府行动迟缓,企业不愿单方面承担安全成本,这种监管真空进一步放大了行业的焦虑。

Anthropic反复强调,RSP 3.0不是放弃安全,而是换了更成熟的方式。确实,新版本保留了不少实质性安全机制,比如针对生化武器风险的ASL-3级别防护标准,通过输入输出分类器拦截滥用内容,这些都不是空洞的口号。但问题的核心在于,透明披露能否替代硬性约束?

答案显然是否定的。

硬性约束是“锁死选项”,无论压力多大都无路可退;而透明披露依赖外部舆论和内部自律,当资本焦虑足够强烈,这种约束很可能形同虚设。

2026年的AI行业,“安全”正逐渐变成一种公关语言——几乎所有主流公司都有安全框架和负责任政策,但这些文件究竟是用来约束自己,还是用来安抚监管和公众?

更令人担忧的是,企业有权自行修改安全框架,安全承诺的边界正在不断移动。Anthropic最初的设想是,企业率先设立标准,推动行业自律,最终形成政府多边协调机制。但这条路并未走通:监管跟不上技术和商业的变化,安全共识逐渐散开,竞争却在持续加速,形成了“没人愿意踩刹车”的行业现状。

在这个监管真空期,一个关键问题浮出水面:如果企业不再为自己设红线,谁来设?AI技术的发展速度远超想象,其潜在风险也在不断升级,从协助生物武器研发到引发就业危机,都可能成为现实。仅靠企业自律和透明披露,显然无法应对这些系统性风险。

我们不能简单否定Anthropic和OpenAI的努力,它们内部仍有大量工程师在推进安全研究,RSP 3.0也保留了诸多实质性机制。但必须清醒地认识到,AI安全不能依赖企业的道德自觉,更需要制度性保障。

当行业竞争进入白热化,资本回报的诱惑越来越大,只有建立统一的行业标准、完善的监管体系和有效的多边协调机制,才能为AI发展划定真正的红线。

Anthropic和OpenAI的安全承诺调整,给整个行业敲响了警钟。AI的终极目标是造福人类,而安全是实现这一目标的前提。如果为了追求速度和商业利益不断后退安全底线,最终可能让整个行业陷入信任危机。

当下最需要的,是政府、企业、科研机构的协同行动:尽快建立清晰的AI安全标准,完善监管政策,让安全成本由全行业共同承担,而非单个企业独自扛下。

只有这样,才能避免AI行业在“比谁更快”的竞赛中失控,让技术发展真正走上可持续的轨道。否则,当所有玩家都在加速,没有刹车的赛道终将通向未知的危险。

[本文作者i黑马,i黑马原创。如需转载请联系微信公众号(ID:iheima)授权,未经授权,转载必究。]

相关内容

热门资讯

枣庄市2月28日天气预报:阴转... 今天是2月28日,星期六,农历正月十二。枣庄市今天天气阴转小雨,气温范围在6℃至13℃之间,东风3级...
松潘县高高原机场“红十字应急救... 近日,松潘县红十字会高高原机场应急救护站(由浙江省红十字会捐赠)正式投入使用。 该救护站的建成投用...
中国使馆提醒在以中国公民加强安... 新华社耶路撒冷2月27日电(记者庞昕熠 冯国芮)中国驻以色列大使馆27日发布安全提醒说,目前中东地区...
贵阳高新区:节后复工“安全先行... 随着春节假期落下帷幕,企业复工复产进入关键期。贵阳高新区坚持“安全第一、预防为主”的方针,将安全生产...
海尔智家公布国际专利申请:“可... 证券之星消息,根据企查查数据显示海尔智家(600690)公布了一项国际专利申请,专利名为“可燃冷媒空...
上海机场新注册《航空器消防救援... 证券之星消息,近日上海机场(600009)新注册了《航空器消防救援仿真系统软件1.0》项目的软件著作...
雷军称高度重视安全体系建设,小... IT之家 2 月 27 日消息,今日晚间,小米创办人、董事长兼 CEO 雷军在直播中强调,小米造车以...
江机机械取得带有安全检测的起爆... 国家知识产权局信息显示,吉林市江机机械设备制造有限公司取得一项名为“一种带有安全检测的起爆装置”的专...
亚信安全业绩快报:2025年年... 时代财经AI快讯,2月27日,亚信安全(688225.SH)发布业绩快报,2025年年度营业收入77...
勘设股份获得发明专利授权:“一... 证券之星消息,根据天眼查APP数据显示勘设股份(603458)新获得一项发明专利授权,专利名为“一种...
虎跳峡男子落水事故细节:落水后... 2月25日下午,云南迪庆州香格里拉市中虎跳峡“发疯石”区域发生一名男子坠入金沙江后失踪的事故。 红星...
湖北部署安全生产:坚持问题导向... 原标题:李殿勋出席全省安全生产和森林防灭火视频会议 暨省安委会2026年度第二次全体会议 坚持问题导...
时刻绷紧安全生产之弦 齐抓共管... 2月26日,在收听收看全国安全生产和森林草原防灭火视频会议后,省长叶建春主持召开全省安全生产和森林防...
小米汽车:将重建安全顾问委员会... 每经AI快讯,2月27日,小米方面透露,新的一年,小米汽车将重建小米汽车安全顾问委员会,将向全国各大...
AI安全的红线在后退?Anth... 曾被视作AI安全标杆的Anthropic,最近悄悄改写了自己的核心承诺。 当地时间2月24日,Ant...