AIPress.com.cn报道
4月9日消息,人工智能公司 Anthropic 宣布启动 Project Glasswing(玻璃翼计划),该项目联合 Amazon Web Services、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux 基金会、微软、英伟达和 Palo Alto Networks 等机构,共同探索利用前沿人工智能技术加强全球关键软件基础设施的安全防护。
Anthropic 表示,启动该项目的直接背景,是公司在测试一款尚未发布的前沿模型 Claude Mythos Preview 时观察到其在网络安全领域展现出的能力突破。该模型在代码分析和漏洞挖掘方面的表现已经接近甚至超过大多数人类安全专家,能够自动发现并利用软件漏洞。Anthropic 指出,这意味着 AI 正在进入一个新的阶段:发现和利用软件漏洞的技术门槛正在显著降低。
在内部测试中,Claude Mythos Preview 已经识别出 数千个高危漏洞,其中包括存在于主流操作系统、浏览器以及关键软件组件中的问题。Anthropic 警告称,随着 AI 能力快速提升,这类技术很可能在未来被更多组织甚至恶意行为者获得,从而可能对经济体系、公共安全以及国家安全构成风险。Project Glasswing 的目标,就是尽可能在防御侧率先部署这些能力。
根据项目安排,参与机构将获得 Claude Mythos Preview 的使用权限,用于扫描和加固自身的软件系统。Anthropic 同时将向行业共享相关研究成果,并向超过 40 家维护关键软件基础设施的组织提供模型访问,以帮助检测并修复企业软件和开源系统中的漏洞。公司还承诺提供 最多1亿美元的模型使用额度支持项目研究,并向开源安全组织捐赠 400万美元。
Anthropic 介绍称,在近期的测试中,Claude Mythos Preview 能够在几乎完全自主的情况下识别并利用复杂漏洞。例如,该模型发现了 OpenBSD 操作系统中存在27年的漏洞,攻击者可通过远程连接使系统崩溃;在广泛使用的视频处理库 FFmpeg 中,它识别出一段存在 16年的代码漏洞,此前自动化测试已执行过约500万次却未能发现;此外,模型还能够在 Linux 内核中组合多个漏洞,实现从普通用户权限提升至完全控制系统的攻击路径。这些问题目前均已向相关维护团队报告并完成修复。
在安全能力评测中,Claude Mythos Preview 也表现出显著提升。例如在漏洞复现基准 CyberGym 中,该模型取得 83.1% 的成绩,高于此前模型 Claude Opus 4.6 的 66.6%。在多项软件工程与代码能力评测(如 SWE-bench 系列)中,Mythos Preview 同样取得目前已知模型中的最高分。
Anthropic 表示,目前 不会向公众开放 Claude Mythos Preview,但长期目标是让类似能力在具备安全防护机制的前提下广泛应用。公司计划在未来推出的新版本 Claude Opus 模型中逐步引入相关安全防护技术,以避免模型被用于攻击用途。
Project Glasswing 未来的研究重点将包括漏洞检测、二进制黑盒测试、终端安全加固以及系统渗透测试等领域。Anthropic 表示,项目还将推动建立一套面向 AI 时代的软件安全实践,例如漏洞披露流程、软件更新机制、开源供应链安全、自动化补丁系统以及面向监管行业的安全标准等。
Anthropic 还透露,公司已就 Claude Mythos Preview 的网络攻防能力与美国政府展开沟通,并认为在人工智能快速发展的背景下,保护关键数字基础设施已经成为各国政府的重要安全议题。
根据计划,Anthropic 将在 90 天内发布阶段性公开报告,披露在 Project Glasswing 中发现并修复的漏洞类型以及行业安全实践方面的改进经验。公司同时呼吁更多 AI 开发者、软件企业、安全研究人员以及政府机构参与类似合作,共同应对 AI 时代可能出现的网络安全挑战。(AI普瑞斯编译)