
文丨苏扬
编辑丨徐青阳
一周前遭遇泄露,且被 Anthropic 定义为绝密模型的 Claude Mythos 揭开了面纱。
4 月 8 日凌晨,Anthropic 正式公开 Claude Mythos 预览版的核心信息。根据介绍,这个原本旨在提升逻辑推理的模型,在没有经过任何特定网安训练的情况下,仅凭对代码库的理解,自主"猎杀"了 OpenBSD 系统中存在二十余年的致命漏洞。
为了防止项目滥用,Anthropic 联合亚马逊、苹果、微软、英伟达等 40 家行业巨头,紧急启动了名为" Project Glasswing(玻璃翅膀计划)"的防御项目。
01 硅基安全专家
传统工具依赖于已知的漏洞特征进行匹配,Mythos 则具备了顶级人类黑客的逻辑推演能力。
在对以安全性著称的OpenBSD 操作系统进行分析时,Mythos 捕捉到了一个隐藏了 27 年之久的漏洞——基于该漏洞,任何攻击者只要通过远程连接,就能让这个号称"最安全"的系统瞬间崩溃。
在广泛应用于视频流媒体的FFmpeg 编解码库中,Mythos 还发现了一行存在 16 年逻辑漏洞的代码。此前,专业的自动化安全测试工具曾对该行代码进行过超过 500 万次的暴力扫描,却均因无法理解其深层逻辑而无功而返。
在 Linux 内核测试中,Mytho 不再是单一发现一个点,而是自主寻找并串联了多个微小的低危漏洞,完成了一条从普通用户权限到获取机器完全控制权的攻击链路。
02 性能涨,Token 降
Claude Opus 4.6 可被视为目前市场上最强大的生产力工具,Mythos 预览版更像是"六边形战士"。
在 Anthropic 披露的评估数据中,Mythos 几乎在所有核心维度上都对前代进行了全方位碾压。
在衡量模型复现漏洞利用方法的 CyberGym 基准测试中,Mythos 得分为 83.1%,而上一代旗舰 Opus 4.6 仅为 66.6%。这 16.5 个百分点的差距,代表了从"辅助分析"到"自主攻防"的本质飞跃。

在模拟真实世界软件修复任务的 SWE-bench Pro 测试中,Mythos 得分 77.8%,领先 Opus 4.6 约 24 个百分点。
在经由人工验证的严苛代码测试 SWE-bench Verified 中,Mythos 拿到了 93.9% 的近乎满分成绩,这意味着它写出的修复代码不仅正确,且符合高质量工程标准。即使面对非英语环境或复杂的视觉代码图表,Mythos 的表现依然稳健,多语言得分为 87.3%,而 Opus 4.6 为 77.8%。
在多模态 SWE-bench 内部测试中,两者的差距更为悬殊:Mythos 得分 59.0%,而 Opus 4.6 仅有 27.1%。

在 Terminal-Bench 2.0(评估 AI 智能体在真实命令行环境下端到端执行能力)测试中,Mythos 需要在命令行环境中完成一系列复杂操作,其得分为 82.0%,Opus 4.6 为 65.4%。Anthropic 在报告中注明,将超时限制延长至 4 小时并使用 2.1 版本测试时,Mythos 得分可达 92.1%。
在 BrowseComp(评估大语言模型在实时互联网浏览场景下的信息检索和推理能力)复杂搜索测试中,Mythos 得分 86.9%,Opus 4.6 为 83.7%。
需要注意,Mythos 在推理能力大幅提升的同时,资源消耗却呈反向变动,其 token 消耗量比 Opus 4.6 低了 4.9 倍,这对困于 token 大幅消耗衍生高昂成本的用户来说,是一个福音。
在 OSWorld-Verified(智能体计算机使用基准测试)测试中,Mythos 得分 79.6%,Opus 4.6 为 72.7%。

在 GPQA Diamond(测试大型语言模型在科学领域的推理和知识水平)测试中,Mythos 得分 94.6%,Opus 4.6 为 91.3%。在难度更高的 Humanity's Last Exam(评估大模型的复杂推理能力和专业知识水平)数据集中,Mythos 在无工具状态下得分 56.8%,Opus 4.6 为 40.0%;使用工具后 Mythos 提升至 64.7%,Opus 4.6 为 53.1%。
03 玻璃翅膀计划
这一次 Anthropic 没有选择像外界所说的那样连夜炸场发布新模型。
根据 Anthropic 公布的信息,公司启动了一个名为" Project Glasswing "(玻璃翅膀)的项目,试图建立一个先发制人的防御联盟。

据了解,Anthropic 拿出了 1 亿美元的 Mythos 预览版使用额度,无偿或低价提供给 Glasswing 计划的合作伙伴。他们的理由是,既然攻击能力在一年内必将扩散,那么防御者必须抢在这 12 个月内,用最好的工具把门窗加固。

不过从官方公布的合作伙伴名单来看,似乎这些企业并不需要这 1 亿美元的 Token 包。
有意思的是,Anthropic 向 Linux 基金会、Apache 软件基金会等组织捐赠了 400 万美元,对全球基础设施大多运行在开源软件之上的现状,向开源软件基金会致敬。
Mythos 不会作为通用聊天机器人上线,而是作为专用安全 API,通过亚马逊 AWS Bedrock、谷歌云 Vertex AI 等专业平台分发,确保每一笔调用都可追溯、受监管。
正如 CrowdStrike 首席技术官伊利亚 · 扎伊采夫(Elia Zaitsev)所言:" AI 已将漏洞被发现到被利用的窗口期从数月缩短至几分钟。这不是我们放慢脚步的理由,而是我们必须跑得更快的信号。"
再回到玻璃翅膀项目上,其合作名单涵盖了现代数字世界的每一个角落。
在硬件层面,英伟达、博通等公司的参与意味着安全风险正向底层硬件渗透。思科高级副总裁安东尼 · 格里科(Anthony Grieco)指出,过去加固系统的方法已经失效,Mythos 正在以前所未有的速度扫描硬件漏洞,这种深刻的转变没有回头路可走。

在系统层面,从微软和谷歌的投入表明,网络安全将不再受限于"人力瓶颈"。微软网络安全与微软研究院执行副总裁伊戈尔 · 齐甘斯基(Igor Tsyganskiy)表示,通过 Mythos,微软可以在其庞大的代码库被恶意利用前,预先识别并降低风险。

在金融领域,摩根大通的加入意味着,即便在极其严苛的合规环境下,顶级金融机构也开始承认:协作式的 AI 防御是未来的必选项。摩根大通首席信息安全官帕特 · 奥佩特(Pat Opet)强调,他们会采取严格、独立的方法来决定如何推进,但 Anthropic 的倡议反映了这个时刻所要求的那种前瞻性、协作性的方法。
玻璃翅膀计划本质上是在进行一场全球范围内的"系统补丁总动员"。而 Anthropic 试图建立一个漏洞披露的新范式:在模型公开讨论任何技术细节之前,先给开发者 90 天的时间进行秘密修复。
04 第一个"火山口"
在社交媒体上,Anthropic 首席执行官达里奥 · 阿莫代伊(Dario Amodei)的发言显得忧虑多过兴奋。他认为 Mythos 所展示的漏洞挖掘能力,只是前沿 AI 带来的第一个清晰而紧迫的风险。

随着模型推理能力的进一步提升,AI 可能会在生物安全、化学防御乃至关键基础设施的博弈中展现出类似的"非预期能力"。玻璃翅膀计划的意义,不仅在于修复了几个 Linux 内核漏洞,更在于它为人类社会如何应对 AI 的"越界"提供了一个可参考的蓝图:透明、协作、先发制人。
Anthropic 前沿红队负责人洛根 · 格雷厄姆(Logan Graham)说:"如果玻璃翅膀计划仅仅是少数几家公司在闭门造车,那它注定会失败。它必须发展成更大规模的东西。"
总结而言,Claude Mythos 的发布标志着一个时代的终结——那个靠人力和时间堆砌安全长城的时代。在 AI 自主扫描每一个代码比特的未来,唯有以 AI 治 AI,人类方能在这片数字化森林中获得安宁。
(特约编译金鹿对本文亦有贡献)
