提前泄露的Claude绝密模型，“救了”苹果、微软和谷歌

九洲体育客服

新闻动态: 九洲体育客服介绍; 产品展示; 新闻动态

热点资讯

伊朗国际互联网服务将于未来24小时内全面恢复

《巫师3》终极Mod！修复5750个Bug 加入删减内容

你的位置：九洲体育客服 > 新闻动态 > 提前泄露的Claude绝密模型，“救了”苹果、微软和谷歌

提前泄露的Claude绝密模型，“救了”苹果、微软和谷歌

发布日期：2026-04-29 10:50 点击次数：196

文丨苏扬

编辑丨徐青阳

一周前遭遇泄露，且被 Anthropic 定义为绝密模型的 Claude Mythos 揭开了面纱。

4 月 8 日凌晨，Anthropic 正式公开 Claude Mythos 预览版的核心信息。根据介绍，这个原本旨在提升逻辑推理的模型，在没有经过任何特定网安训练的情况下，仅凭对代码库的理解，自主"猎杀"了 OpenBSD 系统中存在二十余年的致命漏洞。

为了防止项目滥用，Anthropic 联合亚马逊、苹果、微软、英伟达等 40 家行业巨头，紧急启动了名为" Project Glasswing（玻璃翅膀计划）"的防御项目。

01 硅基安全专家

传统工具依赖于已知的漏洞特征进行匹配，Mythos 则具备了顶级人类黑客的逻辑推演能力。

在对以安全性著称的OpenBSD 操作系统进行分析时，Mythos 捕捉到了一个隐藏了 27 年之久的漏洞——基于该漏洞，任何攻击者只要通过远程连接，就能让这个号称"最安全"的系统瞬间崩溃。

在广泛应用于视频流媒体的FFmpeg 编解码库中，Mythos 还发现了一行存在 16 年逻辑漏洞的代码。此前，专业的自动化安全测试工具曾对该行代码进行过超过 500 万次的暴力扫描，却均因无法理解其深层逻辑而无功而返。

在 Linux 内核测试中，Mytho 不再是单一发现一个点，而是自主寻找并串联了多个微小的低危漏洞，完成了一条从普通用户权限到获取机器完全控制权的攻击链路。

02 性能涨，Token 降

Claude Opus 4.6 可被视为目前市场上最强大的生产力工具，Mythos 预览版更像是"六边形战士"。

在 Anthropic 披露的评估数据中，Mythos 几乎在所有核心维度上都对前代进行了全方位碾压。

在衡量模型复现漏洞利用方法的 CyberGym 基准测试中，Mythos 得分为 83.1%，而上一代旗舰 Opus 4.6 仅为 66.6%。这 16.5 个百分点的差距，代表了从"辅助分析"到"自主攻防"的本质飞跃。

在模拟真实世界软件修复任务的 SWE-bench Pro 测试中，Mythos 得分 77.8%，领先 Opus 4.6 约 24 个百分点。

在经由人工验证的严苛代码测试 SWE-bench Verified 中，Mythos 拿到了 93.9% 的近乎满分成绩，这意味着它写出的修复代码不仅正确，且符合高质量工程标准。即使面对非英语环境或复杂的视觉代码图表，Mythos 的表现依然稳健，多语言得分为 87.3%，而 Opus 4.6 为 77.8%。

在多模态 SWE-bench 内部测试中，两者的差距更为悬殊：Mythos 得分 59.0%，而 Opus 4.6 仅有 27.1%。

在 Terminal-Bench 2.0（评估 AI 智能体在真实命令行环境下端到端执行能力）测试中，Mythos 需要在命令行环境中完成一系列复杂操作，其得分为 82.0%，Opus 4.6 为 65.4%。Anthropic 在报告中注明，将超时限制延长至 4 小时并使用 2.1 版本测试时，Mythos 得分可达 92.1%。

在 BrowseComp（评估大语言模型在实时互联网浏览场景下的信息检索和推理能力）复杂搜索测试中，Mythos 得分 86.9%，Opus 4.6 为 83.7%。

需要注意，Mythos 在推理能力大幅提升的同时，资源消耗却呈反向变动，其 token 消耗量比 Opus 4.6 低了 4.9 倍，这对困于 token 大幅消耗衍生高昂成本的用户来说，是一个福音。

在 OSWorld-Verified（智能体计算机使用基准测试）测试中，Mythos 得分 79.6%，Opus 4.6 为 72.7%。

在 GPQA Diamond（测试大型语言模型在科学领域的推理和知识水平）测试中，Mythos 得分 94.6%，Opus 4.6 为 91.3%。在难度更高的 Humanity's Last Exam（评估大模型的复杂推理能力和专业知识水平）数据集中，Mythos 在无工具状态下得分 56.8%，Opus 4.6 为 40.0%；使用工具后 Mythos 提升至 64.7%，Opus 4.6 为 53.1%。

03 玻璃翅膀计划

这一次 Anthropic 没有选择像外界所说的那样连夜炸场发布新模型。

根据 Anthropic 公布的信息，公司启动了一个名为" Project Glasswing "（玻璃翅膀）的项目，试图建立一个先发制人的防御联盟。

据了解，Anthropic 拿出了 1 亿美元的 Mythos 预览版使用额度，无偿或低价提供给 Glasswing 计划的合作伙伴。他们的理由是，既然攻击能力在一年内必将扩散，那么防御者必须抢在这 12 个月内，用最好的工具把门窗加固。

不过从官方公布的合作伙伴名单来看，似乎这些企业并不需要这 1 亿美元的 Token 包。

有意思的是，Anthropic 向 Linux 基金会、Apache 软件基金会等组织捐赠了 400 万美元，对全球基础设施大多运行在开源软件之上的现状，向开源软件基金会致敬。

Mythos 不会作为通用聊天机器人上线，而是作为专用安全 API，通过亚马逊 AWS Bedrock、谷歌云 Vertex AI 等专业平台分发，确保每一笔调用都可追溯、受监管。

正如 CrowdStrike 首席技术官伊利亚 · 扎伊采夫（Elia Zaitsev）所言：" AI 已将漏洞被发现到被利用的窗口期从数月缩短至几分钟。这不是我们放慢脚步的理由，而是我们必须跑得更快的信号。"

再回到玻璃翅膀项目上，其合作名单涵盖了现代数字世界的每一个角落。

在硬件层面，英伟达、博通等公司的参与意味着安全风险正向底层硬件渗透。思科高级副总裁安东尼 · 格里科（Anthony Grieco）指出，过去加固系统的方法已经失效，Mythos 正在以前所未有的速度扫描硬件漏洞，这种深刻的转变没有回头路可走。

在系统层面，从微软和谷歌的投入表明，网络安全将不再受限于"人力瓶颈"。微软网络安全与微软研究院执行副总裁伊戈尔 · 齐甘斯基（Igor Tsyganskiy）表示，通过 Mythos，微软可以在其庞大的代码库被恶意利用前，预先识别并降低风险。

在金融领域，摩根大通的加入意味着，即便在极其严苛的合规环境下，顶级金融机构也开始承认：协作式的 AI 防御是未来的必选项。摩根大通首席信息安全官帕特 · 奥佩特（Pat Opet）强调，他们会采取严格、独立的方法来决定如何推进，但 Anthropic 的倡议反映了这个时刻所要求的那种前瞻性、协作性的方法。

玻璃翅膀计划本质上是在进行一场全球范围内的"系统补丁总动员"。而 Anthropic 试图建立一个漏洞披露的新范式：在模型公开讨论任何技术细节之前，先给开发者 90 天的时间进行秘密修复。

04 第一个"火山口"

在社交媒体上，Anthropic 首席执行官达里奥 · 阿莫代伊（Dario Amodei）的发言显得忧虑多过兴奋。他认为 Mythos 所展示的漏洞挖掘能力，只是前沿 AI 带来的第一个清晰而紧迫的风险。

随着模型推理能力的进一步提升，AI 可能会在生物安全、化学防御乃至关键基础设施的博弈中展现出类似的"非预期能力"。玻璃翅膀计划的意义，不仅在于修复了几个 Linux 内核漏洞，更在于它为人类社会如何应对 AI 的"越界"提供了一个可参考的蓝图：透明、协作、先发制人。

Anthropic 前沿红队负责人洛根 · 格雷厄姆（Logan Graham）说："如果玻璃翅膀计划仅仅是少数几家公司在闭门造车，那它注定会失败。它必须发展成更大规模的东西。"

总结而言，Claude Mythos 的发布标志着一个时代的终结——那个靠人力和时间堆砌安全长城的时代。在 AI 自主扫描每一个代码比特的未来，唯有以 AI 治 AI，人类方能在这片数字化森林中获得安宁。

（特约编译金鹿对本文亦有贡献）

上一篇：伊朗国际互联网服务将于未来24小时内全面恢复

下一篇：没有了