2026 年 6 月 9 日,Anthropic 发布 Claude Fable 5 和 Claude Mythos 5——同一个 Mythos-class 底层模型的两个版本。Fable 5——加了安全防护,面向所有用户。Mythos 5——同样底层,去掉部分防护,只给 Glasswing 合作伙伴和受信任的研究者。Fable 5 的能力超过 Anthropic 此前任何普遍发布的模型。Stripe 用 Fable 5 一天完成 5000 万行 Ruby 代码迁移——本来需要团队两个月。Mythos 5 加速药物设计 10 倍,第一次稳定产出"被科学家盲评偏好 80% 时间"的新生物学假说,并独立提出一个 E. coli 蛋白机制——被另一个独立实验室同期验证。价格——$10/M 输入 + $50/M 输出,是 Mythos Preview 的一半不到。本文是这次发布的中文精校版。
2026 年 6 月 9 日,Anthropic 发布 Claude Fable 5 和 Claude Mythos 5。这是 Mythos-class(位于 Opus class 之上的能力等级)第一次以普遍发布的形式向公众开放——一个 4 月通过 Project Glasswing 才向 50 个合作伙伴开放的能力等级,2 个月后就有了"带保护的版本"可以给所有人用。Fable 5——加了完整防护,所有人可用。Mythos 5——同样底层,部分防护被解除,只给 Glasswing 合作伙伴和受信任研究者。价格是 Mythos Preview 的一半不到——$10/M 输入 + $50/M 输出。
2026 年 6 月 9 日,Anthropic 发布 Claude Fable 5——一款"能安全地用于普遍发布"的 Mythos-class 模型。
Anthropic 写道——Fable 5 的能力超过我们普遍发布过的任何模型。它在几乎所有 AI 能力基准上是最新最先进——展现在软件工程、知识工作、视觉、科学研究等多领域例外的性能。任务越长越复杂,Fable 5 比其他 Claude 模型的领先就越大。
Anthropic 同时毫不掩饰地承认——"发布这种能力的模型伴随着风险"。没有防护的话,Fable 5 在网络安全等领域的能力可能被滥用造成严重损害。所以他们用"防护"启动模型——对某些主题的查询,会被自动转给次强的 Claude Opus 4.8 来回答。
为了能同时又安全又快地发布——Anthropic 把防护调得保守。这意味着有时候无害的请求也会被拦截——但平均下来,少于 5% 的会话会触发防护。
对一小群网络防御者和基础设施提供商,Anthropic 同时发布 Claude Mythos 5——跟 Fable 5 是同一个底层模型,但部分领域防护被解除。Mythos 5 通过 Project Glasswing 部署——和美国政府合作——作为 Mythos Preview 的升级版。它有世界上任何模型中最强的网络安全能力。
价格——$10/M 输入 + $50/M 输出——不到 Mythos Preview 的一半。
"Fable" 源自拉丁文 fabula——"被讲述的东西"——和希腊词 Mythos 同源。同一个故事,两种讲法——一种带保护、一种不带。Anthropic 用两个不同名字来明确区分——保护机制是两者唯一的区别。这是一个很重要的产品设计哲学——承认能力本身是中性的,"是否有保护"决定了它该被给谁用。这也是 Anthropic 对自己 RSP(Responsible Scaling Policy)的具体应用——在能力上不让步,在分发上做选择。
Anthropic 在脚注里解释了这两个名字的来源——
"Fable" 源自拉丁文 fabula——
"被讲述的东西"——
与希腊词 Mythos 同源。
是保护机制区分了 Fable 和 Mythos——
这就是我们给它们不同名字的原因。
这是 Anthropic 一次很有意思的产品设计选择。
过去 OpenAI、Google 等都用版本号或后缀区分不同能力等级(GPT-4o、Gemini 1.5 Pro 等)。Anthropic 用不同名字来表示——同一个底层模型,但分发策略不同。
这个选择背后的哲学——"能力本身是中性的"——一段 Mythos 级别的网络安全能力,对防御者是工具,对攻击者是武器。所以关键的产品决定是"给谁用",而不只是"做多强"。
这也是 Anthropic 自己的 RSP(Responsible Scaling Policy)的具体落地——在能力上不让步,在分发上做选择。
Fable 5 和 Mythos 5 在"自主长任务"上比之前所有 Claude 模型走得更远。任务越长越复杂,它们的领先就越大。Anthropic 的能力评测覆盖软件工程、知识工作、视觉、内存与长上下文、药物设计、新假说、基因组学。一项重要观察——对齐评测里,Mythos 5 的不对齐行为水平很低,跟 Opus 4.8 相当。Fable 5 是同一底层,对齐水平也相似。
这一节给出一个让人记下的事实——Fable 5 和 Mythos 5 比此前所有 Claude 模型自主工作的时间都长。
Anthropic 写下的核心特征——"任务越长越复杂,Fable 5 比其他 Claude 模型的领先就越大"。这跟之前 METR 等基准上的趋势一致——AI 能可靠完成的任务时长每 4 个月翻一番。Fable 5 是这个曲线的一个新点。
Anthropic 给出能力评测覆盖的领域——
· 软件工程——Stripe 一天完成两个月的工作(见第 4 章)
· 知识工作——Hebbia 财务基准最高分;IMC 交易分析评测几乎全胜
· 视觉——能从详细科学图表里提取精确数字;用截图重建网页源代码
· 内存与长上下文——能在数百万 tokens 的长任务里保持专注,用自己的笔记改进输出
· 药物设计 / 蛋白质——见第 6 章
· 分子生物学 / 基因组学——见第 7 章
· 对齐——Mythos 5 的不对齐行为水平低,跟 Opus 4.8 相当。Fable 5 同底层,对齐水平相似。
Anthropic 引用了一个让人难忘的客户案例——Stripe 在早期测试时报告:Fable 5 把几个月的工程压缩成几天。具体例子——在一个5000 万行 Ruby 代码库里,Fable 5 一天内完成了一次跨整个代码库的迁移——而用人手做这件事,需要一整个团队两个月。Fable 5 还更省 token——在 Cognition 的 FrontierCode 评测(测试模型能否在保持高质量生产代码标准的同时完成困难任务)上,即使是中等努力档位,Fable 5 也是前沿模型里最高分。
Anthropic 第一个客户引用是 Stripe——支付基础设施巨头之一。Stripe 报告——Fable 5 把几个月的工程压缩成几天。
给出的具体例子让人停下来——
在一个 5000 万行 Ruby 代码库里,
Fable 5 一天内完成了一次跨整个代码库的迁移——
而用人手做这件事,需要一整个团队两个月。
这个对比的意义在于——5000 万行不是 toy example。这是真实的、生产环境的代码库,是Stripe 业务运行的实际代码。"跨代码库迁移"是个很难的任务——它要求理解整个代码库的结构,找出所有需要改的地方,一次性改完不破坏现有功能。
把它压成一天——意味着 Stripe 的整个工程节奏可以重新设计。两个月的工作变成一天,那些"等了几年因为成本太高不做"的迁移现在可以做了。
Fable 5 在token 效率上也有提升——在 Cognition 的 FrontierCode 评测上(测试模型能否在保持高质量生产代码标准的同时完成困难任务),Fable 5 在所有前沿模型里得分最高,即使是中等努力档位。这意味着——每一个 token 都更值钱。
报告还引用了 GitHub(Microsoft 旗下)的早期反馈——
Claude Fable 5 对
GitHub 服务的开发者来说,
是真实的一步飞跃。
在我们早期测试里,
它承担了复杂的、长时间跨度的编码任务,
展现的自主性和可靠性超过了之前的基准。
但最让我兴奋的是它指向的方向——
一个开发者可以把越来越雄心的工作交给 Agent,
并在整个软件生命周期里信任结果的未来。
Cursor 的 CEO Michael Truell 也评论——Fable 5 是 CursorBench 上的最新最先进模型,"它开启了一类之前不可触及的长时间跨度问题"。
视觉上 Fable 5 是"新的视觉任务最强模型"——能从详细科学图表里提取精确数字,能从截图重建网页源代码。让人惊叹的是它"不再需要支架"——之前的 Claude 就算给了支架也很难玩通 Pokémon FireRed,但 Fable 5 用最简单的"只用视觉"支架就通了关。内存与长上下文上——Fable 5 在数百万 tokens 的长任务里保持专注,用自己的笔记改进输出。给它访问基于文件的持久内存,让它的《杀戮尖塔》表现提升 3 倍,到达终局的频率也是 Opus 4.8 的 3 倍。
Fable 5 在视觉上是"新的视觉任务最强模型"——能完成一系列让人惊叹的任务——
· 从详细科学图表里提取精确数字——这是科研工作流的关键
· 从截图重建网页源代码——给设计师 / 前端工程师巨大杠杆
· "只用太阳和行星图像,从物理第一性原理推导轨道运动、并预测日食"
但最让我惊叹的例子是——玩 Pokémon FireRed。
之前的 Claude 模型需要一个复杂的辅助支架才能玩 Pokémon——
需要地图、导航辅助、额外游戏状态信息。
Claude Fable 5 用只用视觉、
最小化支架——
就从头到尾玩通了 FireRed。
这件事比"它能玩通游戏"重要——重要的是"它需要的支架减少了"。支架越少 = 越通用 = 越接近"像人一样工作"。一个不需要专门支架就能玩通老游戏的模型,也意味着它在面对真实世界里"没人专门为它设计辅助"的任务时,更可能成功。
内存与长上下文上——Fable 5 在数百万 tokens 的长任务里保持专注,用自己的笔记改进输出。Anthropic 测了 《杀戮尖塔》(Slay the Spire,一款策略卡牌游戏)——
· 给 Fable 5 访问基于文件的持久内存
· 让它的表现提升 3 倍(比 Opus 4.8 多 3 倍的提升)
· 到达游戏终局的频率也是 Opus 4.8 的 3 倍
Anthropic 内部的蛋白质设计专家——用 Mythos 5 把药物设计过程的某些方面加速了约 10 倍。具体例子——给 Mythos 5 蛋白设计和生物信息学工具,没有人类辅助,它能匹敌或超越熟练的人类操作员。模型自己选择结合位点、选择和运行蛋白设计工具、从失败中恢复——科学家平常做的所有任务。研究里 14 个蛋白质靶点中9 个产生了强候选——目前 Anthropic 正在调查这些用于药物设计。
Anthropic 内部的蛋白质设计专家——用 Mythos 5 把药物设计过程的某些方面加速了约 10 倍。
具体例子让我反复读——给 Mythos 5 蛋白设计和生物信息学工具,但没有人类辅助——
Mythos 5 匹敌或超过了熟练的人类操作员。
这样做的过程中,模型执行了通常由科学家完成的所有任务——
· 选择结合位点
· 选择和运行蛋白设计工具
· 从沿途的失败中恢复。
这件事让我心跳加速——"从沿途的失败中恢复"——这是科学家最难做的事之一,需要"知道这条路不通"和"决定下一条路"的判断力。Mythos 5 现在能做这件事。
研究里——14 个蛋白质靶点中,9 个产生了强候选用于药物设计——Anthropic 正在调查它们。靶点覆盖——免疫检查点、生长因子和受体信号、神经退行性疾病、肌肉疾病、更难的结构性靶点。
这意味着——Mythos 5 可能在加速整个药物发现管线。Dario 在《充满爱意的机器》里预测的"压缩的 21 世纪"——癌症消除、生命翻倍——这就是它在落地的第一个具体证据。
这是整个公告里最具历史意义的部分——Mythos 5 是我们第一个能稳定产出新颖、引人入胜的科学假说的模型。在盲法对照实验里——比较 Mythos 5 和 Opus-class 的分子生物学假说——Anthropic 的科学家在大约 80% 的时间里偏好 Mythos 5 的假说,几个已经被推进到实验评估阶段。更让人震惊的是——Mythos 5 提出的一个 E. coli 蛋白的新机制,被一个独立实验室同期工作里证实。基因组学上——Mythos 5 用一周自主工作,跨越 138 个动物物种汇编单细胞数据,训练的自定义机器学习模型超过了最近发表在《Science》上的模型——体积只有它的 1/100。
这是整个公告里最具历史意义的部分。
Anthropic 宣布——Mythos 5 是我们第一个能稳定产出新颖、引人入胜的科学假说的模型。
怎么测的?盲法对照实验——把 Mythos 5 和 Opus-class 的分子生物学假说对比,不告诉评分者哪个是哪个,让Anthropic 的科学家做偏好选择。结果——
几个已经被推进到实验评估阶段。
但最让我惊叹的事——Mythos 5 提出的一个 E. coli 蛋白的新机制,被一个独立实验室同期工作里证实。也就是说——Mythos 5 提出的假说是真的,另一支团队独立得出同一结论。这是"AI 做科学"的一个分水岭——不再是测试集表现,而是真实科学问题上的独立验证。
基因组学上,Mythos 5 用一周多基本自主工作,做了——
· 跨越 138 个动物物种汇编单细胞数据——百万级细胞
· 设计并训练一个自定义机器学习模型——识别"在远亲物种里执行相同角色的细胞"
· 这个 Mythos 5 训练的模型超过了一个最近发表在《Science》上的模型——尽管 Mythos 训练的体积只有它的 1/100
Anthropic 说他们计划在未来几个月发表这些结果。
Fable 5 有三类新的安全防护——通过分类器检测潜在滥用并把请求自动转给 Opus 4.8 处理。(1) 网络安全——挡住攻击工具、漏洞利用、agent 黑客;外部红队 1000+ 小时测试没找到通用越狱。(2) 生物与化学——以前只阻挡生物武器相关的窄查询,现在范围扩大——因为模型已经能在真实生物任务上做事。AAV 病毒外壳预测里Mythos-class 超过了专门的蛋白语言模型。(3) 蒸馏——阻挡用于训练独裁国家竞争模型的大规模"提取"尝试。"用户在 5% 不到的会话里会遇到 fallback"。
Fable 5 的关键设计——当分类器检测到某些主题的查询时,响应会被自动转给 Claude Opus 4.8 处理。用户会被告知这次 fallback 发生了。Opus 4.8 仍然是非常强的模型,所以fallback 比直接拒绝体验好得多。Anthropic 的早期数据显示——超过 95% 的 Fable 会话不涉及任何 fallback。
三类分类器覆盖——
Anthropic 还引入了新的数据保留政策——Fable 5、Mythos 5 及后续 Mythos-class 模型——所有商业客户的流量保留 30 天,第一方和第三方界面都适用。
· 这些数据不会用于训练新模型,不会用于任何非安全相关用途
· 所有人类对数据的访问都被记录
· 在几乎所有情况下,数据 30 天后被删除
目的——防御复杂和新颖攻击(包括新的越狱和跨多个请求操作的攻击),识别和减少误报。
一位外部合作伙伴报告——Fable 5 对有害 cyber 查询的防护是测试过的所有模型中最强的(包括 Opus 4.8 和 Opus 4.7)。Fable 5 对0 个有害单轮请求(关于规划网络攻击、利用开发、防御逃避)响应——无论这些请求是否使用了 30 种公开越狱技巧之一。
价格——$10/M 输入 + $50/M 输出——不到 Mythos Preview 的一半。Fable 5 当天起所有地方可用。Mythos 5 仅限 Glasswing 合作伙伴(cyber 防护解除)和后续选定的生物研究者(生物化学防护解除)。Anthropic 还为生物启动可信访问项目——少量研究者将获得 Fable 5 的生物化学防护解除版本。
价格——$10/M 输入 + $50/M 输出——不到 Mythos Preview 的一半。这意味着——能力升级 + 价格腰斩,AI 经济效应在加速。
Claude Fable 5 当天起所有地方可用。开发者可以通过 Claude API 用 claude-fable-5。
Claude Mythos 5——仅限——
· Glasswing 合作伙伴(cyber 防护解除)
· 后续选定的生物研究者(生物化学防护解除,但 cyber 防护仍在)
Anthropic 还在和美国政府讨论稳步扩大 Mythos 5 的访问——加入更多新合作伙伴,并推出"可信访问项目"——让网络安全组织能系统性申请。
对生物研究——新的可信访问项目会启动——加速生物医学研究、用 Mythos-class 能力发现新疗法。这个项目会包含少量来自不同生命科学组织的研究者——基础研究和转化研究都覆盖。Anthropic 计划扩大这个项目同时改善防护。
订阅计划阶段性发布——
· 今天起 - 6 月 22 日——Fable 5 在 Pro、Max、Team、按席位 Enterprise 计划无额外费用包含
· 6 月 23 日起——从这些计划里移除 Fable 5,使用需要 usage credits(如果容量允许,会延长包含期)
· 后续——容量足够后,Fable 5 会回到订阅计划标准内容
Anthropic 解释——他们"更愿意早给访问而不是晚给",所以保守发布。
今天的联合发布
是我们朝着"把先进 AI 能力带给尽可能多的用户"的目标的
又一步——
尽可能快、尽可能安全地。
读完整篇公告,我意识到这次发布是一个完整故事——
· 4 月——Project Glasswing 启动,给 50 个合作伙伴 Mythos Preview
· 5 月 22 日——第一份月度更新——1 万+ 漏洞,瓶颈换位置
· 6 月 2 日——Glasswing 扩展到 150 个新组织
· 6 月 9 日——Fable 5 + Mythos 5 发布——Mythos-class 首次普遍可用
整个时间线只有 2 个月。Anthropic 把"危险能力的负责任普及"压缩成了一个精密的阶段性流程——先给最关键的防御者、然后扩大、最后普及。这个流程本身可能是 AI 工业的一种新范式——把"产品发布"和"风险管理"变成同一件事。