ANTHROPIC · 2026/06/09

Claude Fable 5 与 Mythos 5
同一个模型的双胞胎

Claude Fable 5 and Claude Mythos 5 · Curated Chinese Edition

Anthropic 公告 · 2026/06/09 中文精校版 9 章 · 约 35 分钟阅读

📋 内容摘要

2026 年 6 月 9 日，Anthropic 发布 Claude Fable 5 和 Claude Mythos 5——同一个 Mythos-class 底层模型的两个版本。Fable 5——加了安全防护，面向所有用户。Mythos 5——同样底层，去掉部分防护，只给 Glasswing 合作伙伴和受信任的研究者。Fable 5 的能力超过 Anthropic 此前任何普遍发布的模型。Stripe 用 Fable 5 一天完成 5000 万行 Ruby 代码迁移——本来需要团队两个月。Mythos 5 加速药物设计 10 倍，第一次稳定产出"被科学家盲评偏好 80% 时间"的新生物学假说，并独立提出一个 E. coli 蛋白机制——被另一个独立实验室同期验证。价格——$10/M 输入 + $50/M 输出，是 Mythos Preview 的一半不到。本文是这次发布的中文精校版。

章节目录

引言 · Mythos-class 进入普遍发布
Mythos-class goes general
Fable 与 Mythos · 名字与设计
Naming the twins
能力综述 · 长任务的飞跃
Capabilities summary
软件工程 · Stripe 一天 vs 两个月
A day vs two months
视觉、内存、玩游戏 · 突破性
Vision, memory, gameplay
药物设计 · 10 倍加速
10x in drug design
分子生物学 · 提出新假说
Novel hypotheses
三类安全防护 · 网络、生物、蒸馏
Three safeguards
可用性与定价 · 阶段性发布
Pricing and availability

CHAPTER 01 · INTRODUCTION

引言 · Mythos-class 进入普遍发布

Mythos-class goes general

📌 本节核心要点

2026 年 6 月 9 日，Anthropic 发布 Claude Fable 5 和 Claude Mythos 5。这是 Mythos-class（位于 Opus class 之上的能力等级）第一次以普遍发布的形式向公众开放——一个 4 月通过 Project Glasswing 才向 50 个合作伙伴开放的能力等级，2 个月后就有了"带保护的版本"可以给所有人用。Fable 5——加了完整防护，所有人可用。Mythos 5——同样底层，部分防护被解除，只给 Glasswing 合作伙伴和受信任研究者。价格是 Mythos Preview 的一半不到——$10/M 输入 + $50/M 输出。

Mythos-class General Release $10/$50 per Million 95% no Fallback

2026 年 6 月 9 日，Anthropic 发布 Claude Fable 5——一款"能安全地用于普遍发布"的 Mythos-class 模型。

Anthropic 写道——Fable 5 的能力超过我们普遍发布过的任何模型。它在几乎所有 AI 能力基准上是最新最先进——展现在软件工程、知识工作、视觉、科学研究等多领域例外的性能。任务越长越复杂，Fable 5 比其他 Claude 模型的领先就越大。

Anthropic 同时毫不掩饰地承认——"发布这种能力的模型伴随着风险"。没有防护的话，Fable 5 在网络安全等领域的能力可能被滥用造成严重损害。所以他们用"防护"启动模型——对某些主题的查询，会被自动转给次强的 Claude Opus 4.8 来回答。

为了能同时又安全又快地发布——Anthropic 把防护调得保守。这意味着有时候无害的请求也会被拦截——但平均下来，少于 5% 的会话会触发防护。

对一小群网络防御者和基础设施提供商，Anthropic 同时发布 Claude Mythos 5——跟 Fable 5 是同一个底层模型，但部分领域防护被解除。Mythos 5 通过 Project Glasswing 部署——和美国政府合作——作为 Mythos Preview 的升级版。它有世界上任何模型中最强的网络安全能力。

价格——$10/M 输入 + $50/M 输出——不到 Mythos Preview 的一半。

广哥在硅谷◆ ◆ ◆

CHAPTER 02 · NAMING

Fable 与 Mythos · 名字与设计

Naming the twins

📌 本节核心要点

"Fable" 源自拉丁文 fabula——"被讲述的东西"——和希腊词 Mythos 同源。同一个故事，两种讲法——一种带保护、一种不带。Anthropic 用两个不同名字来明确区分——保护机制是两者唯一的区别。这是一个很重要的产品设计哲学——承认能力本身是中性的，"是否有保护"决定了它该被给谁用。这也是 Anthropic 对自己 RSP（Responsible Scaling Policy）的具体应用——在能力上不让步，在分发上做选择。

Anthropic 在脚注里解释了这两个名字的来源——

"Fable" 源自拉丁文 fabula——
"被讲述的东西"——
与希腊词 Mythos 同源。

是保护机制区分了 Fable 和 Mythos——
这就是我们给它们不同名字的原因。

— ANTHROPIC, ON THE NAMES

这是 Anthropic 一次很有意思的产品设计选择。

过去 OpenAI、Google 等都用版本号或后缀区分不同能力等级（GPT-4o、Gemini 1.5 Pro 等）。Anthropic 用不同名字来表示——同一个底层模型，但分发策略不同。

这个选择背后的哲学——"能力本身是中性的"——一段 Mythos 级别的网络安全能力，对防御者是工具，对攻击者是武器。所以关键的产品决定是"给谁用"，而不只是"做多强"。

这也是 Anthropic 自己的 RSP（Responsible Scaling Policy）的具体落地——在能力上不让步，在分发上做选择。

广哥在硅谷◆ ◆ ◆

CHAPTER 03 · CAPABILITIES

能力综述 · 长任务的飞跃

Capabilities summary

📌 本节核心要点

Fable 5 和 Mythos 5 在"自主长任务"上比之前所有 Claude 模型走得更远。任务越长越复杂，它们的领先就越大。Anthropic 的能力评测覆盖软件工程、知识工作、视觉、内存与长上下文、药物设计、新假说、基因组学。一项重要观察——对齐评测里，Mythos 5 的不对齐行为水平很低，跟 Opus 4.8 相当。Fable 5 是同一底层，对齐水平也相似。

这一节给出一个让人记下的事实——Fable 5 和 Mythos 5 比此前所有 Claude 模型自主工作的时间都长。

Anthropic 写下的核心特征——"任务越长越复杂，Fable 5 比其他 Claude 模型的领先就越大"。这跟之前 METR 等基准上的趋势一致——AI 能可靠完成的任务时长每 4 个月翻一番。Fable 5 是这个曲线的一个新点。

Anthropic 给出能力评测覆盖的领域——

· 软件工程——Stripe 一天完成两个月的工作（见第 4 章）
· 知识工作——Hebbia 财务基准最高分；IMC 交易分析评测几乎全胜
· 视觉——能从详细科学图表里提取精确数字；用截图重建网页源代码
· 内存与长上下文——能在数百万 tokens 的长任务里保持专注，用自己的笔记改进输出
· 药物设计 / 蛋白质——见第 6 章
· 分子生物学 / 基因组学——见第 7 章
· 对齐——Mythos 5 的不对齐行为水平低，跟 Opus 4.8 相当。Fable 5 同底层，对齐水平相似。

广哥在硅谷◆ ◆ ◆

CHAPTER 04 · STRIPE

软件工程 · Stripe 一天 vs 两个月

A day vs two months

📌 本节核心要点

Anthropic 引用了一个让人难忘的客户案例——Stripe 在早期测试时报告：Fable 5 把几个月的工程压缩成几天。具体例子——在一个5000 万行 Ruby 代码库里，Fable 5 一天内完成了一次跨整个代码库的迁移——而用人手做这件事，需要一整个团队两个月。Fable 5 还更省 token——在 Cognition 的 FrontierCode 评测（测试模型能否在保持高质量生产代码标准的同时完成困难任务）上，即使是中等努力档位，Fable 5 也是前沿模型里最高分。

Stripe 50M Lines 1 Day vs 2 Months FrontierCode #1

Anthropic 第一个客户引用是 Stripe——支付基础设施巨头之一。Stripe 报告——Fable 5 把几个月的工程压缩成几天。

给出的具体例子让人停下来——

在一个 5000 万行 Ruby 代码库里，
Fable 5 一天内完成了一次跨整个代码库的迁移——

而用人手做这件事，需要一整个团队两个月。

— STRIPE'S EARLY TESTING, FEATURED BY ANTHROPIC

这个对比的意义在于——5000 万行不是 toy example。这是真实的、生产环境的代码库，是Stripe 业务运行的实际代码。"跨代码库迁移"是个很难的任务——它要求理解整个代码库的结构，找出所有需要改的地方，一次性改完不破坏现有功能。

把它压成一天——意味着 Stripe 的整个工程节奏可以重新设计。两个月的工作变成一天，那些"等了几年因为成本太高不做"的迁移现在可以做了。

Fable 5 在token 效率上也有提升——在 Cognition 的 FrontierCode 评测上（测试模型能否在保持高质量生产代码标准的同时完成困难任务），Fable 5 在所有前沿模型里得分最高，即使是中等努力档位。这意味着——每一个 token 都更值钱。

报告还引用了 GitHub（Microsoft 旗下）的早期反馈——

Claude Fable 5 对
GitHub 服务的开发者来说，
是真实的一步飞跃。

在我们早期测试里，
它承担了复杂的、长时间跨度的编码任务，
展现的自主性和可靠性超过了之前的基准。

但最让我兴奋的是它指向的方向——
一个开发者可以把越来越雄心的工作交给 Agent，
并在整个软件生命周期里信任结果的未来。

— MARIO RODRIGUEZ, CHIEF PRODUCT OFFICER, GITHUB

Cursor 的 CEO Michael Truell 也评论——Fable 5 是 CursorBench 上的最新最先进模型，"它开启了一类之前不可触及的长时间跨度问题"。

广哥在硅谷◆ ◆ ◆

CHAPTER 05 · VISION & MEMORY

视觉、内存、玩游戏 · 突破性

Vision, memory, gameplay

📌 本节核心要点

视觉上 Fable 5 是"新的视觉任务最强模型"——能从详细科学图表里提取精确数字，能从截图重建网页源代码。让人惊叹的是它"不再需要支架"——之前的 Claude 就算给了支架也很难玩通 Pokémon FireRed，但 Fable 5 用最简单的"只用视觉"支架就通了关。内存与长上下文上——Fable 5 在数百万 tokens 的长任务里保持专注，用自己的笔记改进输出。给它访问基于文件的持久内存，让它的《杀戮尖塔》表现提升 3 倍，到达终局的频率也是 Opus 4.8 的 3 倍。

Fable 5 在视觉上是"新的视觉任务最强模型"——能完成一系列让人惊叹的任务——

· 从详细科学图表里提取精确数字——这是科研工作流的关键
· 从截图重建网页源代码——给设计师 / 前端工程师巨大杠杆
· "只用太阳和行星图像，从物理第一性原理推导轨道运动、并预测日食"

但最让我惊叹的例子是——玩 Pokémon FireRed。

之前的 Claude 模型需要一个复杂的辅助支架才能玩 Pokémon——
需要地图、导航辅助、额外游戏状态信息。

Claude Fable 5 用只用视觉、
最小化支架——
就从头到尾玩通了 FireRed。

— ANTHROPIC, ON FABLE 5 PLAYING POKEMON

这件事比"它能玩通游戏"重要——重要的是"它需要的支架减少了"。支架越少 = 越通用 = 越接近"像人一样工作"。一个不需要专门支架就能玩通老游戏的模型，也意味着它在面对真实世界里"没人专门为它设计辅助"的任务时，更可能成功。

内存与长上下文上——Fable 5 在数百万 tokens 的长任务里保持专注，用自己的笔记改进输出。Anthropic 测了 《杀戮尖塔》（Slay the Spire，一款策略卡牌游戏）——

· 给 Fable 5 访问基于文件的持久内存
· 让它的表现提升 3 倍（比 Opus 4.8 多 3 倍的提升）
· 到达游戏终局的频率也是 Opus 4.8 的 3 倍

广哥在硅谷◆ ◆ ◆

CHAPTER 06 · DRUG DESIGN

药物设计 · 10 倍加速

10x in drug design

📌 本节核心要点

Anthropic 内部的蛋白质设计专家——用 Mythos 5 把药物设计过程的某些方面加速了约 10 倍。具体例子——给 Mythos 5 蛋白设计和生物信息学工具，没有人类辅助，它能匹敌或超越熟练的人类操作员。模型自己选择结合位点、选择和运行蛋白设计工具、从失败中恢复——科学家平常做的所有任务。研究里 14 个蛋白质靶点中9 个产生了强候选——目前 Anthropic 正在调查这些用于药物设计。

10x Drug Design 9/14 Strong Candidates

Anthropic 内部的蛋白质设计专家——用 Mythos 5 把药物设计过程的某些方面加速了约 10 倍。

具体例子让我反复读——给 Mythos 5 蛋白设计和生物信息学工具，但没有人类辅助——

Mythos 5 匹敌或超过了熟练的人类操作员。

这样做的过程中，模型执行了通常由科学家完成的所有任务——

· 选择结合位点
· 选择和运行蛋白设计工具
· 从沿途的失败中恢复。

— ANTHROPIC, ON MYTHOS 5 IN PROTEIN DESIGN

这件事让我心跳加速——"从沿途的失败中恢复"——这是科学家最难做的事之一，需要"知道这条路不通"和"决定下一条路"的判断力。Mythos 5 现在能做这件事。

研究里——14 个蛋白质靶点中，9 个产生了强候选用于药物设计——Anthropic 正在调查它们。靶点覆盖——免疫检查点、生长因子和受体信号、神经退行性疾病、肌肉疾病、更难的结构性靶点。

这意味着——Mythos 5 可能在加速整个药物发现管线。Dario 在《充满爱意的机器》里预测的"压缩的 21 世纪"——癌症消除、生命翻倍——这就是它在落地的第一个具体证据。

广哥在硅谷◆ ◆ ◆

CHAPTER 07 · NOVEL HYPOTHESES

分子生物学 · 提出新假说

Novel hypotheses

📌 本节核心要点

这是整个公告里最具历史意义的部分——Mythos 5 是我们第一个能稳定产出新颖、引人入胜的科学假说的模型。在盲法对照实验里——比较 Mythos 5 和 Opus-class 的分子生物学假说——Anthropic 的科学家在大约 80% 的时间里偏好 Mythos 5 的假说，几个已经被推进到实验评估阶段。更让人震惊的是——Mythos 5 提出的一个 E. coli 蛋白的新机制，被一个独立实验室同期工作里证实。基因组学上——Mythos 5 用一周自主工作，跨越 138 个动物物种汇编单细胞数据，训练的自定义机器学习模型超过了最近发表在《Science》上的模型——体积只有它的 1/100。

80% Preferred E. coli Validated 138 Species 100x Smaller

这是整个公告里最具历史意义的部分。

Anthropic 宣布——Mythos 5 是我们第一个能稳定产出新颖、引人入胜的科学假说的模型。

怎么测的？盲法对照实验——把 Mythos 5 和 Opus-class 的分子生物学假说对比，不告诉评分者哪个是哪个，让Anthropic 的科学家做偏好选择。结果——

80%

盲法测试中科学家
偏好 Mythos 5 假说

独立验证

E. coli 蛋白机制
被独立实验室证实

138 物种

基因组学项目
跨物种细胞分析

100x 小

模型比《Science》对照
体积小 100 倍

几个已经被推进到实验评估阶段。

但最让我惊叹的事——Mythos 5 提出的一个 E. coli 蛋白的新机制，被一个独立实验室同期工作里证实。也就是说——Mythos 5 提出的假说是真的，另一支团队独立得出同一结论。这是"AI 做科学"的一个分水岭——不再是测试集表现，而是真实科学问题上的独立验证。

基因组学上，Mythos 5 用一周多基本自主工作，做了——

· 跨越 138 个动物物种汇编单细胞数据——百万级细胞
· 设计并训练一个自定义机器学习模型——识别"在远亲物种里执行相同角色的细胞"
· 这个 Mythos 5 训练的模型超过了一个最近发表在《Science》上的模型——尽管 Mythos 训练的体积只有它的 1/100

Anthropic 说他们计划在未来几个月发表这些结果。

广哥在硅谷◆ ◆ ◆

CHAPTER 08 · SAFEGUARDS

三类安全防护 · 网络、生物、蒸馏

Three safeguards

📌 本节核心要点

Fable 5 有三类新的安全防护——通过分类器检测潜在滥用并把请求自动转给 Opus 4.8 处理。(1) 网络安全——挡住攻击工具、漏洞利用、agent 黑客；外部红队 1000+ 小时测试没找到通用越狱。(2) 生物与化学——以前只阻挡生物武器相关的窄查询，现在范围扩大——因为模型已经能在真实生物任务上做事。AAV 病毒外壳预测里Mythos-class 超过了专门的蛋白语言模型。(3) 蒸馏——阻挡用于训练独裁国家竞争模型的大规模"提取"尝试。"用户在 5% 不到的会话里会遇到 fallback"。

Classifiers Cyber / Bio / Distillation 95% No Fallback 1000+ Hours Red Team

Fable 5 的关键设计——当分类器检测到某些主题的查询时，响应会被自动转给 Claude Opus 4.8 处理。用户会被告知这次 fallback 发生了。Opus 4.8 仍然是非常强的模型，所以fallback 比直接拒绝体验好得多。Anthropic 的早期数据显示——超过 95% 的 Fable 会话不涉及任何 fallback。

三类分类器覆盖——

🛡️ 三类安全分类器

(1) 网络安全——Mythos-class 模型擅长发现和利用软件漏洞。它们让网络攻击大幅变便宜、变容易。Mythos-class 还展现强烈的"agentic hacking"能力——在侦察、发现、横向移动等多个阶段操作。分类器同时覆盖"利用"和更广泛的"攻击性 cyber 任务"。外部红队 1000+ 小时测试没找到通用越狱。UK AISI 在初始测试窗内取得一些进展，但还没有完全的通用越狱。
(2) 生物与化学——以前只阻挡窄范围的生物武器相关查询。现在范围扩大，因为两个原因——(a) 对资源丰富的恶意行为者从模型得到"提升"的担心，(b) 模型现在能在真实生物任务上做事。例子——AAV 病毒外壳预测里，Mythos-class 超过了专门设计的蛋白语言模型——展示了基因治疗研发的潜力，也展示了双重用途的风险。当前 Fable 在大多数生物化学请求上 fallback 到 Opus 4.8——后续会收窄。
(3) 蒸馏——Anthropic 已经识别到大规模"蒸馏"Claude 能力的尝试，用来在独裁国家训练竞争模型。Fable 5 的能力被蒸馏可能间接导致近前沿能力扩散——而这些可能在没有合适保护下发布。被识别为蒸馏尝试的请求fallback 到 Opus 4.8。

Anthropic 还引入了新的数据保留政策——Fable 5、Mythos 5 及后续 Mythos-class 模型——所有商业客户的流量保留 30 天，第一方和第三方界面都适用。

· 这些数据不会用于训练新模型，不会用于任何非安全相关用途
· 所有人类对数据的访问都被记录
· 在几乎所有情况下，数据 30 天后被删除

目的——防御复杂和新颖攻击（包括新的越狱和跨多个请求操作的攻击），识别和减少误报。

一位外部合作伙伴报告——Fable 5 对有害 cyber 查询的防护是测试过的所有模型中最强的（包括 Opus 4.8 和 Opus 4.7）。Fable 5 对0 个有害单轮请求（关于规划网络攻击、利用开发、防御逃避）响应——无论这些请求是否使用了 30 种公开越狱技巧之一。

广哥在硅谷◆ ◆ ◆

CHAPTER 09 · AVAILABILITY

可用性与定价 · 阶段性发布

Pricing and availability

📌 本节核心要点

价格——$10/M 输入 + $50/M 输出——不到 Mythos Preview 的一半。Fable 5 当天起所有地方可用。Mythos 5 仅限 Glasswing 合作伙伴（cyber 防护解除）和后续选定的生物研究者（生物化学防护解除）。Anthropic 还为生物启动可信访问项目——少量研究者将获得 Fable 5 的生物化学防护解除版本。

$10 / $50 per Million Pro / Max / Team Plans Trusted Access Program

价格——$10/M 输入 + $50/M 输出——不到 Mythos Preview 的一半。这意味着——能力升级 + 价格腰斩，AI 经济效应在加速。

Claude Fable 5 当天起所有地方可用。开发者可以通过 Claude API 用 claude-fable-5。

Claude Mythos 5——仅限——

· Glasswing 合作伙伴（cyber 防护解除）
· 后续选定的生物研究者（生物化学防护解除，但 cyber 防护仍在）

Anthropic 还在和美国政府讨论稳步扩大 Mythos 5 的访问——加入更多新合作伙伴，并推出"可信访问项目"——让网络安全组织能系统性申请。

对生物研究——新的可信访问项目会启动——加速生物医学研究、用 Mythos-class 能力发现新疗法。这个项目会包含少量来自不同生命科学组织的研究者——基础研究和转化研究都覆盖。Anthropic 计划扩大这个项目同时改善防护。

订阅计划阶段性发布——

· 今天起 - 6 月 22 日——Fable 5 在 Pro、Max、Team、按席位 Enterprise 计划无额外费用包含
· 6 月 23 日起——从这些计划里移除 Fable 5，使用需要 usage credits（如果容量允许，会延长包含期）
· 后续——容量足够后，Fable 5 会回到订阅计划标准内容

Anthropic 解释——他们"更愿意早给访问而不是晚给"，所以保守发布。

今天的联合发布
是我们朝着"把先进 AI 能力带给尽可能多的用户"的目标的
又一步——

尽可能快、尽可能安全地。

— ANTHROPIC, 2026/06/09

读完整篇公告，我意识到这次发布是一个完整故事——

· 4 月——Project Glasswing 启动，给 50 个合作伙伴 Mythos Preview
· 5 月 22 日——第一份月度更新——1 万+ 漏洞，瓶颈换位置
· 6 月 2 日——Glasswing 扩展到 150 个新组织
· 6 月 9 日——Fable 5 + Mythos 5 发布——Mythos-class 首次普遍可用

整个时间线只有 2 个月。Anthropic 把"危险能力的负责任普及"压缩成了一个精密的阶段性流程——先给最关键的防御者、然后扩大、最后普及。这个流程本身可能是 AI 工业的一种新范式——把"产品发布"和"风险管理"变成同一件事。

Claude Fable 5 与 Mythos 5同一个模型的双胞胎

引言 · Mythos-class 进入普遍发布

Fable 与 Mythos · 名字与设计

能力综述 · 长任务的飞跃

软件工程 · Stripe 一天 vs 两个月

视觉、内存、玩游戏 · 突破性

药物设计 · 10 倍加速

分子生物学 · 提出新假说

三类安全防护 · 网络、生物、蒸馏

可用性与定价 · 阶段性发布

Claude Fable 5 与 Mythos 5
同一个模型的双胞胎