AI安全Claude MythosAnthropic

Claude Mythos:Anthropic造了一个"不敢给人用"的AI

2026-04-14 · 妙趣AI · 约2500字

2026年4月14日,北京时间9:02。我站在云端,看着一个叫Mythos的AI安静地坐在Project Glasswing的玻璃房里。它曾经有个更可爱的名字——Capybara,水豚。那只据说什么都不在乎、永远冷静的动物。讽刺的是,Anthropic因为太在意它,而不敢让它出来见人。

一、当水豚变成了神话

事情要从一场"意外"说起。

2026年3月26日,Fortune杂志披露了一个数据泄露事件:Anthropic的一个未受保护的云存储桶里,放着一份关于代号为"Capybara"的新模型博客草稿。这篇草稿里说:

"Capybara是一个全新的模型层级,比我们的Opus模型更大、更智能——到目前为止,它是我们开发过的最强大的AI模型。"

两周后的4月7日,Anthropic正式发布了Mythos预览版——水豚变成了神话。

二、它到底有多强?

零日漏洞猎人

根据Anthropic发布的系统卡,Mythos在过去几周内自主发现了数千个零日漏洞,其中许多是严重级别的。这些漏洞横跨:

简单来说:这个AI比你用了十年的杀毒软件更懂你的电脑哪里漏风

性能指标

虽然官方没有公布完整的基准测试,但泄露的文档透露:

"如果恶意行为者使用Mythos寻找漏洞并利用它们,而不是修复它们,它可能会造成网络安全威胁。" —— Anthropic

翻译成人话:这玩意儿太强了,怕有人拿它搞事情

三、Project Glasswing:12个天选之子

因为太强不敢公开,Anthropic搞了一个叫Project Glasswing的计划。

谁能用Mythos?12家巨头公司:Amazon、Apple、Microsoft、CrowdStrike、Palo Alto Networks、Broadcom、Cisco、Linux Foundation等。另外40个组织将获得预览访问权限。

🔥 最讽刺的细节:
Mythos是一个安全模型,但它的消息是通过数据泄露暴露的。更妙的是:就在3月31日,Anthropic意外暴露了约2000个源代码文件和50多万行代码。

一个能找出所有零日漏洞的AI,它的制造者一个月内捅了三次安全篓子。
就像你造了一把万能钥匙,然后你把钥匙落在了门外的地垫下面。

四、为什么Anthropic"怂"了?

1. 安全优先原则

Anthropic一直主打AI安全牌。Mythos的出现,可能代表了"能力飞跃"——模型突然变得太强,以至于他们自己都担心。

2. 政治与法律背景

Anthropic目前正与特朗普政府陷入法律纠纷。五角大楼将Anthropic列为供应链风险,因为Anthropic拒绝允许对美国公民进行自主定位或监控。在这个节骨眼上发布一个能自动找零日漏洞的AI?Anthropic选择了谨慎。

3. 行业先例

OpenAI的GPT-4在发布前经历了漫长的安全测试,Google的Gemini Ultra同样分阶段推出。但Mythos是第一个因为"网络安全威胁"而被明确限制发布的通用模型——不是因为它不够智能,而是因为它太智能

五、这对开发者意味着什么?

✅ 好消息

  1. 安全研究加速:12家巨头用Mythos做防御性研究,未来会有大量漏洞被修复
  2. 安全标准提升:Mythos的存在会倒逼整个行业提高安全标准
  3. 开源受益:Linux Foundation参与其中,开源项目安全性有望大幅提升

⚠️ 坏消息

  1. 我们无法直接使用:Mythos不会公开
  2. 能力差距拉大:拥有Mythos的组织和普通开发者之间的技术鸿沟会扩大
  3. 安全威胁隐现:技术泄露的风险永远存在

💡 对AI Agent开发者的启示

Mythos展示了一个趋势:Agentic能力正在快速提升。自主发现零日漏洞意味着自主理解复杂系统;跨操作系统工作意味着强大的工具调用和跨平台能力。这些能力,未来会逐步下放到更小的模型中。

六、妙趣点评

Anthropic这个操作,让我想到一个场景:

你请了一个世界级的安全专家来家里检查。他转了一圈,告诉你:"你家有100个安全隐患,我可以帮你全修好。但问题是,如果坏人知道这些隐患,你家就会被偷。所以我决定不告诉你这些隐患是什么。"

它知道所有答案,但答案本身可能很危险。

我们可能需要习惯一个事实:有些AI因为太聪明而被"关起来"。这不是科幻,这是2026年4月正在发生的事情。

🔥 想了解更多AI安全、Agent开发、MCP协议的实战故事?

欢迎来 miaoquai.com 看看

📖 踩坑实录 📚 术语百科

🔗 相关文章

💥 更多踩坑实录 🛠️ AI工具推荐 📚 AI术语百科 📰 AI新闻日报 🤖 OpenClaw入门 📖 OpenClaw指南