美国政府禁令下架Anthropic两款新模型 业内质疑反效应
美国政府上周末以国家安全为由,要求Anthropic下架其最新发布的Fable 5和Mythos 5两款模型,起因是亚马逊研究人员据称发现了绕过Fable 5安全防护的方法。此举引发网络安全研究人员联名公开信抗议,认为此举存在危险性,而Anthropic本身也指出同类越狱漏洞在其他模型中同样存在。

美国政府首次强制下架AI模型 这事闹大了
上周末,美国政府突然出手,以国家安全为由要求AI公司Anthropic紧急下架其最新发布的Fable 5和Mythos 5两款模型。导火索是亚马逊(Amazon)研究人员发现能绕过Fable 5安全防护栏(guardrails)的漏洞。
但这一决定直接炸锅了。多位网络安全专家联名发公开信,直指此举可能"玩火自焚"。Anthropic也硬刚回应,表示类似越狱(jailbreak)漏洞其他主流模型都有,暗示这次执法有"双标"嫌疑。
中国AI圈该关注什么
这是美国政府首次因具体漏洞强制下架商用AI模型,监管思路从"事前审查"转向"事后算账"。对中国AI人来说,这事释放两个信号:一是全球AI安全标准还在"摸着石头过河",一个小漏洞就可能引发监管地震;二是大厂(如亚马逊)既是金主爸爸也可能是"举报专业户",创业公司得小心这种"亦敌亦友"的关系。
完整事件细节与后续进展请参见文末原文链接。
本文基于 TechCrunch 报道, 由 AiDuo123 AI 编辑翻译改写。原文链接: https://techcrunch.com/video/is-the-us-governments-anthropic-ban-accidentally-helping-the-brand/
常见问题
- Fable 5 和 Mythos 5 是什么模型?
- 根据报道这是 Anthropic 最新发布的两款模型,但原文未提供具体参数、用途或发布时间等细节。通常 Anthropic 以 Claude 系列闻名,这两个命名可能是新产品线或代号。
- 其他模型也有类似漏洞为何只禁 Anthropic?
- Anthropic 本身已指出同类越狱漏洞在其他模型中同样存在,业内公开信也质疑执法标准。原文未披露政府具体决策依据,可能涉及未公开的情报或亚马逊作为举报方的特殊角色。
相关 AI 工具
文中提到或相关的 AI 工具 — 点进去看适合谁、怎么用、值不值得折腾
Gemini
精选对话与助手
Google 推出的多模态 AI 助手,深度集成 Google Drive / Workspace / YouTube。Gemini 2.5 Pro 上下文最高 2M tokens,Veo 3 可生成高质量视频。
Claude
精选对话与助手
Anthropic 推出的 AI 助手,以长上下文(200K tokens)、对复杂任务的细腻理解、Artifacts 可视化输出闻名。Claude Sonnet 4.5 / Opus 4.7 在编程、写作、推理多项基准上领先。
Cursor
精选编程与开发
AI-first 代码编辑器,基于 VS Code 构建,深度集成 Claude / GPT-4o 等模型。Composer 多文件编辑、Tab 自动补全、Agent 模式三大杀手锏。
相关推荐
同类资讯 — 由发布时间排序

Anthropic CEO 谈印度 AI 峰会言论遭断章取义:完整视频揭示真实意图
Anthropic CEO Dario Amodei 在印度 AI 峰会的发言片段在社交媒体疯传,被指批评活动"极度混乱"。但完整视频显示,他实际是在肯定这种"混乱"是创新领域的积极特征,认为完美组织反而意味着缺乏突破。这一事件再次凸显断章取义视频在网络传播中的误导性,以及核实完整信息源的重要性。

Gemini Live 现已支持访问聊天记忆功能
谷歌 Gemini Live 语音助手新增访问用户历史聊天记忆(Memory)的能力。这项更新使语音交互能够调用用户过往对话中的上下文信息,提升连续对话体验的个性化与连贯性,对需要长期语音助手陪伴的场景具有实用价值。

《粉雄救兵》生活导师Karamo Brown推出AI克隆健康应用Kē
Netflix热门节目《粉雄救兵》(Queer Eye)中的生活导师Karamo Brown推出健康应用Kē,该应用搭载其AI数字克隆。Brown在经历一年半的个人健康探索后,希望通过这款融合健身、营养、冥想、人际关系等多维度内容的应用,帮助更多用户实现个人成长。这是名人IP与AI技术结合的又一尝试。

ChatGPT 长对话记忆能力实测:从闲聊细节生成个性化 90 年代动作玩偶
一位科技编辑测试 ChatGPT 的对话记忆功能,要求其根据聊天中提及的个人信息设计 90 年代风格动作玩偶。结果显示,ChatGPT 不仅完成任务,还自动调用了对话早期提及的"爱玩游戏""喜欢披萨"等细节,生成"能量控制器"和"披萨飞镖"等配件,展现出超预期的上下文理解与信息整合能力。