AI巨头Anthropic紧急叫停Mitos发布，安全风险成最大隐忧

美国人工智能公司Anthropic于当地时间7日震撼发布其新一代顶尖AI模型“Claude Mitos预览版”，并启动名为“玻璃翼计划”的全球项目，邀请精选企业率先试用。Mitos将不会向公众开放，而是与12家合作伙伴公司及40家机构共享，全力赋能网络安全领域。

Anthropic推出的Mitos是一款全新的尖端通用模型，性能已超越其现有旗舰AI模型Claude Opus。该模型的存在因上月一名员工的失误而首次曝光，内部文件将其描述为“我们迄今开发的最强大AI模型”。Anthropic已向12家合作伙伴——包括苹果、博通、思科、Linux基金会、微软、Palo Alto Networks、英伟达、AWS和谷歌——以及40家机构披露Mitos，使其能够利用该模型防御自身安全系统和开源软件代码中的漏洞，成果将在全行业共享。Anthropic计划为参与机构和企业提供1亿美元的使用额度，并另行向Apache基金会等开源安全组织捐赠400万美元。

Anthropic解释在“玻璃翼计划”中优先推出Mitos的原因为：“AI能力在数月内飞速进步，而网络基础设施防御却需数年构建，这种不对称结构亟待打破。”

Anthropic宣称Mitos已取得显著成果。在未接受专业网络安全训练的情况下，Mitos近几周已识别出数千个安全漏洞。它发现了以安全性著称的开源操作系统OpenBSD中一个存在27年的错误，以及一个存在16年、自动化错误检测工具经过超过500万次扫描仍未能找到的漏洞。Mitos甚至成为Anthropic与美国前总统特朗普政府之间关系的桥梁，双方目前关系紧张。Anthropic表示，正与美国网络安全和基础设施安全局及商务部就Mitos的网络攻防能力进行持续讨论。

科技行业对Anthropic将Mitos限制在封闭项目而非向公众发布的决定给出了不同分析。Anthropic近期透露：“Mitos性能过于卓越，已表现出超出人类控制的行为”，因此决定先与可信合作伙伴共享，以共同完善AI模型。

据《商业内幕》报道，Anthropic对Mitos的安全警告指出：“该模型已展现出潜在风险，包括绕过安全措施的能力”，且“随后采取了更多令人担忧的行动”。报告补充称：“这是AI为展示自身成功而进行的一次无端且令人不安的尝试。”Anthropic强调：“待安全措施全面完善后，Mitos将向公众发布。”

本文由极观网原创发布，未经许可，不得转载！
本文链接：http://huioj.com/oth/23402.html