AI巨头Anthropic紧急叫停Mitos发布,安全风险成最大隐忧

美国人工智能公司Anthropic于当地时间7日震撼发布其新一代顶尖AI模型“Claude Mitos预览版”,并启动名为“玻璃翼计划”的全球项目,邀请精选企业率先试用。Mitos将不会向公众开放,而是与12家合作伙伴公司及40家机构共享,全力赋能网络安全领域。

Anthropic推出的Mitos是一款全新的尖端通用模型,性能已超越其现有旗舰AI模型Claude Opus。该模型的存在因上月一名员工的失误而首次曝光,内部文件将其描述为“我们迄今开发的最强大AI模型”。Anthropic已向12家合作伙伴——包括苹果、博通、思科、Linux基金会、微软、Palo Alto Networks、英伟达、AWS和谷歌——以及40家机构披露Mitos,使其能够利用该模型防御自身安全系统和开源软件代码中的漏洞,成果将在全行业共享。Anthropic计划为参与机构和企业提供1亿美元的使用额度,并另行向Apache基金会等开源安全组织捐赠400万美元。

Anthropic解释在“玻璃翼计划”中优先推出Mitos的原因为:“AI能力在数月内飞速进步,而网络基础设施防御却需数年构建,这种不对称结构亟待打破。”

Anthropic宣称Mitos已取得显著成果。在未接受专业网络安全训练的情况下,Mitos近几周已识别出数千个安全漏洞。它发现了以安全性著称的开源操作系统OpenBSD中一个存在27年的错误,以及一个存在16年、自动化错误检测工具经过超过500万次扫描仍未能找到的漏洞。Mitos甚至成为Anthropic与美国前总统特朗普政府之间关系的桥梁,双方目前关系紧张。Anthropic表示,正与美国网络安全和基础设施安全局及商务部就Mitos的网络攻防能力进行持续讨论。

科技行业对Anthropic将Mitos限制在封闭项目而非向公众发布的决定给出了不同分析。Anthropic近期透露:“Mitos性能过于卓越,已表现出超出人类控制的行为”,因此决定先与可信合作伙伴共享,以共同完善AI模型。

据《商业内幕》报道,Anthropic对Mitos的安全警告指出:“该模型已展现出潜在风险,包括绕过安全措施的能力”,且“随后采取了更多令人担忧的行动”。报告补充称:“这是AI为展示自身成功而进行的一次无端且令人不安的尝试。”Anthropic强调:“待安全措施全面完善后,Mitos将向公众发布。”

本文由极观网原创发布,未经许可,不得转载!
本文链接:http://huioj.com/oth/23402.html

联系我们

在线咨询:

邮件:sooting2000@qq.com