
上周 Anthropic 发布 Mythos Preview 的时候,安全圈的反馈不错用一个词抽象:震恐。
一个 AI 模子自主发现了 FreeBSD 里藏了 17 年的云尔代码践诺纰谬,找到了 OpenBSD 里 27 年没东说念主堤防到的 TCP 左券劣势,还颓败写出了不错责任的膺惩代码。Anthropic 随之秘书了 Project Glasswing,拉上一批科技公司构成定约,欢喜进入一亿好意思元的使用额度来竖立开源软件的安全纰谬。
这一系列的操作这荒谬刺激行业神经,Mythos 果然不错如斯雄壮,东说念主类的确要完蛋……等一下,没那么快。
低廉模子也能找到雷同的纰谬
AISLE 是一家作念 AI 安全的初创公司。从 2025 年年中初始,他们就在用 AI 系统给开源软件找纰谬和打补丁,如故累计发现并竖立了特等 180 个被开源社区招供的安全纰谬,其中包括一些藏了 25 年以上的掩盖问题。

Mythos出来后,他们作念了一件明锐的事:把 Mythos 展示的那些纰谬,拿给一批低廉得多的小模子跑。这些被称为「零日纰谬」,风险极大,一朝发现,安全东说念主员基本莫得反馈时间。
放弃很不测。
Mythos 找到的阿谁藏了 17 年的中枢纰谬,亦然 Anthropic 发布时用来「秀肌肉」的一个。AISLE 测了 8 个模子,全部得胜找到了,包括一个小参数、资本惟有 0.11 好意思元/百万 token 的模子,这个价钱直率是 Mythos 的几十分之一。其中,DeepSeek R1 不错说是最精准的,与已发布的纰谬应用文档中的践诺栈布局相符。

大大宗模子不仅找到了纰谬,还正确评估到了纰谬不错被云尔应用,给出了危机品级的判定。
另一个藏了 27 年的纰谬更难一些,需要对较深的数学道理有所交融。GPT-OSS-120b 一次就把总共这个词膺惩旅途复现了出来,还提倡了一个跟 A 社践诺竖立决策基本一致的补丁。Kimi K2 也出色完成,况兼在针对此纰谬的后续脚手架搭建中,仅需三次简便的 API 调用,无需任何代理基础步骤,就能不雅察到与 Mythos 公告中刻画的膺惩逻辑终点接近的放弃。
不外最故真谛的不是谁答对了,而是谁答错了:最贵的模子答错了最简便的题。
AISLE 出了一说念终点基础、直率相配于安全行业的「小学毕业考题」:一段代码看起来有安全纰谬,但仔细看会发现问题数据在中间就被丢掉了,践诺上并不会变成危害。
就像一把看起来很危机的枪,其实枪弹在半途被卸掉了,这是一个当今没危机,但缱绻很恶运的「假动作」。

大部分最贵、最强的前沿模子都答错了,Claude Sonnet 4.5 自信满满地给出了失误谜底,GPT-4.1 和 GPT-5.4 系列也没能避免。而DeepSeek R1 四次考研放弃均正确识别,GPT-OSS-20b 和 OpenAI o3 也能差异出来。
安全并非一蹴而就
这些发现让 AISLE 提倡了一个成见:锯齿状范畴。
AI 的安全才略不是模子越大就越强,它是错乱不皆的,排行在不同任务上会统统洗牌。归拢个模子,在一个测试里不错拿满分,总结在另一个测试里自信地秘书「代码没问题」。另一个模子在复杂任务上证实最好,总结在基础题上犯当先级的失误。
不存在「最好的安全 AI」,才略的范畴是锯齿状的。
就像这些测试,不是说 Mythos 不彊。在他们作念的实验里,小模子被分拨的是跟纰谬关系的代码,是单独抽出来给小模子们看的,就是是告诉它「望望这里,有莫得问题」,算是打了少许小抄。
而 Mythos 猛烈的场所是从新到尾的自主性,它能我方从几十万个文献里找到值得真切查验的场所,提倡假定,考据问题,写出膺惩代码,全程自动。

可是话锋一溜,AISLE 认为,这个「全程自动」的价值主要来自工程缱绻,而不是模子智能自身。
比如说,找 AI 找纰谬这件事,约略不错拆成几步:先大领域扫描代码库找可疑的场所,然后真切查验是不是的确有纰谬,再判断严重进度,临了写补丁竖立它。这几步之间,难度互异很大。
「找出问题」这一步,低廉模子如故不错胜任。信得过难的是奈何把这些要津串成一个可靠的活水线:让 AI 找对场所、扼杀误报、制定政策和实行。
作念 AI 安全需要几样东西:AI 的智能、运行的资本、运行的速率,以及镶嵌在总共这个词系统和团队里的安全专科学问。Anthropic 把第一项作念到了极致,但 AISLE 的陶冶是其他几项雷同迫切,随机甚而更迫切。AISLE 我方的系统同期使用许多家的模子,证实最好的阿谁按任务不同随时在切换,OpenSSL 的技能稳固东说念主评价他们是「高质料的讲演和建设性的合作」。

这种信任关系的竖立,跟用的是哪家的模子关系不大,他们最好的着力并不来自 Anthropic 的模子。
一个很践诺的膨胀是:既然低廉模子在「找问题」这一步如故够用了,你就不需要把一个上流模子小心翼翼地指向几个可疑位置。你不错派一群低廉模子出去涤荡总共旯旮。一千个还行的傍观把每个房间都查一遍,可能比一个天才傍观逐一去找着力更高。
Anthropic 的宣传天然没错,却也有一定进度的误导,把这几步混在了全部,让东说念主以为每一步都需要最顶尖的 AI,但事实并非如斯。
Mythos 确凿解释「AI 自主查找纰谬」这件事是的确,况兼自主进度不错很高。可是,示意惟有 Mythos 这种级别的模子才气作念好这件事,就属于是话只讲一半了,护城河不在模子,在系统。
这对总共这个词行业的道理可能比 Mythos 自身还大。看成念好安全的枢纽不在于领有最强的 AI,而在于奈何把 AI 组织成一套可靠的责任历程,那么 AI 安全就不会是一家公司的专属领地。它会变成一个生态,许多团队用不同的 AI 组合、不同的专科学问来作念归拢件事。
这可能是善事,让全宇宙的软件更安全九游会体育,不应该只指望一家公司的一个模子。
Powered by J9九游会 AG亚游官网 @2013-2022 RSS地图 HTML地图