九游会体育从 2025 年年中初始-J9九游会 AG亚游官网

栏目分类

热点资讯

资讯

发布日期：2026-04-24 07:10 点击次数：141

九游会体育从 2025 年年中初始-J9九游会 AG亚游官网

上周 Anthropic 发布 Mythos Preview 的时候，安全圈的反馈不错用一个词抽象：震恐。

一个 AI 模子自主发现了 FreeBSD 里藏了 17 年的云尔代码践诺纰谬，找到了 OpenBSD 里 27 年没东说念主堤防到的 TCP 左券劣势，还颓败写出了不错责任的膺惩代码。Anthropic 随之秘书了 Project Glasswing，拉上一批科技公司构成定约，欢喜进入一亿好意思元的使用额度来竖立开源软件的安全纰谬。

这一系列的操作这荒谬刺激行业神经，Mythos 果然不错如斯雄壮，东说念主类的确要完蛋……等一下，没那么快。

低廉模子也能找到雷同的纰谬

AISLE 是一家作念 AI 安全的初创公司。从 2025 年年中初始，他们就在用 AI 系统给开源软件找纰谬和打补丁，如故累计发现并竖立了特等 180 个被开源社区招供的安全纰谬，其中包括一些藏了 25 年以上的掩盖问题。

Mythos出来后，他们作念了一件明锐的事：把 Mythos 展示的那些纰谬，拿给一批低廉得多的小模子跑。这些被称为「零日纰谬」，风险极大，一朝发现，安全东说念主员基本莫得反馈时间。

放弃很不测。

Mythos 找到的阿谁藏了 17 年的中枢纰谬，亦然 Anthropic 发布时用来「秀肌肉」的一个。AISLE 测了 8 个模子，全部得胜找到了，包括一个小参数、资本惟有 0.11 好意思元/百万 token 的模子，这个价钱直率是 Mythos 的几十分之一。其中，DeepSeek R1 不错说是最精准的，与已发布的纰谬应用文档中的践诺栈布局相符。

大大宗模子不仅找到了纰谬，还正确评估到了纰谬不错被云尔应用，给出了危机品级的判定。

另一个藏了 27 年的纰谬更难一些，需要对较深的数学道理有所交融。GPT-OSS-120b 一次就把总共这个词膺惩旅途复现了出来，还提倡了一个跟 A 社践诺竖立决策基本一致的补丁。Kimi K2 也出色完成，况兼在针对此纰谬的后续脚手架搭建中，仅需三次简便的 API 调用，无需任何代理基础步骤，就能不雅察到与 Mythos 公告中刻画的膺惩逻辑终点接近的放弃。

不外最故真谛的不是谁答对了，而是谁答错了：最贵的模子答错了最简便的题。

AISLE 出了一说念终点基础、直率相配于安全行业的「小学毕业考题」：一段代码看起来有安全纰谬，但仔细看会发现问题数据在中间就被丢掉了，践诺上并不会变成危害。

就像一把看起来很危机的枪，其实枪弹在半途被卸掉了，这是一个当今没危机，但缱绻很恶运的「假动作」。

大部分最贵、最强的前沿模子都答错了，Claude Sonnet 4.5 自信满满地给出了失误谜底，GPT-4.1 和 GPT-5.4 系列也没能避免。而DeepSeek R1 四次考研放弃均正确识别，GPT-OSS-20b 和 OpenAI o3 也能差异出来。

安全并非一蹴而就

这些发现让 AISLE 提倡了一个成见：锯齿状范畴。

AI 的安全才略不是模子越大就越强，它是错乱不皆的，排行在不同任务上会统统洗牌。归拢个模子，在一个测试里不错拿满分，总结在另一个测试里自信地秘书「代码没问题」。另一个模子在复杂任务上证实最好，总结在基础题上犯当先级的失误。

不存在「最好的安全 AI」，才略的范畴是锯齿状的。

就像这些测试，不是说 Mythos 不彊。在他们作念的实验里，小模子被分拨的是跟纰谬关系的代码，是单独抽出来给小模子们看的，就是是告诉它「望望这里，有莫得问题」，算是打了少许小抄。

而 Mythos 猛烈的场所是从新到尾的自主性，它能我方从几十万个文献里找到值得真切查验的场所，提倡假定，考据问题，写出膺惩代码，全程自动。

可是话锋一溜，AISLE 认为，这个「全程自动」的价值主要来自工程缱绻，而不是模子智能自身。

比如说，找 AI 找纰谬这件事，约略不错拆成几步：先大领域扫描代码库找可疑的场所，然后真切查验是不是的确有纰谬，再判断严重进度，临了写补丁竖立它。这几步之间，难度互异很大。

「找出问题」这一步，低廉模子如故不错胜任。信得过难的是奈何把这些要津串成一个可靠的活水线：让 AI 找对场所、扼杀误报、制定政策和实行。

作念 AI 安全需要几样东西：AI 的智能、运行的资本、运行的速率，以及镶嵌在总共这个词系统和团队里的安全专科学问。Anthropic 把第一项作念到了极致，但 AISLE 的陶冶是其他几项雷同迫切，随机甚而更迫切。AISLE 我方的系统同期使用许多家的模子，证实最好的阿谁按任务不同随时在切换，OpenSSL 的技能稳固东说念主评价他们是「高质料的讲演和建设性的合作」。

这种信任关系的竖立，跟用的是哪家的模子关系不大，他们最好的着力并不来自 Anthropic 的模子。

一个很践诺的膨胀是：既然低廉模子在「找问题」这一步如故够用了，你就不需要把一个上流模子小心翼翼地指向几个可疑位置。你不错派一群低廉模子出去涤荡总共旯旮。一千个还行的傍观把每个房间都查一遍，可能比一个天才傍观逐一去找着力更高。

Anthropic 的宣传天然没错，却也有一定进度的误导，把这几步混在了全部，让东说念主以为每一步都需要最顶尖的 AI，但事实并非如斯。

Mythos 确凿解释「AI 自主查找纰谬」这件事是的确，况兼自主进度不错很高。可是，示意惟有 Mythos 这种级别的模子才气作念好这件事，就属于是话只讲一半了，护城河不在模子，在系统。

这对总共这个词行业的道理可能比 Mythos 自身还大。看成念好安全的枢纽不在于领有最强的 AI，而在于奈何把 AI 组织成一套可靠的责任历程，那么 AI 安全就不会是一家公司的专属领地。它会变成一个生态，许多团队用不同的 AI 组合、不同的专科学问来作念归拢件事。

这可能是善事，让全宇宙的软件更安全九游会体育，不应该只指望一家公司的一个模子。

上一篇：J9九游会真人第一单纯的模子才调已越来越难以组成历久壁垒-J9九游会 AG亚游官网
下一篇：没有了