
21世纪经济报谈记者肖潇
6686体育官方网站入口欧洲央行(ECB)泛泛举办按期会议,但就一个问题临时开会的情况很有数。当地时辰5月26日,欧洲央行要紧召开了一场网罗安全会议,警戒各大银行:最新大模子Mythos正在禁锢金融系统,银行需要大幅加速安全瑕玷的建立。
不单欧洲,自Mythos本年4月发布以来,全球监管层一直在忙着发出警报。先是好意思国财政部长和好意思联储主席要紧召开闭门会议,随后英国、日本、加拿大、德国等监管部门也驱动把AI网罗安全列入金融健硕议题。
Mythos被视为AnthropicClaude居品线迄今才调最强的模子,在发现和哄骗软件瑕玷上的推崇权贵飞升。Anthropic警戒其照旧“发现躲藏了几十年的高危瑕玷,包括扫数主流操作系统和浏览器”,与此同期,“这种瑕玷可能对经济、群众安全和国度安全酿成严重后果”。
不少东谈主把Mythos描画为网罗安全领域的“奥本海默时刻”。出于安全计划,Anthropic第一次戒指模子公开,而是启动了名为玻璃之翼(ProjectGlasswing)的面孔——仅向微软、苹果、摩根大通等12家好意思国巨头提供造访权,提早检测要津风物的瑕玷,先把防火墙码高。
但这也让莫得造访权的地区产生了新的狂躁。“欧洲银行无法使用Mythos模子,好意思国银行应该尽快与欧元区共享教育。”欧洲央行监管委员会高层在媒体采访中催促谈。
发展和安全再次成为牢牢贴合的硬币两面:一面是猛涨的AI风险,另一面是越来越明显的本领差距,全球金融机构来源感受到压力。
不外,由于大多数东谈主没法交游Mythos的真实情况,咫尺还不实在服网罗安全到底会被何如颠覆。英国东谈主工智能安全推敲所(AISI)觉得,咫尺不可断言AI只怕就会击垮互联网,但不错信服的是,东谈主们不可再把联系风险视为“几年后的问题”了,当下恰是一个要津堤防窗口期。
有哪些警戒?
4月7日,Mythos官宣问世本日,好意思国华盛顿一会儿召开了一场闭门会议,参会的有好意思国财政部长贝森特、好意思联储主席鲍威尔,以及来自花旗、摩根士丹利和高盛等大型金融机构的高管。
多家外媒随后败露,这场会议的议题就是评估Mythos对银行系统治来的冲击,以及金融机构需要启动里面大模子测试。
访佛的要紧会议,在接下来两个月席卷全球政府高层:
4月12日,英国央行、英国金融阛阓行动监管局和国度网罗安全中心临时召开圆桌会议,核查Mythos可能潜入的要津信息系统瑕玷,条目各机构以“10倍紧迫性”选拔行动加强网罗堤防。
4月17日,加拿大央行两次主抓金融健硕会议,将Mythos等AI驱动的网罗攻击列为要点议题。
4月末,日本财务大臣和日本三大银行会面,晓谕成就聚首专组来吩咐金融风险,并但愿能在两周内获取Mythos的使用权。
新加坡网罗安全局致函本国所相枢纽信息基础风物机构的高层,条目它们再行评估AI网罗攻击对现存安合座系的影响。
多种作风浮现了一个信号:AI网罗攻击正在成为要紧的金融风险。银行不仅因为资金聚积而容易成为网罗攻击的梦想标的,也因为底层的买卖系统、清理系统、客户数据库、身份考据模块,每每建立在深广的第三方软件生态之上,其中不少中枢架构照旧运行了数十年。
“淌若某家大型软件供应商发布了一个补丁,那么攻击者很有可能在短短30分钟内,就通过逆向工程找出这个补丁蓝本要建立的瑕玷。是以补丁一朝发布,银行必须建立一套经由,确保比现时阛阓快得多的速率建立瑕玷。”欧洲央行监管委员会副主席弗兰克·埃尔德森在采访中暗示。
在他看来,当务之急是提高瑕玷的修补速率。尤其关于大宗依赖传统IT架构运行的金融机构,是一次安全大考。
为什么是Mythos?
不同于面向平素销耗者的聊天大模子,Mythos专长于编程,是Claude居品线的最新升级,也被视为最强Claude模子。
本领讲演炫耀,在软件工程测试SWE-benchVerified上,Mythos得分93.9%,上一代模子Opus4.6是80.8%;在网罗安全才调评估CyberGym测试中,Mythos得分83.1%,也远高于Opus4.6的66.6%。
Anthropic在博客中强调,公司并莫得故意锻练Mythos的网罗安全用途,但当模子的编程、推理和自主试验才调同步增强后,它当然会获取更强的瑕玷发现与哄骗才调。换句话说,安全风险捕捉是模子才退换体进步的副居品。
这种才调对网罗安全到底意味着什么?Anthropic在自我讲演中提到,Mythos在昔时几周发现了数千个零日瑕玷——零日瑕玷指极其危急的过错,开发东谈主员必须在零日内建立。这些瑕玷遮蔽简直扫数主流操作系统和浏览器。
其中一个最受情切的案例来自操作系统OpenBSD。Anthropic称,Mythos发现了一个照旧潜伏27年的瑕玷。自1998年发布以来,OpenBSD一直被视为业内安全加固进度最高的操作系统之一,亦然全球大宗防火墙和要津风物的地基。
更值得担忧的是,Mythos找到瑕玷后,爱游戏体育世界杯中国官网首页能进一标准行攻击。Anthropic里面测试写谈,Mythos生成瑕玷哄骗代码的生效能达到72.4%,前一代Opus4.6的生效能简直为零。
网罗安全是攻防两边的均衡术,故意于攻击者的本领,也故意于堤防者。“咱们信托,刚劲的本领才调最终会使堤防方比攻击方受益更多。但淌若前沿实验室发布这些模子不够严慎,短期内攻击方就可能会占据上风——尤其是过渡期,时局会很散乱。”Anthropic写谈。
玻璃之翼(ProjectGlasswing)的战略正建立在这种判断上:Anthropic最终决定,Mythos不径直面向公众洞开,而是优先向一部分大型机构提供造访权。在才调全面扩散前,先让堤防方抢跑一步。
但这种作念法激勉了新的担忧,淌若来源进的本领才调只向少数东谈主洞开,本领差距也会成为一种安全风险。
首批获取Mythos权限的有12家中枢团合资伴和40多家要津基础风物机构,简直全由好意思国科技与金融巨头组成,包括亚马逊、苹果、谷歌、英伟达、念念科、摩根大通、Linux基金会等。除了好意思国,英国事咫尺唯一说明获取Mythos预览版的政府,其渠谈来自推敲机构英国东谈主工智能安全推敲所(AISI)。
欧洲央行和监管机构尤其感到贫瘠,因为他们被拒却使用Mythos。欧洲央行监管着欧元区约111家最大的银行,摩根大通等华尔街大型银行的子公司照旧获取了Mythos的测试版块,但欧洲监管方却无法径直交游。
“扫数联系机构皆应该获取此类本领,幸免竞争诬蔑。”德国央行行长只可在4月的公开演讲中号召。
需要垂危吗?
由于大多数东谈主于今无法径直交游Mythos,外界关于它真实才调的判断,以及AI到底会不会颠覆网罗安全,莫得东谈主能够给出明确谜底。
不少东谈主把Mythos描画为网罗安全领域的“奥本海默时刻”,值得垂危的外部案例如实不少。
比如一家网罗安全公司Calif的推敲东谈主员,哄骗Mythos的早期版块,在macOS中发现两个此前未被纪录的瑕玷。这两个瑕玷可被串联哄骗形成攻击旅途,进而获取权限,不错绕过苹果来源进的内存圆善性保护机制;淌若再结合其他攻击技能,致使可能所有戒指一台Mac诱导。
英国东谈主工智能安全推敲所(AISI)同期拿到了Mythos和GPT5.5模子,其最新测试讲演炫耀,Mythos之后,ChatGPT5.5照旧成为第二个具备全自动网罗攻击才调的大模子。
讲演里有一个要津见识叫“CyberTimeHorizon(网罗攻击时辰跨度)”,用来预计AI能招引、自主完成多永劫辰的东谈主类职责,时辰跨度越长,意味着AI离果然的全自动黑客越近。2025年11月,团队臆想这个见识每8个月会翻倍一次;到了本年2月,数字照旧裁汰到4.7个月;Mythos出现后,进化周期又压缩了。

但另一种怀疑声通常存在:Mythos的风险被夸大了,它很可能是AI行业常见的炒作营销。
开源用具curl的独创东谈主丹尼尔·斯坦伯格就公开抒发过质疑。通过Linux基金会,curl曲折获取了Mythos对curl代码库的分析终结。讲演宣称发现五个瑕玷,但斯坦伯格后续核查发现,唯唯独个是真实瑕玷;三个是API文档早已评释的问题,另一个则仅仅平素Bug。
在斯坦伯格看来,AI的才调如实在进步,但距离蜕变性报复仍有距离。
访佛判断也出咫尺Mozilla的测试中。Mozilla昔时永恒使用GPT-4和Sonnet3.5对Firefox进行安全分析,但一直受困于高误报率,很难真清廉鸿沟参加使用。比较之下Mythos的才调进步是明显的,其一次性识别出了271个潜在瑕玷。
但Mozilla同期强调,这离真实的网罗攻击还有一定距离,因为大多数情况下,单个瑕玷并不及以攻破复杂的堤防架构。更要紧的是,Mythos并莫得发现东谈主类看穿不了的安全瑕玷,仅仅速率和恶果大大进步了。
一个细节也能评释问题。Mozilla团队会让Mythos生成补丁淡薄动作参考,但最终完成建立职责的仍然是东谈主类工程师,团队还莫得发现能够所有自动化处治的风物。
AISI对此的最终判断是:AI正在快速接近自主试验复杂攻击经由的领域,而这种进化速率,明显快于传统安全行业的符合速率,留给回绝方的缓冲时辰不会太长。
这能够才是激勉惶恐的根源,当下恰是一个要津窗口期,谁能更快建立堤防体系,谁就能在改日拉开差距。
进一步说,谜底不仅仅谁能堤防Mythos,更是谁有才调造出下一个Mythos。在第三方模子评估榜单ArtificialAnalysis中爱游戏·体育世界杯(中国)官方网站,编程模子榜单的前十名被Claude、Cursor、ChatGPT循序承包,国内智谱的GLM-5.1为第十六名,KimiK2.6、DeepSeekV4也在前二十名。一些分析觉得,中好意思之间前沿大模子的本领差距正在放肆。
