最强黑客大模型,不再是Mythos
最强黑客大模型,不再是Mythos微软用一套多 Agent 系统在 AI 漏洞发现的顶级基准测试上拿下第一,超过 Anthropic 最强模型 Mythos 五个百分点。诡异的是,微软自己并没有一个能打的前沿模型。它用别人的模型组了个系统,打败了造出这些模型的公司。这对AI竞争格局的启示,比这个工具挖出了大量 Windows 漏洞本身更重要。
搜索
微软用一套多 Agent 系统在 AI 漏洞发现的顶级基准测试上拿下第一,超过 Anthropic 最强模型 Mythos 五个百分点。诡异的是,微软自己并没有一个能打的前沿模型。它用别人的模型组了个系统,打败了造出这些模型的公司。这对AI竞争格局的启示,比这个工具挖出了大量 Windows 漏洞本身更重要。
谷歌周一发布报告,首次确认犯罪黑客使用AI大模型发现了一个此前未知的零日漏洞,并差点发动大规模攻击。这件事之所以炸裂,是因为安全界担心了好几年的「AI自动挖洞」,终于从理论变成了现实。而在Anthropic的Mythos模型已经找到数千个零日漏洞的背景下,这可能只是冰山一角。
对「AI 原住民」而言,创造的新范式,除了 AI,还有在小红书 build in public。
“史上最大”是我加的噱头,这其实是小红书第一次办围绕AI的48小时的黑客松。去年他们办了一届独立开发者大赛,区别是一个都是比较成熟的产品来参赛,另一个更多是考验48小时里的创意、组队、协作和一起hack的能力——这都是“看人”的思路。
过去一个月,OpenClaw 让大量人第一次跑起了自己的 AI Agent。给它起个名字,配上工具,接好 MCP,一只属于你的电子龙虾就上线了。但养过虾的人很快发现一个问题:龙虾能调用工具,不代表它知道怎么把活干好。你让它帮你清理磁盘,它把客户资料一块删了;你让它帮你比价下单,一转头就刷爆了主人的信用卡。
全球最安全系统,被AI攻破了!Claude 4小时攻破了全球最安全OS内核,从零写出国家级攻击程序,彻底跨越卢比孔河。人类防御60天,AI只要4小时,所有旧秩序,都在加速崩盘。
Donald King曾在全球顶级会计师事务所普华永道(PwC)为众多500强客户打造AI智能体。作为公司AI黑客松大赛的冠军,King获得的不是奖励和提拔,而是公司裁员的电话。
做过独立开发的朋友都清楚,虽然现在 AI 已经能写出相当不错的前端,后端也有成熟的 BaaS 服务,但应用开发并不仅仅只是写份代码。
刚刚结束的OpenAI黑客松上,全球共有六支团队冲进榜单。他们探索了GPT-5在营销活动、时尚AI、电子表格、电脑代理、知识学习、智能电网等场景的应用极限。
这个夏天,一场盛大的黑客松 AdventureX 即将在杭州拉开帷幕。