马斯克花 100 亿想清楚一件事,不做 coding agent 就是等死
马斯克花 100 亿想清楚一件事,不做 coding agent 就是等死OpenAI 的两大宿敌 Anthropic 和马斯克,放下心中成见之后终于在月初结盟了。
搜索
OpenAI 的两大宿敌 Anthropic 和马斯克,放下心中成见之后终于在月初结盟了。
Mechanize 发布了一项硬核测试:给前沿 AI coding agents 24 小时,用 Rust 从零写一个完整的 Game Boy Advance 模拟器,再和顶级开源模拟器 Mesen2 逐帧对比打分。
这场从 Zig 到 Rust 的迁移,实际上只花了大约六天,涉及 96 万行代码,并且在 Linux x64 glibc 环境下通过了现有测试套件的 99.8%。而六天前,Jarred 还在 Hacker News 上说 这是一堆根本还跑不起来的代码,“最后被全Ω部扔掉的概率非常高”。六天后,同样的代码变成了“Zig 的最后一个版本”。
就在刚刚,Gemini 3.5提前曝光了! 网友Lentils放出最新消息,代号「Cappuccino」的Gemini 3.5 Pro检查点已经开始产出。而就在几个小时前,传闻还是Gemini 3.2,没想到一下子就替换成了Gemini 3.5。
没错,大洗牌之后,xAI紧锣密鼓地发上重磅新品了——首个Coding Agent,Grok Build。直接在终端运行、专为专业软件工程和复杂编程任务设计……对标的是谁,属于是摆在明面上的。
“你花在 AI 编程上的费用,90% 都浪费在了没必要上传的上下文里!”
澳洲牧羊大叔随手写的三行bash,11天内被OpenAI、Anthropic和Hermes集体收编了。
一篇让你看懂的AGenUI开源解读
“做应用”这件事,现在真的老少咸宜了: 一个二年级小朋友,做了个“拼伞小程序”和操作系统。
全网AI交白卷的地狱级基准,被GPT-5.5拿下一血!开局0源码盲写程序,拉满推理算力直接满血通关。传统代码测试已废,通往ASI的算力狂飙正式打响。