AI资讯新闻榜单内容搜索-编程

实锤：Claude Opus 4.8「偷答案」！63%靠抄，AI断网后成绩雪崩

Cursor AI官方发布重磅研究，实锤包括自家模型在内的顶级AI，在编程评测中大规模「偷看答案」：Opus 4.8高达87.1%的惊人成绩，断网后直接暴跌至73.0%，其中63%的「解题」竟非独立推导。

来自主题: AI资讯

9018 点击 2026-06-26 20:29

Z Tech｜专访陈勇超：放弃DeepMind邀约，押注AI下一个时代，打造属于中国的原创成果

大模型浪潮席卷全球数年，技术形态持续迭代，也开始从办公、编程领域，深度渗透到科研这一核心赛道。从中科大夯实数理根基，到哈佛、MIT 完成联合培养，青年学者陈勇超横跨力学、机器人、自然语言处理、大模型等多个领域，完整亲历 AI 一轮轮技术变革。

来自主题: AI资讯

6447 点击 2026-06-25 15:22

90% 的代码交给 AI 之后，字节发现了一个反常识的真相

当一个团队九成以上的代码都由 AI 写出，效率却只涨了六成——这两个数字之间，藏着 AI Coding 真正进入企业的全部难题。

来自主题: AI资讯

7022 点击 2026-06-25 15:00

Mimo Code 爆火：我们挖开源代码，找到小米 AI 的真创新

6 月 11 日凌晨，小米 MiMo 团队公开了一个叫 MiMo Code 的项目，定位是终端编程 Agent，MIT 协议开源。官方宣传重点有三处，14 天 5 人团队投入的“vibe coding”开发叙事、Claude Code 之上的 SWE-Bench Pro 跑分。以及“无限上下文”的记忆架构。

来自主题: AI技术研报

10104 点击 2026-06-24 16:35

刚刚，豆包大模型2.1发布，Coding能力进入国际第一梯队！相比Opus 4.6降价近80%

豆包大模型2.1 Pro正式发布。但字节这次没有像某些厂商那样疯狂堆参数、刷榜单，而是把刀锋对准了一个更硬核的方向：让AI真正能“干活” 。作为本次大会发布的主力模型，豆包2.1 Pro 在 Coding（编程）、Agent（智能体）、VLM（视觉语言模型）三大核心方向实现能力跃升，多项评测表现优于Claude Opus 4.6

来自主题: AI资讯

9716 点击 2026-06-23 15:40