AI资讯新闻榜单内容搜索-Gen

混元开源PhoneBuddy-4B与5篇系列论文：多项手机Agent真机评测超过GPT-5.4

过去一年，Mobile/Phone-use Agent在各类评测榜单上进展很快。

来自主题: AI技术研报

8234 点击 2026-06-26 09:47

往 Codex 里塞块无限画布，AI 改图终于能指哪打哪了｜附教程

和 Codex、Claude Code 等 Coding Agent 沟通，很多时候就像站在许愿池边，对着池子里的王八扔硬币，嘴里念念有词，关键它还真给你兑现愿望。

来自主题: AI技术研报

6898 点击 2026-06-25 15:26

4秒出百万面！突破千万面精度+12K高清贴图，手握数亿的3D生成公司下一局怎么打？

今年2月，英伟达公开了一条内部AI工作流。

来自主题: AI技术研报

10093 点击 2026-06-25 15:24

盘点16个把自己蒸馏成Skills的国民级App。

最近看到越来越多的一些国民级产品，开始把自己的一些能力，给封装称Skill或者MCP，来向大家开放，我觉得这个大家逐渐为Agent来做能力的趋势，越来越明显了。特别是前段时间瑞幸咖啡上线了AI开放平台，支持MCP、CLI、Skill三种接入方式。

来自主题: AI资讯

9143 点击 2026-06-25 10:36

80%代码由Claude合并，Anthropic内部人员点破Agent真相：「Close the Loop」

最近，Anthropic 团队研究产品经理 Theodora（Theo）Chu 的一段演讲视频，引起了大家的注意。

来自主题: AI资讯

9855 点击 2026-06-25 10:29

Agent不会搞科研？人大微软开源框架&工具包解决盲目试错通病，抱抱脸日榜第一

写代码、跑实验、改项目、迭代方案，现在的AI智能体样样都能搞定。

来自主题: AI技术研报

6704 点击 2026-06-25 10:28

首个长程Doc2Repo训练集！代码Agent不止修bug，开始造仓库

DeNovoSWE是一个用于训练代码智能体从零生成完整仓库的数据集，包含4818个真实任务实例。它通过结构化文档和严格验证机制，帮助智能体掌握复杂系统构建能力，而不仅仅是修复代码。这为代码智能体迈向更高阶的软件工程任务提供了关键支持。

来自主题: AI技术研报

9617 点击 2026-06-25 10:04

ICML 2026｜让AI自动发现前沿风险：创智×复旦×牛津发布AutoControl-Arena

当 AI 智能体（Agent）从实验室走向真实应用，我们面对的安全问题也正在发生变化。

来自主题: AI技术研报

9881 点击 2026-06-25 10:03

开源！阿里甩出首个语言世界模型，能造智能体环境

一个模型能模拟7种环境。

来自主题: AI技术研报

9260 点击 2026-06-24 16:58

Mimo Code 爆火：我们挖开源代码，找到小米 AI 的真创新

6 月 11 日凌晨，小米 MiMo 团队公开了一个叫 MiMo Code 的项目，定位是终端编程 Agent，MIT 协议开源。官方宣传重点有三处，14 天 5 人团队投入的“vibe coding”开发叙事、Claude Code 之上的 SWE-Bench Pro 跑分。以及“无限上下文”的记忆架构。

来自主题: AI技术研报

10097 点击 2026-06-24 16:35