AI资讯新闻榜单内容搜索-智能体

别卷 Prompt 了，上下文工程正在淘汰你

Hi，返工早上好。我是洛小山，和你聊聊 AI 行业思考。 AI Agent 应用的竞争逻辑，正在发生根本性变化。当许多团队还在死磕提示词优化（PE 工程）时，一些优秀团队开始重心转向了上下文工程

来自主题: AI技术研报

8229 点击 2025-10-09 11:59

开源RL框架Verlog来了，专为LLM智能体打造，400回合不成问题

具体而言，Verlog 是一个多轮强化学习框架，专为具有高度可变回合（episode）长度的长时程（long-horizon） LLM-Agent 任务而设计。它在继承 VeRL 和 BALROG 的基础上，并遵循 pytorch-a2c-ppo-acktr-gail 的成熟设计原则，引入了一系列专门优化手段，从而在任务跨度从短暂交互到数百回合时，依然能够实现稳定而高效的训练。

来自主题: AI技术研报

7668 点击 2025-10-09 11:16

10个Agent一键组队：并行智能体协作，端到端交付从24h缩减到4h！

写代码的规则，正在被悄悄改写！不再是「人+AI一起盯屏幕」，而是一次性放出十几个任务，让代理们各自跑。真正的门槛，也不再是你能写多少行代码，而是你能不能写清楚需求、明确地拆分任务、快速浏览结果。

来自主题: AI技术研报

10641 点击 2025-10-08 22:46

多个编码智能体同时使用会不会混乱？海外开发者热议

结合现在已经非常成熟 CLI、IDE 工具等的辅助，采用编码智能体进行开发工作已经成为了一种常态，甚至成为了一种新的生活方式。不仅仅是程序员，产品类、设计类岗位的从业人员都已广泛采用 AI 编码智能体辅助工作，AI 生成的代码比例越来越高。

来自主题: AI资讯

10685 点击 2025-10-08 11:48

从「知题」到「知人」：UserRL让智能体学会「以人为本」

来自 UIUC 与 Salesforce 的研究团队提出了一套系统化方案：UserBench —— 首次将 “用户特性” 制度化，构建交互评测环境，用于专门检验大模型是否真正 “懂人”；UserRL —— 在 UserBench 及其他标准化 Gym 环境之上，搭建统一的用户交互强化学习框架，并系统探索以用户为驱动的奖励建模。

来自主题: AI技术研报

9955 点击 2025-10-08 11:45

斯坦福华人研究火了：45分钟让你的论文变身AI智能体！

斯坦福大学研究人员提出了Paper2Agent，将静态论文转化为可交互的AI智能体，让学术成果可以直接被「调用」，为科研知识传播开辟了新模式，并为构建AI共研生态奠定基础。

来自主题: AI技术研报

10282 点击 2025-10-08 11:44

DeepMind发布代码修复AI智能体CodeMender，实现「被动响应」与「主动防御」一体化

近日，DeepMind 最新推出了一种全新的用于代码安全的 AI Agent—CodeMender，它使用 Gemini Deep Think 自动修补关键软件漏洞。它会检查补丁是否正确、是否能够修复根本原因，并且不会引起其他任何破坏。这确保只有高质量的解决方案才会被发送给人工审核。

来自主题: AI资讯

9901 点击 2025-10-07 22:13

刚刚，奥特曼官宣ChatGPT「终极OS入口」！8分钟速搭智能体，8亿人狂欢

OpenAI 2025开发者日上，全场座无虚席。奥特曼重磅官宣四大更新：首发Apps SDK要把ChatGPT打造为「操作系统终极入口」，一键拖拽构建智能体AgentKit，无代码Codex开发，以及Sora 2等三大API登场。OpenAI的野心，彻底藏不住了。

来自主题: AI资讯

11744 点击 2025-10-07 09:11

对话 Agnes AI：“我们想让全球的用户，用到更好的 AI。”

在 AI Agent 应用浪潮中，一个来自新加坡的新名字——Agnes AI，正以一种特别的方式进入我们的视野。一方面，是其宣布的惊人增长：不到三个月，DAU 突破十万；另一方面，却是市场声量相对的沉寂。

来自主题: AI资讯

10224 点击 2025-10-06 19:56

你敢信？GPT-5的电脑操作水平只比人类低2%了

Agent（智能体）是最近一段时间的人工智能热点之一，将大语言模型的能力与工具调用、环境交互和自主规划结合起来，使其能够像虚拟助理一样完成复杂任务。其中「计算机使用智能

来自主题: AI技术研报

9756 点击 2025-10-05 21:34