AI资讯新闻榜单内容搜索-工具

LLM-in-Sandbox：给大模型一台电脑，激发通用智能体能力

大模型的能力正在被不同的范式逐步解锁：In-Context Learning 展示了模型无需微调即可泛化到新任务；Chain-of-Thought 通过引导模型分步推理来提升复杂问题的求解能力；近期，智能体框架则赋予模型调用工具、多轮交互的能力。

来自主题: AI技术研报

10530 点击 2026-01-30 16:05

斯坦福实测GPT-5与Claude 4.5“双盲实验。AI编程，没有协作类产品的原因找到了

为什么在LLM推理能力大幅跃升的2026，我们依然只有AI Copilot而没有AI Teammate？尽管AI编程工具遍地开花，但不管是Claude Code还是Codex，本质上仍是“单Agent开发”或“主从控制”架构。而“AI结对编程”迟迟无法落地？

来自主题: AI技术研报

8212 点击 2026-01-29 10:10

Kimi这波更新，我看是不想给WPS留活路了

为什么程序员早就有了 Cursor 这种能主动干活的神仙工具，而我们 Office 打工人还在被各种“辅助插件”折磨？

来自主题: AI产品测评

6704 点击 2026-01-29 10:07

速递｜红点领投4200万，节点式设计工具Flora对标Figma、Krea抢占AI设计风口

Flora——这款被阿里巴巴、Brex、创意机构五角设计联盟以及娱乐公司狮门影业的设计师广泛使用的设计工具，近日达成了一项新里程碑。这家初创公司于周二宣布，已获得由红点创投领投的 4200 万美元 A 轮融资。

来自主题: AI资讯

8782 点击 2026-01-29 09:28

Agent 真正的护城河，正在从工具转向记忆资产

2026 刚开年，Anthropic 就用 Claude Cowork 开启了 AI 行业新的创业热点。

来自主题: AI资讯

6771 点击 2026-01-28 10:16

高效智能体的「幕后推手」是谁？一篇综述带你从记忆×工具学习×规划看透

随着大模型能力的跃迁，业界关注点正在从 “模型能不能做” 快速转向 “智能体能不能落地”。过去一年可以看到大量工作在提升智能体的有效性（effectiveness）：如何让它更聪明、更稳、更会用工具、更能完成复杂任务。

来自主题: AI技术研报

7839 点击 2026-01-27 16:19

5年博士1年读完，20分钟干完48小时教授工作！这个工具在硅谷火了

芝加哥教授20分钟干完48小时工作，零基础小白10分钟造出完整App，前xAI工程师睡一觉醒来项目就做好了……Claude Code正在重新定义「编程」这件事。

来自主题: AI资讯

7777 点击 2026-01-27 09:46

让Agent画思维导图稳固长期记忆：新框架实现稳定长期学习，准确率提升38%

思维导图曾被证明可以帮助学习障碍者快速提升成绩，那么当前已经可堪一用的智能体系统如果引入类似工具是否可以帮助改善长期学习记忆能力呢？有研究团队做出了探索性尝试。

来自主题: AI技术研报

6361 点击 2026-01-27 09:40

对话式精修PPT，Dokie终于让我觉得能交付了。

嗨大家好！我是阿真！了解我的人都知道，虽然我混得不怎么样，但是我的朋友都牛逼且靠谱，前几天藏师傅（@歸藏的AI工具箱）跟我说有个大佬有新产品要上了，这个情况我都是二话不说直接冲的。

来自主题: AI产品测评

7327 点击 2026-01-26 14:27

还得是腾讯，Claude Code迎来最强中国对手！企业Agent有救了～

大家好，我是最近天天折腾CLI Agent的袋鼠帝。一周前，我给大家安利了一款Claude Code的最强开源对手：OpenCode，没想到文章发出去后反响这么热烈，不管是阅读量还是评论都非常多。刚好，前几天我看到腾讯的CodeBuddy Code重磅升级到了2.0版本。说实话，CodeBuddy Code我有用过，基本完全复刻Claude Code，之前还帮我开发了好几个小工具，很实用。

来自主题: AI技术研报

9145 点击 2026-01-26 11:31