AI资讯新闻榜单内容搜索-模型训练

牛津、英伟达等提出记忆压缩新范式：训练时让模型学会断舍离

2026 年初，各大 AI 厂商在上下文窗口长度上展开激烈角逐。Google 的 Gemini 3 Pro 已支持 100 万级 token 上下文，Meta 的 Llama 4 Scout 更宣称可处理 1000 万 token。GPT-5 系列也在快速推进长上下文能力。

来自主题: AI技术研报

10289 点击 2026-06-02 11:23

GUI Agent「记与学」双修，长程任务有了专属记忆增强型自进化框架

本文团队长期从事负责任的人工智能与人工智能赋能社会科学相关研究，围绕视觉生成大模型安全治理、智能体安全等方向开展系统性工作，相关成果发表于AAAI、ICML、TMM 等国际期刊与会议。

来自主题: AI技术研报

7703 点击 2026-06-02 11:23

罗福莉划重点，小米大模型降价99%的秘籍公开

紧跟DeepSeek价格战，小米掏出技术底牌！

来自主题: AI技术研报

7111 点击 2026-06-01 13:58

ICML 2026 | 清华姚权铭团队提出LMNet，让语言模型学会自己「组网」

大语言模型正在成为人工智能系统的核心组件。从文本生成、数学推理到代码编写，单个大模型已经展现出强大的能力。

来自主题: AI技术研报

8152 点击 2026-06-01 09:26

Rubrics综述：Agent时代，如何定义一个「好答案」？

近年来，随着大模型从简单问答，走向深度研究、医疗咨询、多模态生成和长程 Agent 任务，一个基础问题变得越来越难回答：我们到底应该怎样判断模型输出的质量？

来自主题: AI技术研报

8818 点击 2026-06-01 09:24

打破Agent训练瓶颈！人大&至知研究院开源Claw Agent数据+训练+评测全链条

大模型从“回答问题”走向“完成任务”，正在面临以下瓶颈：面向Claw Agents的数据、训练和评测都比传统environment training更难。为了解决该问题，中国人民大学、至知研究院等最新提出ClawGym——

来自主题: AI技术研报

6777 点击 2026-05-31 11:42

AI权威清洗：一张肉眼难辨的图片，就能让GPT-5.4、Claude Opus 4.6集体造谣

来自 ETH Zurich 的 Florian Tramèr 团队在最新论文中抛出了一个出乎意料的问题：如果 AI"看到" 的图，根本不是你肉眼看到的那张，会发生什么样的后果呢？他们把这种现象称作 AI 权威清洗（AI Authority Laundering）。

来自主题: AI技术研报

9247 点击 2026-05-31 11:27

终于，清华快手养出了通人性的AI！

清华大学经济管理学院的陈柯均博士生、张佳音教授、徐心教授与快手消费策略算法部合作探索完成了一项联合实验：从视频传递的价值观的角度，去理解观看视频后用户的行为和心理变化。

来自主题: AI技术研报

8541 点击 2026-05-31 11:15

登顶HuggingFace日榜！英伟达清华团队γ-World：把世界模型从单机打到联机

5 月下旬，NVIDIA 联合清华大学、多伦多大学和 Vector Institute 发布 Gamma-World，共一第一为清华大学电子系博士刘芳甫，核心 Research 方向是世界模型和空间智能。

来自主题: AI技术研报

9391 点击 2026-05-30 11:26

被困在考场里的大模型

昨天，大名鼎鼎的 Claude 4.8 发布了。科技圈照例是一片欢呼。看官方放出来的一堆评测数据，依然是碾压级别的，尤其是说代码（Coding）能力有了史诗级的提升，简直像交了一份满分答卷。

来自主题: AI资讯

8625 点击 2026-05-30 10:50

AI资讯新闻榜单内容搜索-模型训练

牛津、英伟达等提出记忆压缩新范式：训练时让模型学会断舍离

GUI Agent「记与学」双修，长程任务有了专属记忆增强型自进化框架

罗福莉划重点，小米大模型降价99%的秘籍公开

ICML 2026 | 清华姚权铭团队提出LMNet，让语言模型学会自己「组网」

Rubrics综述：Agent时代，如何定义一个「好答案」？

打破Agent训练瓶颈！人大&至知研究院开源Claw Agent数据+训练+评测全链条

AI权威清洗： 一张肉眼难辨的图片，就能让GPT-5.4、Claude Opus 4.6集体造谣

终于，清华快手养出了通人性的AI！

登顶HuggingFace日榜！英伟达清华团队γ-World：把世界模型从单机打到联机

被困在考场里的大模型

AI权威清洗：一张肉眼难辨的图片，就能让GPT-5.4、Claude Opus 4.6集体造谣