AI资讯新闻榜单内容搜索-模型训练

ICML 2026 | 大模型为什么算不对加法？南大团队提出等本位和轨迹，揭示LLM算术错误的几何机制

尽管大语言模型（Large Language Models, LLMs）在复杂数学推理、代码生成和知识问答上表现突出，但它们仍常在多位数加法这类基础算术任务上犯错。

来自主题: AI技术研报

7420 点击 2026-06-17 14:05

ICML 2026 | Agentic强化学习训练的信息自锁问题

随着大语言模型逐步从「单轮问答」走向「真实环境中的持续交互」，LLM agents 正在被用于越来越复杂的 agentic applications：deep research、coding、computer use、customer service、medical inquiry、troubleshooting 等等。

来自主题: AI技术研报

6045 点击 2026-06-17 14:05

从贝叶斯到大语言模型：一文详解「时序点过程」近年进展

机器学习已经习惯了处理序列：一句话中的词、视频中的帧、推荐系统中的点击、金融市场中的订单。但在很多真实场景里，数据并不是按固定步长排好队出现的。

来自主题: AI技术研报

8128 点击 2026-06-17 09:53

给机器人装安全护栏，北航联合团队提出RoboSafe，让具身智能体在物理世界中安全行动

当大模型开始控制机械臂、家用机器人时，“安全”这件事也变得不一样了。

来自主题: AI技术研报

8178 点击 2026-06-17 09:52

视觉latent reasoning为什么不稳？这篇论文从特征空间找到了关键缺口

导读：视觉 latent reasoning 希望让多模态模型在内部生成连续 latent token，用这些中间表示补充多模态理解和推理任务中缺失的视觉证据。但问题在于，模型生成出来的 latent token 可能并不落在它原本熟悉的视觉输入空间里；如果模型无法稳定读取这些 token，它们就很难成为有效的中间视觉证据。

来自主题: AI技术研报

5739 点击 2026-06-16 13:56