AI资讯新闻榜单内容搜索-大语言模型

ICML26 | 浙江理工大学马啸讲师和南京大学李武军教授课题组联合提出EMCES：为强化学习合成更有价值的样本

近年来，强化学习在游戏智能体、具身智能、大语言模型等领域取得了显著进展。然而，在真实世界中，强化学习仍面临一个核心难题：高质量样本的获取不仅成本高昂，还可能带来多种风险。因此，样本增强成为缓解强化学习中样本获取成本高、风险大等问题的重要途径之一。

来自主题: AI技术研报

9658 点击 2026-07-02 14:31

ICML 2026 Oral｜大模型的能力从哪些训练数据来？北大&智源提出「机理数据归因」

近年来，大语言模型展现出了越来越强的能力，从上下文学习（In-Context Learning, ICL）到复杂推理、代码生成，这些能力不断刷新人们对模型能力边界的认知。

来自主题: AI技术研报

9018 点击 2026-06-29 09:19

刚刚，OpenAI发布首款AI芯片，九个月完成流片

美国当地时间6月24日，OpenAI与博通联合发布了双方合作的首款定制芯片Jalapeño。这是一款专用集成电路（ASIC），专门针对大语言模型的推理任务而设计，也标志着OpenAI正式进军AI芯片领域。

来自主题: AI资讯

10256 点击 2026-06-25 00:11

直接从像素到单词：这个原生大模型统一单图、多图、视频和空间智能

今天几乎所有主流视觉语言模型（VLM）—— 无论是 Qwen-VL、InternVL，还是 LLaVA 系列 —— 都遵循着同一套经典架构：先用预训练视觉编码器（如 CLIP、SigLIP）将图像压缩为特征，再通过投影层把这些特征送入大语言模型。

来自主题: AI技术研报

7521 点击 2026-06-24 16:06

从“一句成片”到“长轨推演”：探究多模态智能体在长视频编辑中的应用

近年来，大语言模型（LLMs）在长篇视觉叙事中展现出卓越潜力，生产方式正迅速从单一模型生成转向面向生产的智能体系统。但长视频剪辑仍然是一个极难控制的长期任务。模型有时会在缺乏素材依据的情况下强行生成，甚至在面对明显断档的转场或人物不一致时依然“盲目拼接”。

来自主题: AI技术研报

9839 点击 2026-06-21 10:41

谷歌CEO罕见承认落后了！Gemini 3.5 Pro被曝难产

据最新独家爆料，谷歌目前正在紧锣密鼓地对即将发布的重磅大语言模型Gemini 3.5 Pro进行高强度的激进迭代，在正式揭晓之前，内部预计还会测试更多的版本。

来自主题: AI资讯

9336 点击 2026-06-21 10:36

腾讯混元最新开源：一套RL框架打通多个模态，庞天宇团队新作

大语言模型的RL技术已日趋成熟，多模态生成模型的强化学习训练却仍在“各自为战”——图像扩散模型一套流程、视频生成另一套标准、VLM和LLM又有不同的技术栈。

来自主题: AI技术研报

7206 点击 2026-06-18 11:25

ICML 2026 | 大模型为什么算不对加法？南大团队提出等本位和轨迹，揭示LLM算术错误的几何机制

尽管大语言模型（Large Language Models, LLMs）在复杂数学推理、代码生成和知识问答上表现突出，但它们仍常在多位数加法这类基础算术任务上犯错。

来自主题: AI技术研报

7426 点击 2026-06-17 14:05

ICML 2026 | Agentic强化学习训练的信息自锁问题

随着大语言模型逐步从「单轮问答」走向「真实环境中的持续交互」，LLM agents 正在被用于越来越复杂的 agentic applications：deep research、coding、computer use、customer service、medical inquiry、troubleshooting 等等。

来自主题: AI技术研报

6049 点击 2026-06-17 14:05

从贝叶斯到大语言模型：一文详解「时序点过程」近年进展

机器学习已经习惯了处理序列：一句话中的词、视频中的帧、推荐系统中的点击、金融市场中的订单。但在很多真实场景里，数据并不是按固定步长排好队出现的。

来自主题: AI技术研报

8133 点击 2026-06-17 09:53