AI资讯新闻榜单内容搜索-模型推理

DeepSeek点燃大模型效率之争，阶跃火速接棒：JetSpec让大模型解码速度最高提升近10倍

近期，DeepSeek发布DSpark让大模型推理效率再次成为行业焦点。

来自主题: AI技术研报

9842 点击 2026-06-30 15:11

TRM思考奖励模型上线，大模型推理质量终于能量化了 | ICML‘26 Oral

大模型推理能力越来越强，但答案对了，思考过程就一定好吗？

来自主题: AI技术研报

6070 点击 2026-06-24 16:03

当SFT遇上RL：基于样本学习阶段的动态策略优化机制

过去一段时间里，在围绕大模型推理能力增强的研究中，SFT 和 RL 是两类核心后训练范式 —— 前者稳定收敛快，能高效吸收高质量推理数据；后者更具探索性，有望推动模型实现复杂推理和分布外泛化。

来自主题: AI技术研报

6974 点击 2026-05-18 09:53

ICML 2026 | 将多教师冲突转化为动态约束，破解多模态大模型推理对齐难题

在多模态大模型（MLLM）快速发展的浪潮中，融合多模型 “集体智慧” 已成为提升模型性能的关键路径，并催生了多教师知识蒸馏这一主流范式。然而，不同来源的教师模型在架构与优化上的差异，其在相似推理过程中呈现出不稳定甚至偏移的认知轨迹，即 “概念漂移”（Concept Drift）。

来自主题: AI技术研报

8063 点击 2026-05-14 09:30

上海AI Lab新研究：SFT能泛化，只要满足这三个条件

随着大模型后训练（Post-training）技术的发展，强化学习（RL）在提升模型推理能力方面的表现备受瞩目。

来自主题: AI技术研报

9398 点击 2026-05-13 09:59

让AI给林黛玉找个外国平替？大模型的文科推理有多离谱？

如果你让大模型给林黛玉找一个外国文学里的平替，它能给出令人信服的答案吗？这个脑洞的背后其实是当下人工智能最核心的软肋——“类比推理”能力。

来自主题: AI技术研报

9116 点击 2026-05-11 16:47

英伟达力荐，小团队两个月开源一款「光速级」智能体推理引擎

智能体时代的核心是算力。

来自主题: AI技术研报

9072 点击 2026-05-08 10:23

GRPO遭遇瓶颈？G²RPO-A让自适应指导为小模型推理能力「开外挂」

大模型时代的「炼金术师」们，或许都曾面临一个共同的困扰：当我们试图将 DeepSeek-R1、OpenAI-o1 那种惊艳的推理能力迁移到小规模语言模型（SLMs）时，效果却总是差强人意。现有的强化学习方法如 GRPO 在 7B+ 的大模型上效果显著，但一旦应用到 1.7B 甚至更小参数的模型上，性能提升就微乎其微。

来自主题: AI技术研报

8571 点击 2026-05-07 10:16

普通网线也能跑万亿大模型！月之暗面抛出王炸架构，亲证：不用全买 H100！1T模型实测：延迟暴降64%！大模型推理“围城”攻破了！

在 AI 工程界，长文本推理一直是个“富贵病”。

来自主题: AI技术研报

8529 点击 2026-04-21 16:16

小模型用不好Skill？新范式SKILL0让模型学会Skill的底层逻辑，3B模型推理token省5倍

浙江大学联合美团龙猫团队、清华大学推出全新研究成果——SKILL0，并提出技能内化（Skill Internalization）——小模型真正需要的，或许不是推理时的“外挂技能”，而是将技能内化为本能。

来自主题: AI技术研报

8752 点击 2026-04-12 11:56