AI资讯新闻榜单内容搜索-大模型推理

DeepSeek点燃大模型效率之争，阶跃火速接棒：JetSpec让大模型解码速度最高提升近10倍

近期，DeepSeek发布DSpark让大模型推理效率再次成为行业焦点。

来自主题: AI技术研报

10138 点击 2026-06-30 15:11

TRM思考奖励模型上线，大模型推理质量终于能量化了 | ICML‘26 Oral

大模型推理能力越来越强，但答案对了，思考过程就一定好吗？

来自主题: AI技术研报

6184 点击 2026-06-24 16:03

当SFT遇上RL：基于样本学习阶段的动态策略优化机制

过去一段时间里，在围绕大模型推理能力增强的研究中，SFT 和 RL 是两类核心后训练范式 —— 前者稳定收敛快，能高效吸收高质量推理数据；后者更具探索性，有望推动模型实现复杂推理和分布外泛化。

来自主题: AI技术研报

7137 点击 2026-05-18 09:53

ICML 2026 | 将多教师冲突转化为动态约束，破解多模态大模型推理对齐难题

在多模态大模型（MLLM）快速发展的浪潮中，融合多模型 “集体智慧” 已成为提升模型性能的关键路径，并催生了多教师知识蒸馏这一主流范式。然而，不同来源的教师模型在架构与优化上的差异，其在相似推理过程中呈现出不稳定甚至偏移的认知轨迹，即 “概念漂移”（Concept Drift）。

来自主题: AI技术研报

8149 点击 2026-05-14 09:30

让AI给林黛玉找个外国平替？大模型的文科推理有多离谱？

如果你让大模型给林黛玉找一个外国文学里的平替，它能给出令人信服的答案吗？这个脑洞的背后其实是当下人工智能最核心的软肋——“类比推理”能力。

来自主题: AI技术研报

9154 点击 2026-05-11 16:47

英伟达力荐，小团队两个月开源一款「光速级」智能体推理引擎

智能体时代的核心是算力。

来自主题: AI技术研报

9137 点击 2026-05-08 10:23

普通网线也能跑万亿大模型！月之暗面抛出王炸架构，亲证：不用全买 H100！1T模型实测：延迟暴降64%！大模型推理“围城”攻破了！

在 AI 工程界，长文本推理一直是个“富贵病”。

来自主题: AI技术研报

8617 点击 2026-04-21 16:16

独家｜聚焦大模型推理，水下AI芯片公司斩获10亿元Pre-A轮融资

ZP独家获悉，AI芯片及系统架构研发商“上海昉擎科技”于近日完成 Pre-A3 轮融资，新引入投资人国开科创、钧山资本、建发新兴投资、多维资本，多维资本担任本轮融资财务顾问并担任后续融资独家财务顾问。

来自主题: AI资讯

9071 点击 2026-03-09 10:49

DeepSeek新论文来了！联手清华、北大，优化智能体大模型推理

「DeepSeek V4 来了！」这样的消息是不是已经听烦了？总结来说，这篇新论文介绍了一个名为「DualPath」的创新推理系统，专门针对智能体工作负载下的大语言模型（LLM）推理性能进行优化。具体来讲，通过引入「双路径 KV-Cache 加载」机制，解决了在预填充 - 解码（PD）分离架构下，KV-Cache 读取负载不平衡的问题。

来自主题: AI技术研报

9221 点击 2026-02-27 11:35

vLLM团队官宣创业：融资1.5亿美元，清华特奖游凯超成为联创

大模型推理的基石 vLLM，现在成为创业公司了。

来自主题: AI资讯

7398 点击 2026-01-23 11:24