AI资讯新闻榜单内容搜索-压缩

腾讯发布SpecExit算法，无损压缩端到端加速2.5倍！解决大模型长思考效率难题

为破解大模型长思维链的效率难题，并且为了更好的端到端加速落地，我们将思考早停与投机采样无缝融合，提出了 SpecExit 方法，利用轻量级草稿模型预测 “退出信号”，在避免额外探测开销的同时将思维链长度缩短 66%，vLLM 上推理端到端加速 2.5 倍。

来自主题: AI技术研报

8889 点击 2025-10-24 16:53

DeepSeek最新开源的模型，已经被硅谷夸疯了！

来自主题: AI技术研报

8759 点击 2025-10-22 11:57

AI新突破！DeepSeek-OCR以像素处理文本，压缩率小于1/10，基准测试领跑。开源一夜4.4k星，Karpathy技痒难耐，展望视觉输入的通用性。

来自主题: AI技术研报

8041 点击 2025-10-21 16:48

大语言模型（LLM）不仅在推动通用自然语言处理方面发挥了关键作用，更重要的是，它们已成为支撑多种下游应用如推荐、分类和检索的核心引擎。尽管 LLM 具有广泛的适用性，但在下游任务中高效部署仍面临重大挑战。

来自主题: AI技术研报

7441 点击 2025-10-21 11:43

刚刚，DeepSeek 推出了全新的视觉文本压缩模型 DeepSeek-OCR。该模型最大的突破在于极高的压缩效率： 20 个节点每天可处理 3300 万页数据，硬件要求仅为 A100-40G。

来自主题: AI资讯

12765 点击 2025-10-20 16:30

当大语言模型生成海量数据时，数据存储的难题也随之而来。对此，华盛顿大学（UW）SyFI实验室的研究者们提出了一个创新的解决方案：LLMc，即利用大型语言模型自身进行无损文本压缩的引擎。

来自主题: AI技术研报

7230 点击 2025-10-12 11:00

GPT-5正改写科学发现的规则！一篇重磅论文揭秘，「量子版NP难题」竟被GPT-5在30分钟之内攻克了，然而这要耗费人类1-2周的时间。照这种速度发展下去，AI离完成「诺奖级」突破真的不远了。

来自主题: AI资讯

11179 点击 2025-09-29 11:00

AI播客如豆包和NotebookLM本质是信息压缩工具，通过对话形式摘要文本，但无法复制人类播客的核心价值，包括观点碰撞、情感经验和责任承担。真正播客魅力源于真人不可预测性和风险意愿。AI应作为辅助用于资料整理、剪辑或转写，而非替代主播。名字“AI播客”误导性地暗示创作能力。

来自主题: AI资讯

9388 点击 2025-09-25 10:25

行业首个具备“高刷”视频理解能力的多模态模型MiniCPM-V 4.5的技术报告正式发布！报告提出统一的3D-Resampler架构实现高密度视频压缩、面向文档的统一OCR和知识学习范式、可控混合快速/深度思考的多模态强化学习三大技术。

来自主题: AI技术研报

9201 点击 2025-09-24 10:52

天玑9500围绕这一目标重构芯片底座：首发双NPU架构，结合存算一体、硬件压缩等多项关键技术，在ETHZ苏黎世移动SoC AI榜单中蝉联榜首，相比上一代跑分翻倍。

来自主题: AI资讯

10626 点击 2025-09-23 10:13