AI资讯新闻榜单内容搜索-长上下文

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 长上下文

不是幻觉！Claude自下指令甩锅人类，百万上下文沦为降智重灾区

不是幻觉！Claude自下指令甩锅人类，百万上下文沦为降智重灾区

不是幻觉！Claude自下指令甩锅人类，百万上下文沦为降智重灾区

Claude深陷「角色混淆」Bug，分不清自己的话与用户指令，长上下文成了降智「重灾区」。

来自主题: AI技术研报

7230 点击 2026-05-14 15:02

DeepSeek-V4 预览版：迈入百万上下文普惠时代

DeepSeek-V4 预览版：迈入百万上下文普惠时代

DeepSeek-V4 预览版：迈入百万上下文普惠时代

今天，我们全新系列模型 DeepSeek-V4 的预览版本正式上线并同步开源。DeepSeek-V4 拥有百万字超长上下文，在 Agent 能力、世界知识和推理性能上均实现国内与开源领域的领先。模型按大小分为两个版本：

来自主题: AI资讯

8887 点击 2026-04-24 11:20

Kimi新论文：把KVCache玩成新商业模式了

Kimi新论文：把KVCache玩成新商业模式了

Kimi新论文：把KVCache玩成新商业模式了

把长上下文做到极致的Kimi又发新成果！

来自主题: AI技术研报

7306 点击 2026-04-20 09:46

Mac用户可以在oMLX中使用TurboQuant了，搭配Gemma-4-31B，谷歌全家桶实测很能打！

Mac用户可以在oMLX中使用TurboQuant了，搭配Gemma-4-31B，谷歌全家桶实测很能打！

Mac用户可以在oMLX中使用TurboQuant了，搭配Gemma-4-31B，谷歌全家桶实测很能打！

对本地部署玩家，尤其是Mac用户来说，长上下文推理最大的痛点往往不是“模型不够聪明”，而是稍微多用点上下文，统一内存就被撑爆了”，这一点在最近的Gemma-4 31B的部署中尤为明显，在同等上下文的情况，显存占用比Qwen3.5-27B高约一倍不止，直接劝退了不少人。但好消息是，谷歌近期提出的TurboQuant KV缓存量化算法，正是为了解决这个痛点而生。

来自主题: AI技术研报

8261 点击 2026-04-09 09:47

2倍提速！KV缓存压缩不只看重要性，上交大团队让模型推理「又快又稳」 | ICLR'26

2倍提速！KV缓存压缩不只看重要性，上交大团队让模型推理「又快又稳」 | ICLR'26

2倍提速！KV缓存压缩不只看重要性，上交大团队让模型推理「又快又稳」 | ICLR'26

长上下文推理已经成了VLM/LLM的默认形态。

来自主题: AI技术研报

5904 点击 2026-04-01 09:40

对抗KV Cache压缩的脆弱性：两行代码以最坏风险控制防御底层假设崩塌

对抗KV Cache压缩的脆弱性：两行代码以最坏风险控制防御底层假设崩塌

对抗KV Cache压缩的脆弱性：两行代码以最坏风险控制防御底层假设崩塌

随着大模型长上下文能力快速增长，海量 KV Cache 存储需求急剧增加，各类 KV Cache 压缩方法如雨后春笋般涌现。然而，这些方案在真实场景中的工程落地却常常陷入困境。

来自主题: AI技术研报

9191 点击 2026-03-25 13:41

东方理工团队提出HiDrop：重构MLLM计算路径，压缩90%视觉Token实现2.2倍加速

东方理工团队提出HiDrop：重构MLLM计算路径，压缩90%视觉Token实现2.2倍加速

东方理工团队提出HiDrop：重构MLLM计算路径，压缩90%视觉Token实现2.2倍加速

随着多模态大语言模型（MLLM）支持更长上下文，高分辨率图像和长视频会产生远多于文本的视觉 Token，在自注意力二次复杂度下迅速成为效率瓶颈。

来自主题: AI技术研报

9300 点击 2026-03-24 10:13

融资34亿！谷歌前TPU员工创业新型芯片，卡帕西也投了

融资34亿！谷歌前TPU员工创业新型芯片，卡帕西也投了

融资34亿！谷歌前TPU员工创业新型芯片，卡帕西也投了

在他们看来，真正的胜负手不在于单点技能拉满，而在于能否在同一颗芯片里，把“训练级吞吐”和“推理级低延迟”同时做好——尤其是在长上下文、Agent循环这些更复杂的真实工作流中。

来自主题: AI资讯

8454 点击 2026-02-25 14:49

Claude最强Sonnet模型4.6来了，百万token上下文

Claude最强Sonnet模型4.6来了，百万token上下文

Claude最强Sonnet模型4.6来了，百万token上下文

这次是 Anthropic，率先发布了他们称之为「我们目前能力最强的 Sonnet 模型」Claude Sonnet 4.6。Claude 称，新模型对编码、计算机使用、长上下文推理、智能体规划、知识工作和设计进行了全面升级。

来自主题: AI资讯

9071 点击 2026-02-18 22:42

Claude Sonnet 4.6空降！Office性能干翻旗舰模型，软件股哀嚎一片

Claude Sonnet 4.6空降！Office性能干翻旗舰模型，软件股哀嚎一片

Claude Sonnet 4.6空降！Office性能干翻旗舰模型，软件股哀嚎一片

今日凌晨，Anthropic推出史上最强Sonnet模型——Claude Sonnet 4.6，新模型在编程、计算机使用、长上下文推理、Agent规划、知识工作和设计工作上全面进化。

来自主题: AI资讯

9830 点击 2026-02-18 11:44

上一页当前第1页,共9页下一页