AI资讯新闻榜单内容搜索-模型

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: 模型
比全球最强推理引擎还快2倍,斯坦福、普林斯顿破解大模型「串行魔咒」

比全球最强推理引擎还快2倍,斯坦福、普林斯顿破解大模型「串行魔咒」

比全球最强推理引擎还快2倍,斯坦福、普林斯顿破解大模型「串行魔咒」

在大语言模型推理领域,虽然「推测解码」(Speculative Decoding,SD)已成为加速生成的标准配置,但它依然存在一个致命弱点: drafting(草拟)和 verification(验证)之间必须串行进行。

来自主题: AI技术研报
7401 点击    2026-04-01 16:20
ICLR 2026 | 中国联通提出扩散模型缓存框架MeanCache,刷新多模态生成模型推理加速新基准

ICLR 2026 | 中国联通提出扩散模型缓存框架MeanCache,刷新多模态生成模型推理加速新基准

ICLR 2026 | 中国联通提出扩散模型缓存框架MeanCache,刷新多模态生成模型推理加速新基准

FLUX 、Qwen-Image 等多模态生成模型的推理速度一直是工业级多模态模型落地的痛点。传统的特征缓存(Feature Caching)方案在追求高倍率加速时,常因瞬时速度的剧烈波动导致轨迹漂移。

来自主题: AI技术研报
7623 点击    2026-04-01 16:13
多模态不是拼模块,千问新模型证明了最关键的一件事

多模态不是拼模块,千问新模型证明了最关键的一件事

多模态不是拼模块,千问新模型证明了最关键的一件事

林俊旸离职了,但 Qwen 不能停。最近 Qwen3.5-Omni 发布,一个原生全模态大模型,文本、图片、音频、视频的理解与生成,集于一身。 这不是第一个试图「什么都做」的模型。过去两年,多模态是所

来自主题: AI资讯
7022 点击    2026-04-01 15:50
国内大模型厂商 Token/Coding Plan 汇总对比:MiniMax、智谱、阶跃、Kimi 怎么选

国内大模型厂商 Token/Coding Plan 汇总对比:MiniMax、智谱、阶跃、Kimi 怎么选

国内大模型厂商 Token/Coding Plan 汇总对比:MiniMax、智谱、阶跃、Kimi 怎么选

我自己用 Coding Plan 也有一段时间了,最开始只是为了省点 API 钱,后来各家陆续推出固定月费套餐,我发现选起来比想象中复杂。Codex、Claude Code、Cline、OpenClaw 这些工具让开发者越来越习惯用自然语言驱动代码生成和任务执行,但高频调用带来的 API 成本也成了一笔固定开销。

来自主题: AI资讯
9650 点击    2026-04-01 10:49
别等ASI了!OpenAI上演「资产大逃亡」,模型只是流量诱饵

别等ASI了!OpenAI上演「资产大逃亡」,模型只是流量诱饵

别等ASI了!OpenAI上演「资产大逃亡」,模型只是流量诱饵

全世界都在等ASI降临,OpenAI却在年初悄悄上线广告位。9亿用户撑不起数百亿美元的算力账单,智力正在贬值,神仙也得下凡赚钱!

来自主题: AI资讯
7049 点击    2026-04-01 10:14
NVIDIA GTC上登顶的DeepResearch Bench,到底在评什么?

NVIDIA GTC上登顶的DeepResearch Bench,到底在评什么?

NVIDIA GTC上登顶的DeepResearch Bench,到底在评什么?

3 月 16 日,在刚刚结束的 NVIDIA GTC 2026 大会上,黄仁勋在长达三小时的 Keynote 演讲中发布了 NVIDIA Agent Toolkit 和 AI-Q 开放智能体蓝图,将 AI Agent 定位为下一个重大前沿。

来自主题: AI技术研报
8352 点击    2026-04-01 09:39
智谱年报发布:收入结构翻转,MaaS 增长 60 倍

智谱年报发布:收入结构翻转,MaaS 增长 60 倍

智谱年报发布:收入结构翻转,MaaS 增长 60 倍

3 月 31 日,智谱(02513.HK)发布上市后首份年度业绩。2025 年全年收入 7.24 亿人民币,同比增长 132%,是国内收入规模最大的大模型公司。同时,MaaS API 平台 ARR 约 17 亿人民币(约 2.5 亿美金),过去 12 个月增长 60 倍

来自主题: AI资讯
8836 点击    2026-03-31 23:19
从Claude Code刚泄漏的源码,看当前第一梯队 AI Agent 的工程架构

从Claude Code刚泄漏的源码,看当前第一梯队 AI Agent 的工程架构

从Claude Code刚泄漏的源码,看当前第一梯队 AI Agent 的工程架构

对于 Anthropic 而言,这是继前几天 Mythos 模型文档外泄后的又一次严重 OpSec事故。但对于整个大模型应用层的开发者和行业研究者来说,这份源码却是一份毫无保留的、价值极高的前沿 AI Agent 工程架构白皮书。

来自主题: AI资讯
8624 点击    2026-03-31 19:55
对标英伟达EgoScale数据路径,清华系孵化星忆科技拿到首轮融资

对标英伟达EgoScale数据路径,清华系孵化星忆科技拿到首轮融资

对标英伟达EgoScale数据路径,清华系孵化星忆科技拿到首轮融资

具身数据层的全球竞赛正在迅速升温。NVIDIA Research在2026年发布EgoScale数据与训练框架,在Ego-centric人类操作视频上训练VLA模型,用 20,854小时带动作标注的第一人称人类视频,观察到数据规模和验证损失之间接近对数线性的scaling law。1X收集人类第一视角及家庭行为数据,通过 Sunday项目采集百万小时级家庭场景视频。

来自主题: AI资讯
6822 点击    2026-03-31 15:03