ICML 2026 Spotlight| 拒绝盲目猜token,阿里x浙大将投机解码带入弹性预算时代
ICML 2026 Spotlight| 拒绝盲目猜token,阿里x浙大将投机解码带入弹性预算时代随着大模型参数规模持续扩大,推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码(Speculative Decoding, SD)通过「小模型 draft + 大模型 verify」的方式,将多个候选 token 放到一次目标模型前向中并行验证,从而缓解自回归解码的串行瓶颈。
搜索
随着大模型参数规模持续扩大,推理成本已经成为生产级 LLM 服务的核心瓶颈。投机解码(Speculative Decoding, SD)通过「小模型 draft + 大模型 verify」的方式,将多个候选 token 放到一次目标模型前向中并行验证,从而缓解自回归解码的串行瓶颈。
家用电器是家庭服务机器人最难啃的一类任务对象。与桌面物体操作相比,家电操作不仅涉及按钮、旋钮、门体等多种异构部件,还受到模式切换、状态约束和程序逻辑的共同支配。真正完成一次家电任务,机器人往往既要「看得见」,也要「读得懂」,还要「按说明书做对」。
面壁智能正式发布并开源了 MiniCPM-V 系列新一代基础模型——MiniCPM-V 4.6。这款模型的整体参数规模仅约 1B(1.3B),是该系列有史以来参数规模最小的一款。但在多模态综合能力上,它却成功超越了被视为标杆的阿里 Qwen3.5-0.8B 和谷歌 Gemma 4 E2B-it,做到了「尺寸更小、效率更高、性能更好」。
美国众议院监督与政府改革委员会官网显示,该机构于当地时间5月8日向OpenAI联合创始人兼CEO萨姆·奥尔特曼(Sam Altman)发出正式调查函,要求其在5月22日前提供OpenAI全部利益冲突审查文件,并安排首席法务官等高管接受国会简报。此次调查的核心问题是,奥尔特曼是否利用其执掌的OpenAI,为其个人持有股权的外部公司人为抬高估值。
英伟达副总裁亲口承认AI算力账单超过员工工资。所有人都在抱怨AI贵,但很少有人追问一句:这些钱最后流到了哪里?一个答案是韩国。SK海力士Q1利润率72%;三星电子市值突破1万亿美元。这场盛宴的脚本,已经写到了2029年。
2026年5月13日,作为每年 Google I/O 的前哨站,同时也是关于最重要的部分——安卓的独立发布会,The Android Show在线上开幕,揭开了 2026 年 Google 在 Android 领域全系产品阵容的新品发布阵容。
AI投融资狂飙突进的两年,谁是最大金主?
上周,英伟达重仓美国玻璃大王康宁最多32亿美元(约合人民币217.47亿元)。消息一出康宁股价连飙5天,盘中最高暴涨30.33%,同时带动全球光通信板块全线冲高。今日,国内光模块龙头中际旭创盘中股价更是突破1000元,一跃成为A股历史上第十只千元股。
彭博社援引知情人士消息披露,AI初创公司Anthropic正在和投资者进行早期谈判,目标是筹集至少300亿美元的新资金 ,估值超过9000亿美元。知情人士透露,本轮融资预计最快于2026年5月底完成,不过交易尚未最终确定,也未签署任何条款清单。
一条「去GitHub上赚5美元」的指令,Codex跑了22小时,几天后带回16.88美元。钱不多,但如果Chris的复盘属实,AI第一次独立走完了找活、写代码、提PR、收款的完整闭环:AI会替你赚钱,这可能是第1单。