CVPR 2026最热方向,被一家杭州团队率先跑进了端侧!
CVPR 2026最热方向,被一家杭州团队率先跑进了端侧!刚刚,Om AI发布全球首个面向物理世界的端侧流式多模态模型系列——VLX。VLX主打真实世界的端侧与具身场景,总共三款模型,三天连发:这三款模型连起来,不仅构成了多模态模型持续感知、精准定位、行动决策的能力闭环。
搜索
刚刚,Om AI发布全球首个面向物理世界的端侧流式多模态模型系列——VLX。VLX主打真实世界的端侧与具身场景,总共三款模型,三天连发:这三款模型连起来,不仅构成了多模态模型持续感知、精准定位、行动决策的能力闭环。
南大王利民团队&腾讯混元的HYDRA系列(HYDRA,HYDRA-X)工作挑战了这个惯例,用一个基于ViT的统一视觉Tokenizer,帮助原生多模态模型更好地“看懂”和“创作”。训练一个基于ViT的Unified Tokenizer,使其同时具有理解和生成的能力,进而同时作为理解和生成的Autoencoder,来支持原生多模态模型(Unified Multimodal Models)的训练。
全球最昂贵的浪费,正发生在最聪明的公司里。当你正 Vibe Coding 嗨到不行,或者跑着的项目突然停摆,打开 CLI 工具一看,「你的额度已用完」字样出现时,心态不崩是不可能的。
来自 Sharpa、清华大学、UC Berkeley、上海交通大学、ETH Zurich 等机构的研究者提出了首个通用触觉基础策略 FTP-1。它基于约 3,000 小时、来自 26 个数据来源和 21 种触觉传感器的数据进行预训练
Kimi、智谱和 MiniMax 幕后的 “财务管家”Airwallex 空中云汇,正尝试回答 “AI 时代钱如何在全球丝滑流动” 这一难题。近期,Airwallex 完成 3.2 亿美元 H 轮融资,成为估值 110 亿美元超级独角兽。本轮融资由 Addition 领投,Baillie Gifford、 Amex Ventures 等几家欧美资本跟投
近期,基点起源完成了数亿元融资。半年前,我们第一次和基点起源创始人兼 CEO 戴宗宏交流时,这家逆流入局 B 端定制化的AI公司,刚刚推进了 7、8 个项目。戴宗宏对《智能涌现》透露,基点起源的订单数翻了一番,订单合同金额较半年前提升了一个数量级,AI 解决方案已经落地到了冶金、化工、精密制造、半导体、纺织等 10 多个行业。
千问输入法APP没等到,阿里云的全新AI输入法先上线了。 《读佳》获知,阿里云推出全新的AI语音输入法“CosyVoice”,这是一款以语音输入为主的智能语音输入法,支持多语种实时转写、方言识别、指令
大家都会以为,AI 会重构电商,甚至会完成自身的闭环交易,取代传统电商。但事实看起来却不是这样,ChatGPT 上线的 checkout 功能并没有获得预期的成功,Shopify、Amazon 这些电商平台依旧活得很好。
2025 年 12 月,OpenAI 联合多家实验室发布了一份湿实验室报告。报告给出了一个令人振奋的核心结论:GPT-5 通过多轮迭代,自主优化了一个分子克隆方案,效率提升了 79 倍。它提出了一种此前从未被报道过的酶组合——RecA 重组酶与噬菌体 T4 的 gp32 蛋白协同作用,让 DNA 末端配对效率大幅跃升。
智能手机之后的下一代AI硬件到底长什么样? 过去一年里,行业里涌现了无数激进的尝试——从挂在胸前的 AI Pin,到五脏俱全的 AI 掌机,它们无一不宣称要“重塑人机交互”。但激情退去后,真正留存下来