Meta蔡志鹏新作VLM³:全面揭示三维视觉的Bitter Lesson
Meta蔡志鹏新作VLM³:全面揭示三维视觉的Bitter LessonMeta 发布了一项令人震撼的研究工作 VLM³,首次揭示了三维视觉学习的 Bitter Lesson:标准的视觉语言模型 + scale 数据就是最简单有效的范式,针对特定任务的架构、损失函数以及数据增强的设计,甚至是 regression 的 formulation,均不是三维视觉学习的必要条件。
搜索
Meta 发布了一项令人震撼的研究工作 VLM³,首次揭示了三维视觉学习的 Bitter Lesson:标准的视觉语言模型 + scale 数据就是最简单有效的范式,针对特定任务的架构、损失函数以及数据增强的设计,甚至是 regression 的 formulation,均不是三维视觉学习的必要条件。
数百万用户、超千万ARR,还能保持25%月环比增长,这是一家AI应用公司已经跑出来的真实数据。为什么大多数AI应用仍困在“用的人多、赚钱难”,而它却能持续增长?
奥特曼亲口承认,OpenAI内部token消费冠军月烧1000亿个,还不是全球第一。
如果你接触过“氛围编程”(Vibe coding)、开发过 AI 应用,或许会对 Supabase 的名字感到熟悉。它是全球无数独立开发者最信赖的默认后端之一,也在最近一年里,成了资本热捧的开源巨头。
北大彭宇新团队提出「美学照片重构」新任务,从摄影教学视频中自动构建数据集AesRecon,并开发两阶段模型AesFormer,通过优化构图、视角与人物姿态,提升照片的美感与艺术表现力。
近年来,大语言模型能力的提升,已不再仅仅依赖于更大的模型规模或更多的训练数据。越来越多的研究开始探索另一条路径:通过多个专家模型的协作来完成生成任务。
6月4日,Arena.ai发布Agent Arena排行榜,用373,431次真实会话的数据,给18个主流模型的Agent能力排了个座次。先看总榜。Agent Arena的排名依据是“净改进”(Net Improvement),用因果推断方法算出每个模型相对于随机基线的性能提升幅度。正值代表比随机选择更好,负值说明不如随机。
近日,AI制药独角兽Chai Discovery宣布与制药巨头辉瑞达成许合作许可。合作后辉瑞将获得Chai Discovery首次曝光的新一代模型Chai-3的优先访问权限,以及利用辉瑞专有数据、量身定制的定制模型。
复盘三年多的AI行情,就是一个不断找硬件瓶颈的过程:最开始涨GPU,后来涨服务器,再后来涨数据中心,然后涨电力,接着涨HBM存,现在又开始涨CPU、高速互联和ASIC。
近日,欧拉万象正式宣布再次完成超过亿元的天使轮融资,这也是欧拉万象三个月以来完成的第三轮融资。本轮融资由某产业资本、慕华科创、百度风投、玖兆投资、聚合资本联合投资,老股东持续跟投。这是欧拉万象继获得高瓴创投、五源资本、招商局创投等顶级机构密集加持后,再次迎来市场化与产业资本的重磅加注。