AI资讯新闻榜单内容搜索-模型

0.6B VLM重塑AI修图推理流程，支持手机端侧部署，vivo+浙大出品

如今手机拍照已成日常，后期修图是提升照片质感的关键。

来自主题: AI技术研报

9478 点击 2026-06-15 09:21

BudgetMem：给Runtime Agent Memory装上「预算路由器」，让记忆系统学会按需分配运行成本

当 LLM Agent 处理长期对话、多轮交互和复杂文档时，Memory 已经成为不可或缺的核心模块。它帮助智能体保存历史、检索信息、维持个性化上下文，并支撑跨时间的推理能力。

来自主题: AI技术研报

8542 点击 2026-06-15 09:20

华为SpaceMind登顶空间智能权威榜：纯RGB视觉语言模型拿下70.6分，刷新李飞飞榜单记录

大模型已经能流畅对话、看图识物，但一个更底层的问题始终没被真正解决——它们是否「理解」了我们所处的三维世界？

来自主题: AI技术研报

5880 点击 2026-06-15 09:19

图片越糊越危险？西湖大学发现多模态大模型「攻击舒适区」

多模态大模型越来越会读图中文字，但最新研究显示，「读得出来」并不等于「防得住」。西湖大学 AGI Lab 的研究团队发现，当有害文本被渲染成低清、模糊或带噪图片后，模型在一个特定清晰度区间内反而更容易被越狱。

来自主题: AI技术研报

7029 点击 2026-06-15 09:19

看不清就乱答？多模态大模型的这个毛病终于有解了 | ICML 2026

雨雪、雾霾、镜头噪点、压缩失真、夜间弱光……

来自主题: AI技术研报

7318 点击 2026-06-15 09:19

KV Cache终于不用无脑全留了！百度&复旦用「投资回报率」重新分配缓存｜ICML 2026

随着AI Coding、Agent、Deep Research 等应用快速普及，模型单次处理的上下文长度正在从几万Token迈向几十万甚至百万Token。

来自主题: AI技术研报

9508 点击 2026-06-15 09:18

CVPR 2026 | GaussianDWM：用3D高斯表示统一自动驾驶场景理解与多模态生成

自动驾驶世界模型的研究目标已经从单纯预测未来视觉帧，扩展到构建可用于场景理解、空间定位和后续决策的世界表示。如果模型只能生成外观上合理的未来图像，却无法回答场景中有哪些目标、目标位于何处，以及不同视角下的空间结构如何变化，那么它仍然缺少对三维驾驶环境的显式建模能力。

来自主题: AI技术研报

9382 点击 2026-06-15 09:18

专注低功耗AI模型的初创公司Flourish Inc. 完成5亿美元融资，开发能在50瓦以下芯片上运行的类脑AI模型，突破当前推理需300瓦GPU能耗瓶颈

近日，专注低功耗AI模型的初创公司Flourish Inc. 完成5亿美元融资。本次融资由GV、Lux Capital、Catalio Capital Management等知名投资机构及杰夫·贝索斯参与投资。本轮融资亦是2026年6月初全球规模最大的融资轮次之一。

来自主题: AI资讯

9105 点击 2026-06-14 21:18

AI圈懵了：一家巴西市政IT公司开源大模型Rio 3.5 397B杀进了全球第一梯队

今天，除了全球（非美）被禁的 Claude Fable 5，AI 社区还被一个开源模型刷屏了。有推特博主发现，一个由巴西里约热内卢市政府旗下 IT 公司开源的模型 Rio 3.5 397B，在多项基准测试中超越了 Qwen 3.7 Plus 等开源模型，而这个模型的基础模型还是 Qwen3.5-397B-A17B。

来自主题: AI资讯

10105 点击 2026-06-14 16:05

平替版Fable 5的打开教程来了：性能追平，成本砍半

最新测试显示，模型抱团后实力明显升级：Opus 4.8+GPT-5.5>Fable 5；Kimi K2.6+ DeepSeek V4 Pro+Gemini 3 Flash=Fable 5。能力追上了，开销还减半。根据官方定价，相比Fable 5，Kimi K2.6+ DeepSeek V4 Pro+Gemini 3 Flash这套平价阵容，成本降幅接近80%。

来自主题: AI资讯

9547 点击 2026-06-14 16:04