AI资讯新闻榜单内容搜索-AI

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: AI

视频生成作为多模态推理新范式 | CVPR 2026

视频生成作为多模态推理新范式 | CVPR 2026

视频生成作为多模态推理新范式 | CVPR 2026

被CVPR 2026收录！

来自主题: AI技术研报

9870 点击 2026-06-15 09:47

Claude Fable 5四日惊魂

Claude Fable 5四日惊魂

Claude Fable 5四日惊魂

从万众期待的「AI 封神时刻」，到美国政府一纸禁令强制下线 —— 这个名字中有 5 的模型，没活过 5 天。

来自主题: AI资讯

7657 点击 2026-06-15 09:46

专访Seede.ai创始人龙翊：二本，高中挖币，大四辍学，现在拿300万美金天使投资，去做小商贩一张海报几毛钱的生意

专访Seede.ai创始人龙翊：二本，高中挖币，大四辍学，现在拿300万美金天使投资，去做小商贩一张海报几毛钱的生意

专访Seede.ai创始人龙翊：二本，高中挖币，大四辍学，现在拿300万美金天使投资，去做小商贩一张海报几毛钱的生意

你为什么选了做视觉有关的方向呢？跟你对市场、对成都的观察有关吗？我们现在用的很多传统的 APP，包括很多操作系统，我觉得未来会被替代掉的。因为很多是很“反人类”的设计。这些东西的本质是“系统状态的流转”，没有一个正常人喜欢用这些系统。而这部分，数据的流转，是 Agent 能替我们做的。最终一定会剩下一些简洁的信息要呈现给人——我们做的，反而应该是这个部分。

来自主题: AI资讯

10337 点击 2026-06-15 09:26

0.6B VLM重塑AI修图推理流程，支持手机端侧部署，vivo+浙大出品

0.6B VLM重塑AI修图推理流程，支持手机端侧部署，vivo+浙大出品

0.6B VLM重塑AI修图推理流程，支持手机端侧部署，vivo+浙大出品

如今手机拍照已成日常，后期修图是提升照片质感的关键。

来自主题: AI技术研报

9519 点击 2026-06-15 09:21

BudgetMem：给Runtime Agent Memory装上「预算路由器」，让记忆系统学会按需分配运行成本

BudgetMem：给Runtime Agent Memory装上「预算路由器」，让记忆系统学会按需分配运行成本

BudgetMem：给Runtime Agent Memory装上「预算路由器」，让记忆系统学会按需分配运行成本

当 LLM Agent 处理长期对话、多轮交互和复杂文档时，Memory 已经成为不可或缺的核心模块。它帮助智能体保存历史、检索信息、维持个性化上下文，并支撑跨时间的推理能力。

来自主题: AI技术研报

8573 点击 2026-06-15 09:20

华为SpaceMind登顶空间智能权威榜：纯RGB视觉语言模型拿下70.6分，刷新李飞飞榜单记录

华为SpaceMind登顶空间智能权威榜：纯RGB视觉语言模型拿下70.6分，刷新李飞飞榜单记录

华为SpaceMind登顶空间智能权威榜：纯RGB视觉语言模型拿下70.6分，刷新李飞飞榜单记录

大模型已经能流畅对话、看图识物，但一个更底层的问题始终没被真正解决——它们是否「理解」了我们所处的三维世界？

来自主题: AI技术研报

5916 点击 2026-06-15 09:19

图片越糊越危险？西湖大学发现多模态大模型「攻击舒适区」

图片越糊越危险？西湖大学发现多模态大模型「攻击舒适区」

图片越糊越危险？西湖大学发现多模态大模型「攻击舒适区」

多模态大模型越来越会读图中文字，但最新研究显示，「读得出来」并不等于「防得住」。西湖大学 AGI Lab 的研究团队发现，当有害文本被渲染成低清、模糊或带噪图片后，模型在一个特定清晰度区间内反而更容易被越狱。

来自主题: AI技术研报

7057 点击 2026-06-15 09:19

看不清就乱答？多模态大模型的这个毛病终于有解了 | ICML 2026

看不清就乱答？多模态大模型的这个毛病终于有解了 | ICML 2026

看不清就乱答？多模态大模型的这个毛病终于有解了 | ICML 2026

雨雪、雾霾、镜头噪点、压缩失真、夜间弱光……

来自主题: AI技术研报

7341 点击 2026-06-15 09:19

KV Cache终于不用无脑全留了！百度&复旦用「投资回报率」重新分配缓存｜ICML 2026

KV Cache终于不用无脑全留了！百度&复旦用「投资回报率」重新分配缓存｜ICML 2026

KV Cache终于不用无脑全留了！百度&复旦用「投资回报率」重新分配缓存｜ICML 2026

随着AI Coding、Agent、Deep Research 等应用快速普及，模型单次处理的上下文长度正在从几万Token迈向几十万甚至百万Token。

来自主题: AI技术研报

9549 点击 2026-06-15 09:18

CVPR 2026 | GaussianDWM：用3D高斯表示统一自动驾驶场景理解与多模态生成

CVPR 2026 | GaussianDWM：用3D高斯表示统一自动驾驶场景理解与多模态生成

CVPR 2026 | GaussianDWM：用3D高斯表示统一自动驾驶场景理解与多模态生成

自动驾驶世界模型的研究目标已经从单纯预测未来视觉帧，扩展到构建可用于场景理解、空间定位和后续决策的世界表示。如果模型只能生成外观上合理的未来图像，却无法回答场景中有哪些目标、目标位于何处，以及不同视角下的空间结构如何变化，那么它仍然缺少对三维驾驶环境的显式建模能力。

来自主题: AI技术研报

9410 点击 2026-06-15 09:18

上一页当前第71页,共2574页下一页