AI资讯新闻榜单内容搜索-CVPR

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: CVPR

CVPR 2025｜视频抠图MatAnyone来了，一次指定全程追踪，发丝级还原

CVPR 2025｜视频抠图MatAnyone来了，一次指定全程追踪，发丝级还原

CVPR 2025｜视频抠图MatAnyone来了，一次指定全程追踪，发丝级还原

视频人物抠像技术在电影、游戏、短视频制作和实时视频通讯中具有广泛的应用价值，但面对复杂背景和多目标干扰时，如何实现一套兼顾发丝级细节精度及分割级语义稳定的视频抠图系统，始终是个挑战。

来自主题: AI技术研报

5865 点击 2025-04-18 10:13

单图直出CAD工程文件！CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点｜魔芯科技NTU等出品

单图直出CAD工程文件！CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点｜魔芯科技NTU等出品

单图直出CAD工程文件！CVPR 2025新研究解决AI生成3D模型“不可编辑”痛点｜魔芯科技NTU等出品

单张图直接就能生成可编辑的CAD工程文件！

来自主题: AI技术研报

10426 点击 2025-04-15 10:46

CVPR 2025 | 2D 大模型赋能3D Affordance 预测，GEAL助力可泛化的3D场景可交互区域识别

CVPR 2025 | 2D 大模型赋能3D Affordance 预测，GEAL助力可泛化的3D场景可交互区域识别

CVPR 2025 | 2D 大模型赋能3D Affordance 预测，GEAL助力可泛化的3D场景可交互区域识别

在现实世界中，如何让智能体理解并挖掘 3D 场景中可交互的部位（Affordance）对于机器人操作与人机交互至关重要。所谓 3D Affordance Learning，就是希望模型能够根据视觉和语言线索，自动推理出物体可供哪些操作、以及可交互区域的空间位置，从而为机器人或人工智能系统提供对物体潜在操作方式的理解。

来自主题: AI技术研报

6344 点击 2025-04-11 09:55

CVPR 2025 HighLight｜打通视频到3D的最后一公里，清华团队推出一键式视频扩散模型VideoScene

CVPR 2025 HighLight｜打通视频到3D的最后一公里，清华团队推出一键式视频扩散模型VideoScene

CVPR 2025 HighLight｜打通视频到3D的最后一公里，清华团队推出一键式视频扩散模型VideoScene

随着 VR/AR、游戏娱乐、自动驾驶等领域对 3D 场景生成的需求不断攀升，从稀疏视角重建 3D 场景已成为一大热点课题。

来自主题: AI技术研报

8525 点击 2025-04-09 16:28

AI危险检测再进化！三层级解析长视频异常，各种时序粒度均有明显优势 | CVPR HighLight

AI危险检测再进化！三层级解析长视频异常，各种时序粒度均有明显优势 | CVPR HighLight

AI危险检测再进化！三层级解析长视频异常，各种时序粒度均有明显优势 | CVPR HighLight

多模态视频异常理解任务，又有新突破！

来自主题: AI技术研报

10005 点击 2025-04-08 15:01

铰链物体的通用世界模型，超越扩散方法，入选CVPR 2025

铰链物体的通用世界模型，超越扩散方法，入选CVPR 2025

铰链物体的通用世界模型，超越扩散方法，入选CVPR 2025

基于当前观察，预测铰链物体的的运动，尤其是 part-level 级别的运动，是实现世界模型的关键一步。

来自主题: AI技术研报

10648 点击 2025-04-07 15:03

CVPR 2025 | GaussianCity: 60倍加速，让3D城市瞬间生成

CVPR 2025 | GaussianCity: 60倍加速，让3D城市瞬间生成

CVPR 2025 | GaussianCity: 60倍加速，让3D城市瞬间生成

想象一下，一座生机勃勃的 3D 城市在你眼前瞬间成型 —— 没有漫长的计算，没有庞大的存储需求，只有极速的生成和惊人的细节。

来自主题: AI技术研报

8879 点击 2025-04-06 17:07

CVPR 2025 Oral | 多模态交互新基准OpenING，新版GPT-4o杀疯了？

CVPR 2025 Oral | 多模态交互新基准OpenING，新版GPT-4o杀疯了？

CVPR 2025 Oral | 多模态交互新基准OpenING，新版GPT-4o杀疯了？

文生图 or 图生文？不必纠结了！

来自主题: AI技术研报

9584 点击 2025-04-06 16:37

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

CVPR满分论文 | 英伟达开源双目深度估计大模型FoundationStereo

本文介绍了 FoundationStereo，一种用于立体深度估计的基础模型，旨在实现强大的零样本泛化能力。

来自主题: AI技术研报

9034 点击 2025-04-06 16:13

双人动作生成新SOTA！浙大提出TIMotion框架 | CVPR 2025

双人动作生成新SOTA！浙大提出TIMotion框架 | CVPR 2025

双人动作生成新SOTA！浙大提出TIMotion框架 | CVPR 2025

双人动作生成新SOTA！

来自主题: AI技术研报

8997 点击 2025-04-03 10:36

上一页当前第10页,共18页下一页