AI资讯新闻榜单内容搜索-CVPR

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: CVPR
更全面的具身智能真机评测来了!CVPR 2026 ManipArena挑战赛邀你打榜

更全面的具身智能真机评测来了!CVPR 2026 ManipArena挑战赛邀你打榜

更全面的具身智能真机评测来了!CVPR 2026 ManipArena挑战赛邀你打榜

过去一年,具身智能领域迎来了爆发式增长。从后空翻到托马斯回旋,从整理衣物到冲泡咖啡……各类令人惊艳的机器人演示视频层出不穷。

来自主题: AI技术研报
10193 点击    2026-03-19 09:46
CVPR2026满分论文:Proxy-GS为结构化3D高斯溅射引入统一遮挡先验

CVPR2026满分论文:Proxy-GS为结构化3D高斯溅射引入统一遮挡先验

CVPR2026满分论文:Proxy-GS为结构化3D高斯溅射引入统一遮挡先验

上海交通大学钟志航团队联合上海人工智能实验室、西北工业大学、四川大学等高校在 CVPR 2026 上提出Proxy-GS(Proxy-GS: Unified Occlusion Priors for Training and Inference in Structured 3D Gaussian Splatting),面向基于 MLP 的结构化 3D 高斯溅射(3DGS),

来自主题: AI技术研报
9032 点击    2026-03-18 16:10
打破视频推理「先看后想」惯性,实现真正的「边看边想」丨CVPR'26

打破视频推理「先看后想」惯性,实现真正的「边看边想」丨CVPR'26

打破视频推理「先看后想」惯性,实现真正的「边看边想」丨CVPR'26

今天的大型视觉语言模型(VLM)做离线视频分析很强,但一到实时场景就尴尬: 视频在往前走,模型还在“补作业”。

来自主题: AI技术研报
6848 点击    2026-03-18 14:12
大象秒变挖掘机!三维变形新突破,无需额外训练 | CVPR'26

大象秒变挖掘机!三维变形新突破,无需额外训练 | CVPR'26

大象秒变挖掘机!三维变形新突破,无需额外训练 | CVPR'26

南京大学与北京大学提出MorphAny3D,无需训练即可让三维生成模型实现跨类别平滑变形。通过创新注意力机制融合源与目标特征,精准控制结构与时序,轻松完成复杂变形,效果远超传统方法。

来自主题: AI技术研报
9899 点击    2026-03-17 14:27
CVPR 2026 | 从视觉Token内在变化量出发,实现VLM无损加速1.87倍

CVPR 2026 | 从视觉Token内在变化量出发,实现VLM无损加速1.87倍

CVPR 2026 | 从视觉Token内在变化量出发,实现VLM无损加速1.87倍

随着高分辨率图像理解与长视频处理需求的爆发式增长,大型视觉语言模型(LVLMs)所需处理的视觉 Token 数量急剧膨胀,推理效率成为落地部署的核心瓶颈。Token 压缩是缩短序列、提升吞吐的直接手段,但现有方法普遍依赖注意力权重来判断 Token 重要性,这一路线暗藏两个致命缺陷:

来自主题: AI技术研报
8985 点击    2026-03-17 08:49
CVPR'26 | 以机器人为中心的ToM推理框架,从心智推理到决策行动

CVPR'26 | 以机器人为中心的ToM推理框架,从心智推理到决策行动

CVPR'26 | 以机器人为中心的ToM推理框架,从心智推理到决策行动

吉林大学&微软亚洲研究院等团队提出MindPower框架,让机器人像人一样理解他人想法并主动帮忙,构建了首个以机器人为中心的心智推理评测体系,通过六层推理链条,让AI不仅看懂场景,更能推断意图、做出决策、执行动作,显著提升助人能力。

来自主题: AI技术研报
6216 点击    2026-03-17 08:49
CVPR 2026 | 还在为AI「鬼画符」发愁?TextPecker即插即用破解文字渲染难题

CVPR 2026 | 还在为AI「鬼画符」发愁?TextPecker即插即用破解文字渲染难题

CVPR 2026 | 还在为AI「鬼画符」发愁?TextPecker即插即用破解文字渲染难题

在生成式 AI 浪潮中,文生图技术已实现跨越式发展,在视觉呈现上达到了前所未有的高度。然而,在生成图像中准确合成拼写正确、结构规范且风格协调的文字 —— 视觉文本渲染(Visual Text Rendering, VTR),至今仍是该领域尚未攻克的核心难题。

来自主题: AI技术研报
9431 点击    2026-03-12 14:10
CVPR 2026|清华联合美团推出3DThinker,首个用3D意象思考的工作

CVPR 2026|清华联合美团推出3DThinker,首个用3D意象思考的工作

CVPR 2026|清华联合美团推出3DThinker,首个用3D意象思考的工作

大家是否有这样的感觉?给定几张场景中拍摄的图片,往往能够在脑海中想象出这个场景的三维布局,然而当前的多模态大模型还停留于纯文本或者 2D 视觉的推理表示,限制了图像中隐含几何结构的表达能力。

来自主题: AI技术研报
8497 点击    2026-03-11 09:25