AI资讯新闻榜单内容搜索-VLA

不再只是「会走路的双臂平台」：OpenHLM解放人形机器人的全身移动操作能力

人类在日常生活中协调全身来完成移动操作任务：打开垃圾桶时会踩下踏板，从低处拿东西时需要下蹲，推车时需要同步协调手臂抓握和腿部移动。对试图复刻人类能力的人形机器人来说，身体不应只是「手臂 + 移动平台」，而应是一个能协调手、腰、腿、脚共同完成任务的运动整体。

来自主题: AI技术研报

5816 点击 2026-06-29 09:21

LeCun、谢赛宁转发的世界模型与VLA共融方案：中关村学院ECCV2026—VLA-JEPA

依赖于有限机器人数据和大量人类数据，也能让 VLA 模型更稳健吗？

来自主题: AI技术研报

5727 点击 2026-06-24 10:30

机器人终于不瞎抓了！港大阿里联手开源FineVLA：用哪只手、抓哪里，一句话全搞定

机器人模型已经能根据“把杯子放进篮子”这类指令完成任务，但用哪只手？

来自主题: AI技术研报

6809 点击 2026-06-23 15:02

腾讯Robotics X开源HyVLA-0.5：基于亚毫米级指套UMI与真机强化，摆脱繁重遥操

6 月 15 日，腾讯 Robotics X、福田实验室与混元团队联合发布面向真实世界机器人操作任务的端到端具身智能模型 Hy-Embodied-0.5-VLA（简称 HyVLA-0.5）。

来自主题: AI技术研报

10576 点击 2026-06-16 10:21

RSS2026 | 强泛化强迁移VLA，上海创智学院×上海交大提出MINT：让VLA从模仿轨迹走向理解意图

机器人视觉语言动作（Vision-Language-Action, VLA）模型越来越多地开始展示叠衣服、倒茶、做咖啡等复杂操作。但是，今天的大多数 VLA 更像 “展台机器人”。

来自主题: AI技术研报

6486 点击 2026-06-10 14:40

图灵奖得主Sutton新作：AI的下一步，是走向「生成认知」

从 LLM 的超长文本处理、视频生成模型的以假乱真、Agent 自主规划与执行的日趋成熟，到 VLA、世界模型等开始进入物理世界，AI 正在不断拓宽其能力边界。

来自主题: AI技术研报

6696 点击 2026-06-02 15:05

刚刚，国产预训练具身大模型开源了，让后训练不再是必选项！

2026 年初，国内具身智能赛道掀起了一波开源潮，越来越多团队开始公开自己的视觉-语言-动作（VLA）模型、数据集与训练框架。与此同时，行业竞争也逐渐集中到 benchmark 成绩、任务成功率以及跨任务泛化能力上，尤其是在标准化或已训练任务中的表现。

来自主题: AI技术研报

8427 点击 2026-05-29 09:19

0.9B跑出90%真机成功率！上海交大为VLA补上空间感

机器人看得见，但不一定看得准。

来自主题: AI技术研报

5558 点击 2026-05-26 15:23

终结VLA？英伟达押注的具身新范式，首篇世界动作模型WAM综述重磅发布

Jim Fan 押注的这条 “先预测世界，再生成动作” 的新路，正是当下具身智能领域最炙手可热的下一代范式 —— 世界动作模型（World Action Models，简称 WAM）。虽然 WAM 正在迅速成为各大顶尖实验室的核心发力点，但业界至今仍然缺乏对它的统一标准和系统梳理。近期，复旦大学可信具身智能研究院，上海创智学院，新加坡国立大学发表了首篇 WAM 的详细综述。

来自主题: AI技术研报

9248 点击 2026-05-23 09:55

CVPR 2026 | 突破短视，理解变化！HiF-VLA：以motion为中心打造「边想边做」的世界动作模型

来自西湖大学、浙江大学、西湖机器人等机构的研究团队提出了一种以运动（Motion）为中心的全新双向时空推理框架 HiF-VLA。抛弃冗余的像素级输入，HiF-VLA 巧妙提取低维紧凑的 Motion 向量作为动态先验，在一个创新的「联合专家」模块中，同步完成未来视觉运动的预测与高精度动作序列的生成。

来自主题: AI技术研报

8390 点击 2026-05-23 09:55