AI资讯新闻榜单内容搜索-模型训练

# 热门搜索 #

大模型

人工智能

openai

融资

chatGPT

搜索: 模型训练

T-PAMI｜中国科大、合工大等提出CAPER++：让关节物体位姿感知真正迈向「又快又稳」

T-PAMI｜中国科大、合工大等提出CAPER++：让关节物体位姿感知真正迈向「又快又稳」

T-PAMI｜中国科大、合工大等提出CAPER++：让关节物体位姿感知真正迈向「又快又稳」

在具身智能快速发展的今天，机器人已经不再满足于「看见」刚体物体，而是开始真正走向复杂环境中的交互与操作。从机械臂开柜门，到服务机器人整理抽屉，再到工业场景中的工具操作，大量真实世界目标都属于关节物体（Articulated Objects）。

来自主题: AI技术研报

8560 点击 2026-05-28 10:18

5秒完成3D场景编辑，北大&港中文&上海AI Lab搞出VGGT-Edit，120倍加速太炸了

5秒完成3D场景编辑，北大&港中文&上海AI Lab搞出VGGT-Edit，120倍加速太炸了

5秒完成3D场景编辑，北大&港中文&上海AI Lab搞出VGGT-Edit，120倍加速太炸了

3D世界“会看”了，但还不会“改”。

来自主题: AI技术研报

8632 点击 2026-05-28 09:52

Token账单爆炸？用「TELOS」强制命中缓存，一键剩下90%的账单！

Token账单爆炸？用「TELOS」强制命中缓存，一键剩下90%的账单！

Token账单爆炸？用「TELOS」强制命中缓存，一键剩下90%的账单！

就在几天前（5月22日），DeepSeek官方扔出了一枚重磅炸弹：DeepSeek-V4-Pro将在5月底结束优惠后，永久降价至原价的四分之一。各大媒体瞬间被诸如“白菜价”、“夯爆了”的标题刷屏。看看这组惊人的新定价：每百万Token输出6元，输入（缓存未命中）3元，而输入（缓存命中）仅仅只要0.025元！

来自主题: AI技术研报

7603 点击 2026-05-28 09:51

双榜SOTA！微软ACL2026新作重新定义AI长记忆

双榜SOTA！微软ACL2026新作重新定义AI长记忆

双榜SOTA！微软ACL2026新作重新定义AI长记忆

随着大语言模型在各类应用中加速落地，一个核心技术瓶颈日益凸显——AI始终缺乏真正的长期记忆能力。当前主流的RAG（检索增强生成）方案依赖语义相似度检索历史信息，但“语义相似”并不等于“真正相关”，常常出现检索结果不完整、无法区分信息相关性、缺乏推理能力等问题。

来自主题: AI技术研报

9071 点击 2026-05-28 09:50

让大模型“边看边改”，视觉分割准确率直接上涨9% | ICML 2026

让大模型“边看边改”，视觉分割准确率直接上涨9% | ICML 2026

让大模型“边看边改”，视觉分割准确率直接上涨9% | ICML 2026

智能体时代，如何让视觉分割更准确？

来自主题: AI技术研报

9171 点击 2026-05-27 16:31

AMD新论文颠覆认知：FP4训练不稳定，原因不是随机性不足

AMD新论文颠覆认知：FP4训练不稳定，原因不是随机性不足

AMD新论文颠覆认知：FP4训练不稳定，原因不是随机性不足

众所周知，大模型训练成本极高。

来自主题: AI技术研报

6345 点击 2026-05-27 16:10

CVPR 2026 | 1000万段驾驶视频，教会模型如何估计相机位姿

CVPR 2026 | 1000万段驾驶视频，教会模型如何估计相机位姿

CVPR 2026 | 1000万段驾驶视频，教会模型如何估计相机位姿

不用百万级 3D 标注，模型也能从普通驾驶视频中学会「自己是怎么动的」。Wayve 的 LA-Pose 试图把未标注视频里的运动信号，转化为自动驾驶系统所需的相机位姿估计能力。

来自主题: AI技术研报

7252 点击 2026-05-27 16:10

从Foundation Model到Physical AI，三星「杀入」大模型核心战场

从Foundation Model到Physical AI，三星「杀入」大模型核心战场

从Foundation Model到Physical AI，三星「杀入」大模型核心战场

过去几年，大模型竞争主要发生在 AI 公司之间。但随着 AI 开始从数字世界进入真实设备与物理世界，竞争逻辑正在发生变化。

来自主题: AI技术研报

5699 点击 2026-05-27 16:09

用文字记住图片，是一种错觉：MemEye用「原图证据」重测多模态Agent Memory

用文字记住图片，是一种错觉：MemEye用「原图证据」重测多模态Agent Memory

用文字记住图片，是一种错觉：MemEye用「原图证据」重测多模态Agent Memory

多模态Agent最容易制造的一种错觉是：它看过图片，所以它记住了图片。

来自主题: AI技术研报

6388 点击 2026-05-27 08:46

Claude Code和机器人背后的共同机制，UIUC、Meta、Stanford这篇最新综述讲清楚了

Claude Code和机器人背后的共同机制，UIUC、Meta、Stanford这篇最新综述讲清楚了

Claude Code和机器人背后的共同机制，UIUC、Meta、Stanford这篇最新综述讲清楚了

说在前面：这又是一篇讲Harness的Survey，你最近可能已经看过了数篇讲Harness的文章、论文，其中还可能包括我上周解读的《Agent Harness Engineering：Agent的底盘工程综述｜CMU、耶鲁、Amazon》。

来自主题: AI技术研报

10904 点击 2026-05-27 08:46

上一页当前第19页,共417页下一页