AI技术研报-这里有最前沿的人工智能技术解读

DataMaster：当AI开始成为自己的数据工程师

过去，AI 研发基本是一条由人主导的流水线。

来自主题: AI技术研报

8353 点击 2026-06-02 15:05

Codex顶级邪修！配合Coze3，组合Claude Code！躺着玩手机的手把手教程！

昨儿发了 Coze 3.0 的介绍说明，很多小伙伴看起来都没仔细看。

来自主题: AI技术研报

5970 点击 2026-06-02 15:05

图灵奖得主Sutton新作：AI的下一步，是走向「生成认知」

从 LLM 的超长文本处理、视频生成模型的以假乱真、Agent 自主规划与执行的日趋成熟，到 VLA、世界模型等开始进入物理世界，AI 正在不断拓宽其能力边界。

来自主题: AI技术研报

6155 点击 2026-06-02 15:05

Mind Lab连续发布LoRA最新进展，大模型「持续学习」新范式浮现

最近，前沿实验室 Mind Lab 密集发布了一系列关于 LoRA 与 PEFT（高效微调）的研究结果，似乎描绘出了另一条大模型「持续学习」的路径。在 Mind Lab 的视角中，PEFT 不再是对大模型全参数后训练的一种廉价平替，更是实现从 “基础模型” 向 “可持续学习智能体” 过渡的核心架构机制。

来自主题: AI技术研报

8018 点击 2026-06-02 12:25

机器人运控训练步入分钟级时代！清华AIR开源UniLab：3分钟训好人形，速度暴涨10倍，Mac上也能跑

在具身智能训练中，“把计算全部塞进GPU”似乎成了唯一的提速密码，机器人运控并行训练的框架，IsaacLab、MuJoCoPlayground、mjlab都默认遵循这一范式，这些系统都牢牢绑定在NVIDIA生态中。

来自主题: AI技术研报

8001 点击 2026-06-02 11:59

云端模型如何落地物理世界？招商局狮子山人工智能实验室用LiOS打通具身智能全链路

把一件皱成一团的衣服叠好，是家务，也是机器人操作里的“硬仗”。

来自主题: AI技术研报

7772 点击 2026-06-02 11:57

牛津、英伟达等提出记忆压缩新范式：训练时让模型学会断舍离

2026 年初，各大 AI 厂商在上下文窗口长度上展开激烈角逐。Google 的 Gemini 3 Pro 已支持 100 万级 token 上下文，Meta 的 Llama 4 Scout 更宣称可处理 1000 万 token。GPT-5 系列也在快速推进长上下文能力。

来自主题: AI技术研报

9736 点击 2026-06-02 11:23

7000字长文解读AI大模型智能旅游规划项目方案（AI产品经理必看）

上一篇文章，和大家聊了一下这个项目，做了一个整体性的复盘，但主要是以业务和团队等方面说的，但是实现方案和大模型相关评估上，说的不多，这篇文章，我们就在产品实现方案和大模型这块来聊一下。

来自主题: AI技术研报

8956 点击 2026-06-02 11:23

GUI Agent「记与学」双修，长程任务有了专属记忆增强型自进化框架

本文团队长期从事负责任的人工智能与人工智能赋能社会科学相关研究，围绕视觉生成大模型安全治理、智能体安全等方向开展系统性工作，相关成果发表于AAAI、ICML、TMM 等国际期刊与会议。

来自主题: AI技术研报

7168 点击 2026-06-02 11:23

材料版AlphaFold来了！40个工业任务全方位SOTA，AI4S迎来行业大突破

AI模型在电脑上预测精度爆表，一到实验室就各种出错用不了？

来自主题: AI技术研报

7211 点击 2026-06-01 14:58

陆子恒：我们用AI穷举了20万种材料，知道了一个价值10亿的问题 | AI for Science沙龙

材料研发的“试错时代”，正在被AI加速改变。5月21日，未来光锥「AI for Science 创变者说」第二期沙龙“AI+材料的千亿级机会”，邀请了三位学界与产业一线嘉宾，共同探讨AI+材料科学的前沿与实践。

来自主题: AI技术研报

9228 点击 2026-06-01 14:58

罗福莉划重点，小米大模型降价99%的秘籍公开

紧跟DeepSeek价格战，小米掏出技术底牌！

来自主题: AI技术研报

6558 点击 2026-06-01 13:58

别硬卷Prompt了，这才是普通人拥抱AI视频的最短途径！

大家最近应该都被云南大神MX-Shell花3000制作的《丧尸清道夫》刷屏了吧。他做的这个抖音400多万点赞的AI视频，真的非常牛逼。

来自主题: AI技术研报

7031 点击 2026-06-01 13:56

OpenAI 刚开源了一个 1.5B 参数的隐私过滤模型，却只用 50M 活跃参数就能精准标记姓名、电话、密码这些敏感信息。

你有没有过这样的经历：把聊天记录、用户反馈或内部文档丢给大模型时，总担心里面夹杂着真实姓名、手机号、邮箱甚至 API key，最后只能手动一条条删？或者团队在处理海量数据时，规则写的正则永远漏掉那些“藏在句子里的隐私”。

来自主题: AI技术研报

8943 点击 2026-06-01 10:29

一周3.3k star，微软开启Skills自我进化！像训练神经网络一样训练技能

从大模型的提示词到智能体的 Skills，看着进化了，但又没有完全进化。

来自主题: AI技术研报

5177 点击 2026-06-01 09:57

到底是谁会相信RAG已死啊？

最近一两年，互联网上各种为RAG赛博哭坟的帖子不胜枚举。

来自主题: AI技术研报

9608 点击 2026-06-01 09:27

Shopify 的 AI 搜索订单涨了 13 倍，但 95% 的人最后还是要自己按「付款」

每次听到「AI agent 商业化」，讨论的焦点几乎都是付款——agent 能不能帮我刷卡，钱怎么授权，协议怎么设计。

来自主题: AI技术研报

8900 点击 2026-06-01 09:26

ICML 2026 | 清华姚权铭团队提出LMNet，让语言模型学会自己「组网」

大语言模型正在成为人工智能系统的核心组件。从文本生成、数学推理到代码编写，单个大模型已经展现出强大的能力。

来自主题: AI技术研报

7686 点击 2026-06-01 09:26

Rubrics综述：Agent时代，如何定义一个「好答案」？

近年来，随着大模型从简单问答，走向深度研究、医疗咨询、多模态生成和长程 Agent 任务，一个基础问题变得越来越难回答：我们到底应该怎样判断模型输出的质量？

来自主题: AI技术研报

8356 点击 2026-06-01 09:24

τ0-WM：最大规模预训练的开源具身世界模型来了

刚刚，上海创智学院副教授、智元机器人首席科学家罗剑岚带队，发布全球最大规模的开源预训练具身世界模型——τ0-World Model（τ0-WM)。整个τ0-WM参数量达到5B，预训练数据规模高达约3万小时。其中，真机遥操作数据第一次成了绝对主力，占到了1.78万小时。

来自主题: AI技术研报

9172 点击 2026-05-31 19:39

打破Agent训练瓶颈！人大&至知研究院开源Claw Agent数据+训练+评测全链条

大模型从“回答问题”走向“完成任务”，正在面临以下瓶颈：面向Claw Agents的数据、训练和评测都比传统environment training更难。为了解决该问题，中国人民大学、至知研究院等最新提出ClawGym——

来自主题: AI技术研报

6367 点击 2026-05-31 11:42

AI权威清洗：一张肉眼难辨的图片，就能让GPT-5.4、Claude Opus 4.6集体造谣

来自 ETH Zurich 的 Florian Tramèr 团队在最新论文中抛出了一个出乎意料的问题：如果 AI"看到" 的图，根本不是你肉眼看到的那张，会发生什么样的后果呢？他们把这种现象称作 AI 权威清洗（AI Authority Laundering）。

来自主题: AI技术研报

8830 点击 2026-05-31 11:27

终于，清华快手养出了通人性的AI！

清华大学经济管理学院的陈柯均博士生、张佳音教授、徐心教授与快手消费策略算法部合作探索完成了一项联合实验：从视频传递的价值观的角度，去理解观看视频后用户的行为和心理变化。

来自主题: AI技术研报

8147 点击 2026-05-31 11:15

DeepSeek陈德里AI论文第二弹：从6分到8分，DeliAutoResearch SKILL又进化了

DeepSeek 研究员陈德里（Deli Chen）和 AI 合作的第二篇论文来了！论文地址：https://victorchen96.github.io/continual_learning_survey.pdf这篇论文聚焦 continual learning（持续学习）与 self-iteration（自我迭代）。在陈德里看来，这是 AI 迈向 AGI 过程中极为关键的一步。

来自主题: AI技术研报

9820 点击 2026-05-30 22:40

9.5万大学生和37万高中生的使用数据，暴露了AI 时代真正的分水岭

2026年5月，两篇重磅研究在一周内相继发表。一组来自加州大学伯克利分校研究团队，样本是美国 20 所公立研究型大学的 95,513 名本科生。研究发表在《Science》科学杂志上，主题是大学生如何使用生成式 AI，以及怎样用它作弊。

来自主题: AI技术研报

9000 点击 2026-05-30 22:40

李飞飞造了ImageNet，现在她又带人超越了它

就在前两天，斯坦福大学等机构发布了一个名为 GPIC（Giant Permissive Image Corpus，巨型开放图像语料库）的数据集。

来自主题: AI技术研报

8687 点击 2026-05-30 15:57

登顶HuggingFace日榜！英伟达清华团队γ-World：把世界模型从单机打到联机

5 月下旬，NVIDIA 联合清华大学、多伦多大学和 Vector Institute 发布 Gamma-World，共一第一为清华大学电子系博士刘芳甫，核心 Research 方向是世界模型和空间智能。

来自主题: AI技术研报

8925 点击 2026-05-30 11:26

DiffusionOPD：复旦联合通义万相提出扩散模型「在线策略蒸馏」新范式，让学⽣模型同时学会构图、⽂字与美学

近期，来自复旦大学与阿里巴巴通义万相的研究团队对此提出了新的思考。他们认为，多任务强化学习不应被视为一个统一优化问题，而应该解耦为两个彼此独立的过程：单任务的在线策略探索 & 多任务能力整合。

来自主题: AI技术研报

8041 点击 2026-05-30 10:49

数据比模型更值钱，国内最大的「端侧」训练数据开源了！600B 预训练+千万级 SFT 核心数据配方公开

我去搜了下 MiniCPM5-1B 的数据，发现面壁智能刚刚把背后的核心数据集给开源了。一共是两份 L3 级数据集：Ultra-FineWeb-L3 ：600B tokens，中英文都有，是目前最大的中文开源合成预训练数据集。

来自主题: AI技术研报

8387 点击 2026-05-30 10:06

「马嘉祺」让大模型翻车，而他一年前洗澡时就发现了问题

一家名为脸谱心智（FaceMind）的初创公司就在顶级学术会议 EMNLP 主会上系统性地揭示了这个问题，并给出了解法。更有意思的是，就在「马嘉祺」事件前不到两周，全球最强 AI 公司之一 Anthropic 也在自家产品中悄悄落地了一次高度相关的改造 —— 方向与脸谱心智一年前的论文几乎完全一致。

来自主题: AI技术研报

7259 点击 2026-05-30 10:05

AI技术研报-这里有最前沿的人工智能技术解读

DataMaster：当AI开始成为自己的数据工程师

Codex顶级邪修！配合Coze3，组合Claude Code！躺着玩手机的手把手教程！

图灵奖得主Sutton新作：AI的下一步，是走向「生成认知」

Mind Lab连续发布LoRA最新进展，大模型「持续学习」新范式浮现

机器人运控训练步入分钟级时代！清华AIR开源UniLab：3分钟训好人形，速度暴涨10倍，Mac上也能跑

云端模型如何落地物理世界？招商局狮子山人工智能实验室用LiOS打通具身智能全链路

牛津、英伟达等提出记忆压缩新范式：训练时让模型学会断舍离

7000字长文解读AI大模型智能旅游规划项目方案（AI产品经理必看）

GUI Agent「记与学」双修，长程任务有了专属记忆增强型自进化框架

材料版AlphaFold来了！40个工业任务全方位SOTA，AI4S迎来行业大突破

陆子恒：我们用AI穷举了20万种材料，知道了一个价值10亿的问题 | AI for Science沙龙

罗福莉划重点，小米大模型降价99%的秘籍公开

别硬卷Prompt了，这才是普通人拥抱AI视频的最短途径！

OpenAI 刚开源了一个 1.5B 参数的隐私过滤模型，却只用 50M 活跃参数就能精准标记姓名、电话、密码这些敏感信息。

一周3.3k star，微软开启Skills自我进化！像训练神经网络一样训练技能

到底是谁会相信RAG已死啊？

Shopify 的 AI 搜索订单涨了 13 倍，但 95% 的人最后还是要自己按「付款」

ICML 2026 | 清华姚权铭团队提出LMNet，让语言模型学会自己「组网」

Rubrics综述：Agent时代，如何定义一个「好答案」？

τ0-WM：最大规模预训练的开源具身世界模型来了

打破Agent训练瓶颈！人大&至知研究院开源Claw Agent数据+训练+评测全链条

AI权威清洗： 一张肉眼难辨的图片，就能让GPT-5.4、Claude Opus 4.6集体造谣

终于，清华快手养出了通人性的AI！

DeepSeek陈德里AI论文第二弹：从6分到8分，DeliAutoResearch SKILL又进化了

9.5万大学生和37万高中生的使用数据，暴露了AI 时代真正的分水岭

李飞飞造了ImageNet，现在她又带人超越了它

登顶HuggingFace日榜！英伟达清华团队γ-World：把世界模型从单机打到联机

DiffusionOPD：复旦联合通义万相提出扩散模型「在线策略蒸馏」新范式，让学⽣模型同时学会构图、⽂字与美学

数据比模型更值钱，国内最大的「端侧」训练数据开源了！600B 预训练+千万级 SFT 核心数据配方公开

「马嘉祺」让大模型翻车，而他一年前洗澡时就发现了问题

AI权威清洗：一张肉眼难辨的图片，就能让GPT-5.4、Claude Opus 4.6集体造谣