AI资讯新闻榜单内容搜索-Ed

让龙虾看懂屏幕！谷歌多模态新成果，文本图像视频音频进同一空间

刚刚，谷歌发布了首个原生多模态（Multimodal）嵌入模型——Gemini Embedding 2。这次模型最大的变化在于：把文本、图像、视频、音频和文档，全部映射进同一个统一的嵌入空间。

来自主题: AI资讯

6752 点击 2026-03-11 16:59

OpenClaw 之后我开始思考：Agent 最重要的两种能力是什么？

OpenClaw 爆火之后，我一直在想一个问题：如果把 AI Agent 当作一个员工来看，未来最重要的能力是什么？

来自主题: AI资讯

7157 点击 2026-03-11 10:01

14B规模竟也能单卡实时生成视频？多亏这个强大的开源底座

春节期间， Seedance 2.0 爆火，堪称现象级，这也再次把视频生成推上风口。前两天，字节跳动又携手北大、安努智能和 Canva 共同开源了具备实时生成能力的视频模型 Helios 家族。该系列包含了 Helios-Base、Helios-Mid 与 Helios-Distilled 三个版本，全面覆盖了 T2V、I2V、V2V 以及交互式生成任务。

来自主题: AI技术研报

9515 点击 2026-03-09 15:05

多模态预训练，才是大模型的下一条路？Yann LeCun、谢赛宁参与

基础模型时代，大模型能力的爆发，很大程度上源于在海量文本上的预训练。然而问题在于，文本本质上只是人类对现实世界的一种抽象表达，是对真实世界信息的有损压缩。

来自主题: AI技术研报

9471 点击 2026-03-09 09:53

30B参数超越GPT-5！REDSearcher让「深度搜索Agent」做到低成本可扩展！

「2018 到 2023 年间在 EMNLP 会议上发表的那篇论文中，第一作者本科就读于达特茅斯学院、第四作者本科就读于宾夕法尼亚大学的那篇科学论文，题目是什么？」

来自主题: AI技术研报

7455 点击 2026-03-09 09:51

用Rust重写OpenClaw，Transformer作者下场造了安全版「龙虾」

面对 OpenClaw（龙虾）可能存在的「恶意利用用户数据和资金」的重大风险，Transformer 八子之一 Illia Polosukhin 出手了。今天，Illia Polosukhin 在 Reddit 上发了一则帖子，深谈了其使用 Rust 来构建安全版 OpenClaw 的心路历程，引起了热议。

来自主题: AI资讯

8262 点击 2026-03-07 11:10

基础模型又一关键拼图，腾讯混元发布训练新范式「无相」：引入功能性记忆，打破静态权重枷锁

3月6日，腾讯混元发布了一篇名为“HY-WU (Part I): An Extensible Functional Neural Memory Framework and An Instantiation in Text-Guided Image Editing”的技术报告。提出了一种崭新的功能性记忆（functional neural memory）范式（weight unleashing），

来自主题: AI技术研报

8657 点击 2026-03-07 11:08