AI资讯新闻榜单内容搜索-Ed

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索: Ed
让龙虾看懂屏幕!谷歌多模态新成果,文本图像视频音频进同一空间

让龙虾看懂屏幕!谷歌多模态新成果,文本图像视频音频进同一空间

让龙虾看懂屏幕!谷歌多模态新成果,文本图像视频音频进同一空间

刚刚,谷歌发布了首个原生多模态(Multimodal)嵌入模型——Gemini Embedding 2。这次模型最大的变化在于:把文本、图像、视频、音频和文档,全部映射进同一个统一的嵌入空间。

来自主题: AI资讯
6752 点击    2026-03-11 16:59
OpenClaw 之后我开始思考:Agent 最重要的两种能力是什么?

OpenClaw 之后我开始思考:Agent 最重要的两种能力是什么?

OpenClaw 之后我开始思考:Agent 最重要的两种能力是什么?

OpenClaw 爆火之后,我一直在想一个问题: 如果把 AI Agent 当作一个员工来看,未来最重要的能力是什么?

来自主题: AI资讯
7157 点击    2026-03-11 10:01
14B规模竟也能单卡实时生成视频?多亏这个强大的开源底座

14B规模竟也能单卡实时生成视频?多亏这个强大的开源底座

14B规模竟也能单卡实时生成视频?多亏这个强大的开源底座

春节期间, Seedance 2.0 爆火,堪称现象级,这也再次把视频生成推上风口。前两天,字节跳动又携手北大、安努智能和 Canva 共同开源了具备实时生成能力的视频模型 Helios 家族。该系列包含了 Helios-Base、Helios-Mid 与 Helios-Distilled 三个版本,全面覆盖了 T2V、I2V、V2V 以及交互式生成任务。

来自主题: AI技术研报
9515 点击    2026-03-09 15:05
多模态预训练,才是大模型的下一条路?Yann LeCun、谢赛宁参与

多模态预训练,才是大模型的下一条路?Yann LeCun、谢赛宁参与

多模态预训练,才是大模型的下一条路?Yann LeCun、谢赛宁参与

基础模型时代,大模型能力的爆发,很大程度上源于在海量文本上的预训练。然而问题在于,文本本质上只是人类对现实世界的一种抽象表达,是对真实世界信息的有损压缩。

来自主题: AI技术研报
9471 点击    2026-03-09 09:53
30B参数超越GPT-5!REDSearcher让「深度搜索Agent」做到低成本可扩展!

30B参数超越GPT-5!REDSearcher让「深度搜索Agent」做到低成本可扩展!

30B参数超越GPT-5!REDSearcher让「深度搜索Agent」做到低成本可扩展!

「2018 到 2023 年间在 EMNLP 会议上发表的那篇论文中,第一作者本科就读于达特茅斯学院、第四作者本科就读于宾夕法尼亚大学的那篇科学论文,题目是什么?」

来自主题: AI技术研报
7455 点击    2026-03-09 09:51
用Rust重写OpenClaw,Transformer作者下场造了安全版「龙虾」

用Rust重写OpenClaw,Transformer作者下场造了安全版「龙虾」

用Rust重写OpenClaw,Transformer作者下场造了安全版「龙虾」

面对 OpenClaw(龙虾)可能存在的「恶意利用用户数据和资金」的重大风险,Transformer 八子之一 Illia Polosukhin 出手了。今天,Illia Polosukhin 在 Reddit 上发了一则帖子,深谈了其使用 Rust 来构建安全版 OpenClaw 的心路历程,引起了热议。

来自主题: AI资讯
8262 点击    2026-03-07 11:10
基础模型又一关键拼图,腾讯混元发布训练新范式「无相」:引入功能性记忆,打破静态权重枷锁

基础模型又一关键拼图,腾讯混元发布训练新范式「无相」:引入功能性记忆,打破静态权重枷锁

基础模型又一关键拼图,腾讯混元发布训练新范式「无相」:引入功能性记忆,打破静态权重枷锁

3月6日,腾讯混元发布了一篇名为“HY-WU (Part I): An Extensible Functional Neural Memory Framework and An Instantiation in Text-Guided Image Editing”的技术报告。提出了一种崭新的功能性记忆(functional neural memory)范式(weight unleashing),

来自主题: AI技术研报
8657 点击    2026-03-07 11:08
1秒1元!Seedance 2.0模型定价公布,短剧真的要被颠覆了

1秒1元!Seedance 2.0模型定价公布,短剧真的要被颠覆了

1秒1元!Seedance 2.0模型定价公布,短剧真的要被颠覆了

火山引擎官网,现已公布Seedance 2.0模型定价。包含视频输入的价格是28元/百万tokens,不含视频输入的价格则是46元/百万tokens。使用Seedance 2.0生成一条15秒的标准视频(720p,24fps),大概要消耗30.888万tokens。

来自主题: AI资讯
8979 点击    2026-03-06 15:40