AI资讯新闻榜单内容搜索-全模态

英伟达全模态大模型 Nemotron 3 Nano Omni 来了，几秒搞定老黄3分钟演讲，吞吐量同类9倍

英伟达于昨日正式推出全新多模态推理模型Nemotron 3 Nano Omni，将文本、视觉、语音三大模态能力深度融合至单一模型体系，目前可免费使用。

来自主题: AI资讯

9409 点击 2026-04-29 19:52

诺奖得主实验室走出的中国团队，开源科研项目 ODesign 正用世界模型重构生命分子设计

由张昊天作为一作兼共同通讯作者在临港实验室联合上海浦江实验室、华盛顿大学、哈佛大学、MIT 等科研力量共同推进的 ODesign 开源科研项目，定位于全球首个面向全模态的分子设计基座模型。

来自主题: AI资讯

10302 点击 2026-04-29 11:37

小米双模型正式开源！MiMo-V2.5-Pro无中断肝出“macOS”：54个应用全开、浏览器真能冲浪

没错，用的就是主打长程任务、模糊指令遵循，跻身国产Agent第一梯队的小米MiMo‑V2.5 Pro。小米最新发布的MiMo‑V2.5系列，包含Pro旗舰Agent、全模态基座、TTS语音合成、ASR语音识别四大模型，综合实力对标国际顶尖水准。

来自主题: AI产品测评

7758 点击 2026-04-29 10:04

MiniCPM-o 4.5 技术报告发布：全双工全模态 API 开放，RTX5070即可实时运行

你有没有想过，不用联网、仅用一张消费级显卡，就能在个人电脑上拥有一个「边看、边听、边说、还能主动提醒」的类人 AI 助手？这就是 MiniCPM-o 4.5 所能做到的。在技术创新下，它仅凭 9B 参数，实现了业界首个端到端全双工全模态大模型，让端侧 AI 普惠成为现实。其自 2026 年 2 月模型发布以来，在 Hugging Face 上的下载量已突破 25 万+。

来自主题: AI技术研报

7286 点击 2026-04-28 13:15

全球最大触觉数据集Daimon-Infinity，竟然出自一家具身上游公司

4 月 15 日，戴盟机器人联合Google DeepMind、中国移动、新加坡国立大学、香港科技大学、上海交通大学、日本东北大学等海内外数十家顶尖学术机构与知名企业，发布了全球最大规模含触觉全模态物理世界数据集Daimon-Infinity。

来自主题: AI技术研报

6366 点击 2026-04-18 07:27

智象未来完成超5亿元新一轮融资，全力打造下一代原生全模态世界模型｜AlphaFamily

近日，国内多模态生成式人工智能公司智象未来（HiDream.ai）宣布完成超5亿元新一轮融资。本轮融资由东方富海、安徽省投资集团旗下的省产业投资公司、峰华资本等新股东联合投资，同时合肥产投、兴泰集团、合肥高投、安徽省人工智能母基金等老股东持续加注。

来自主题: AI资讯

8021 点击 2026-04-16 13:01

MiniMax Agent 更新：这次我们重新设计了 Agent 操作电脑的方式

上周，我们发布了 MMX-CLI，让 Agent 可以直接通过命令行调用 MiniMax 的全模态能力。命令行是 Agent 在终端中完成工作的常见形态，但用户的工作并不只发生在命令行内，电脑上还有大量任务藏在命令行无法触达的本地软件、内部系统和图形界面中。

来自主题: AI技术研报

8350 点击 2026-04-15 14:56

吞吐提升76%！小红书开源RL训练引擎Relax

小红书AI平台团队刚刚开源了Relax——一个为全模态数据、Agentic工作流和大规模异步训练协同设计的现代RL训练引擎！实测全异步Off-Policy模式相比共卡On-Policy吞吐提升76%，相比veRL的全异步实现提升20%！

来自主题: AI技术研报

6612 点击 2026-04-15 09:23

模思智能完成亿元融资，上海国投、IDG、华为等联合投资

模思智能成立于2024年，位于上海徐汇区，由上海创智学院与复旦大学联合孵化，是国内少数完成“全模态基座模型能力闭环”的初创公司之一，致力于构建统一Token表达框架下的“情境智能”能力，推动Agent系统在真实世界中的自主交互与任务执行。

来自主题: AI资讯

10857 点击 2026-04-11 14:28

补上OpenClaw最大短板！中国AI独角兽亮出龙虾盒子，打工人放心养虾

养龙虾最怕什么？上一秒喂财报，下一秒全上云！刚刚，无问芯穹推出全模态「龙虾盒子」InfiniClaw Box，文字、语音、视频全模态无死角加密，让云端满血AI为你贴身打工。

来自主题: AI资讯

10384 点击 2026-04-10 16:13