挤不动的世界机器人大会上,自变量秀出了真·通用具身智能
挤不动的世界机器人大会上,自变量秀出了真·通用具身智能会整理家务、制作香囊,还能比心比耶。 具身智能已经进化到这种程度了,真实满足用户需求似乎指日可待。 今天上午,2025 世界机器人大会 WRC 正式开幕。最近的 AI 技术突破,让参展的公司纷纷拿出了新技术,人头攒动的展台之间,我们看到了一众「具身智能」加持的机器人,其中很多还是首次发布。
会整理家务、制作香囊,还能比心比耶。 具身智能已经进化到这种程度了,真实满足用户需求似乎指日可待。 今天上午,2025 世界机器人大会 WRC 正式开幕。最近的 AI 技术突破,让参展的公司纷纷拿出了新技术,人头攒动的展台之间,我们看到了一众「具身智能」加持的机器人,其中很多还是首次发布。
知情人士表示,风险投资公司Accel 正主导德国人工智能初创企业 n8n 的新一轮融资,这将使该公司估值呈指数级增长至 23 亿美元。
北京大学提出了ReMoMask:一种全新的基于检索增强生成的Text-to-Motion框架。它是一个集成三项关键创新的统一框架:(1)基于动量的双向文本-动作模型,通过动量队列将负样本的尺度与批次大小解耦,显著提高了跨模态检索精度;(2)语义时空注意力机制,在部件级融合过程中强制执行生物力学约束,消除异步伪影;(3)RAG-无分类器引导结合轻微的无条件生成以增强泛化能力。
互联网技术的发展极大地便利了我们的生活,但许多网络任务重复繁琐,降低了效率。为了解决这一问题,研究人员正在开发基于大型基础模型(LFMs)的智能体——WebAgents,通过感知环境、规划推理和执行交互来完成用户指令,显著提升便利性。香港理工大学的研究人员从架构、训练和可信性等角度,总结了WebAgents的代表性方法,全面梳理了相关研究进展。
随着 Gemini-Diffusion,Seed-Diffusion 等扩散大语言模型(DLLM)的发布,这一领域成为了工业界和学术界的热门方向。但是,当前 DLLM 存在着在推理时必须采用预设固定长度的限制,对于不同任务都需要专门调整才能达到最优效果。
当大模型把人类曾经的终极考题变成日常练习,AI的奔跑却悄悄瘸了腿—— 训练能力突飞猛进,验证答案的本事却成了拖后腿的短板。 为此,上海AI Lab和澳门大学联合发布通用答案验证模型CompassVerifier与评测集VerifierBench。填补了Verifier领域没有建立验证->提升->验证的循环迭代体系的空白。
上上周我们一起测试了六款视频Agent, Agent们手里有一堆音频、视频、剪辑、生图等工具,由他们决定调用顺序成片
从“模型即服务”(MaaS)到“智能体即服务”(AaaS)的转变,标志着AI行业进入了新的发展阶段。我们不再满足于AI的“对话能力”,而是期望它能成为自主完成复杂任务的“全能机器人”。
不管我们如何评价ChatGPT,这个产品在人工智能历史上的地位,肯定是无法撼动的,就跟iPhone在智能手机发展史上的地位一样。但是从另一个角度来看,现在的智能手机,无论是苹果还是安卓,每个版本之间,也已经几乎没有跨越台阶式的进步了。
AI对话技术最初用于年轻人整蛊父母的声音克隆,但老年人主动用作“情感拐杖”缓解孤独,带来安全倾诉环境。心理咨询师警告AI可能导致即时反馈成瘾、替代真实关系,削弱现实冲突应对力,类似《her》电影困境;AI谄媚性模糊是非,影响判断力。技术初衷高效连接需求,却简化人际复杂本质。
行业中,各种尝试层出不穷,其实底层逻辑都要回答一个同样的问题——如何用更低的成本、更高的效率,为人们提供更好的健康服务。在全球兴起的跑步风潮下,2022年才上线的Runna,给出了自己教科书式的答案。
如果说2024年是Kimi和豆包的流量之战,那么2025年上半年,这场战争的主角轮到了夸克和元宝——夸克每个月的广告投放金额均破亿,最高投放出现在6月;元宝6月、7月投放金额均超10亿元。
美国四家科技巨头在AI领域资本开支远超中国,2024年1.7万亿人民币 vs 中国6300亿,2025年差距扩大至2.5万亿 vs 5000亿。中国公司优先分红回购,AI采用率低(15% vs 美国85%),技术债积累,网络效应加剧中美差距,中国大厂被边缘化。
备受 AI 圈关注的首届谷歌 Kaggle AI Chess 大赛(也即大模型国际象棋对抗赛)迎来了最终赢家。就在昨天,Grok 4 携手 OpenAI o3 进入了决赛。在机器之心的投票中,大家更倾向于 o3 战胜 Grok 4。
审美可以被元素化,这是AI的新机会。如今直播生态已经趋于成熟。直播间、社交媒体上的“达人”,事实上已经成了一个品牌的店面,人设代表着受众群体、风格和定位,达人负责捕捉新一季的时尚元素,快速出设计图、打样,国内工厂在半个月内就能完成生产和出货。
一起给GPT5上上强度吧! 我相信它的参数、API、纸面实力已经被扒得差不多了,所以接下来的内容先会分为总结篇,把system card、发布会、OpenAI自家技术博客、奥特曼私下说的信息做个全篇,然后从编程、写作、多模态、PPT等等给GPT犁一边,最后再总结一下GPT-5后续的一些开发计划啥的,Here we go!
一个个赚飞的AI编程公司其实已经亏爆了! TechCrunch的最新调查带来了这个反常识的冷思考。
7月15日,Heron宣布完成了1600万美元的A轮融资,由Insight Partners领投,Y Combinator、BoxGroup和Flex Capital参投。这家专注于自动化文档密集型工作流程的公司,正在重新定义AI在保险、借贷和金融领域的应用方式。
特斯拉Dojo超级计算机团队被解散!特斯拉自动驾驶的「算力心脏」Dojo已被终止。马斯克放弃训练算力,而核心团队另立山头。
全球首个城市级常态化运营的人形机器人示范区正式落地北京!来自银河通用的这款「银河太空舱」,标志着具身智能技术真正走入到了市民的生活当中。
热闹,简直太热闹了。 只因一群机器人“聚集”在了北京,就让现场直接变成人人人人人了。这就是今天刚开幕的世界机器人大会(WRC)的热度,据说今年来了100多个新机器人!
当前,大型语言模型(LLM)在软件工程领域的应用日新月异,尤其是在自动修复 Bug 方面,以 SWE-bench 为代表的基准测试展示了 AI 惊人的潜力。然而,软件开发远不止于修 Bug,功能开发与迭代才是日常工作的重头戏。
AI通过自问自答就能提升推理能力?! 这正是卡内基梅隆大学团队提出的新框架SQLM——一种无需外部数据的自我提问模型。
GPT-5的发布让全球震动,网友也都开始了试玩模式。 50万粉Youtuber Matthew Berman也参与其中,用25分钟的视频展示了数十个案例。
作为一款全新的「融合模型」,GPT-5将博士级的推理能力带给了所有OpenAI用户。它不仅在编程、写作等方面实现了巨大飞跃,更是在准确性上获得了史诗级提升。它的问世,标志着AI竞争已从模型发布转向真正的「智能发布」。
当Cleo创始人Barney Hussey-Yeo在LinkedIn上宣布"Cleo刚刚达到2.8亿美元年度经常性收入,AI正是开始取代传统的理财管家。
智东西8月6日消息,据外媒The Information报道,知情人士透露,AI视频初创企业Runway正与投资者洽谈约5亿美元(约合人民币36亿元)的融资,投前估值不低于50亿美元(约合人民币359亿元),较上一轮融资时的估值30亿美元(约合人民币215亿元)高出67%。
世界顶级风投 a16z 这两年已经成为全球最活跃AI投资者,他们对于行业的判断非常准确。我在 X 上关注了很多 a16z 的投资人,这样能方便第一时间了解行业最新的趋势是什么,以及有哪些我没注意到的好 AI 应用。
今天,MiniMax发布新一代语音生成模型Speech 2.5,再次刷新全球最强语音模型的上限。
对大公司来说,钱不值钱,最值钱的是时间。本期播客,我们邀请在硅谷专注 AI 企业级应用、医疗和工业自动化早期投资的风险投资机构 Fusion Fund 创始合伙人张璐,梳理上半年硅谷的科技大事件,以及从 Windsurf 收购案入手,分析这件事折射出了硅谷的初创生态在发生的变化,以及从 Meta 到 Google、再到苹果、亚马逊、微软,上半年的一些关键动作意味着哪些战略选择。