端到端GUI智能体首次实现“犯错-反思-修正”闭环,模拟人类认知全过程
端到端GUI智能体首次实现“犯错-反思-修正”闭环,模拟人类认知全过程端到端多模态GUI智能体有了“自我反思”能力!南洋理工大学MMLab团队提出框架GUI-Reflection。
端到端多模态GUI智能体有了“自我反思”能力!南洋理工大学MMLab团队提出框架GUI-Reflection。
几乎路上所有的广告牌都被AI占据,几乎每栋楼都有人给你讲AI的创业故事——盛景网联董事长、盛景嘉成创投创始合伙人彭志强对不久前在硅谷见到的景象记忆犹新。
还记得DeepSeek-R1发布时AI圈的那波狂欢吗?"提示工程已死"、"再也不用费心写复杂提示了"、"推理模型已经聪明到不再需要学习提示词了"......这些观点在社交媒体上刷屏,连不少技术大佬都在转发。再到最近,“提示词写死了”......现实总是来得这么快——乔治梅森大学的研究者们用一个严谨得让人无法反驳的实验,狠狠打了所有人的脸!
如何与AI共处?
我们人类生活在一个充满视觉和音频信息的世界中,近年来已经有很多工作利用这两个模态的信息来增强模型对视听场景的理解能力,衍生出了多种不同类型的任务,它们分别要求模型具备不同层面的能力。
在人工智能浪潮席卷全球的今天,央国企作为“国家队”,正加速驶入AI赛道。政策推动、产业升级、技术变革的多重压力下,一场关于“速度与质量”的博弈悄然展开。
下手帮你干活直接交付结果。 当搜索不再只是获取信息的工具,而能直接帮你完成购物决策、行程规划甚至输出专业报告——这一愿景随着纳米AI超级搜索智能体的发布成为现实。
现在的AI应用就像韩国偶像团体一样新人辈出——脸还没被认熟就推出了新的版本,然后就是噼里啪啦一顿造势,结果总是会有作品、实力配不上流量的感觉。
"AI装饰了你的梦,你成为了AI的韭菜" 6月7日-10日,2025年高考,1335万人参加。 如按参加高考学生平均年龄18岁计算,那么他们是第一批被AI深度影响的高考生——2022年OpenAI走红,这批学生刚进入高中。
多鲸即将发布《2025 AI 赋能教育行业发展趋势报告》,该文为预览先导精彩内容。本文将从 AI 如何驱动教育「需求演进」、AI 在「场景创新」中的具体应用,以及由此形成的「生态融合与市场爆发」这四个维度,深入探讨 AI+教育的未来图景。
知识图谱(KGs)已经可以很好地将海量的复杂信息整理成结构化的、机器可读的知识,但目前的构建方法仍需要由领域专家预先创建模式,这限制了KGs的可扩展性、适应性和领域覆盖范围。
就在刚刚,Meta 又有新的动作,推出基于视频训练的世界模型 V-JEPA 2(全称 Video Joint Embedding Predictive Architecture 2)。其能够实现最先进的环境理解与预测能力,并在新环境中完成零样本规划与机器人控制。
第一财经「新皮层」独家获悉,MiniMax即将推出文本推理模型,并将开源。半个月前,MiniMax刚刚发布和开源了视觉推理模型Orsta(One RL to See Them All)。MiniMax今年3月做出产品线调整,将旗下现有产品「海螺AI」更名为「MiniMax」,与公司同名,聚焦文本理解和生成;
活久见,OpenAI和谷歌「世纪握手」,达成合作了!另一边的微软,似乎转头就被抛弃了。另外,小扎也受了刺激,下决心亲自组队50人 ,破釜沉舟斥资150亿收购Scale AI,誓要做出AGI。硅谷变天了。
医学领域,也有自己的世界模型了。
Figma正式祭出官方MCP,先体验一下好用不好用: 打开 Figma 桌面应用并确保已更新至最新版本。
强推理终于要卷速度了。 大模型强推理赛道,又迎来一位重量级玩家。
由美国西北大学医学院研发的全球首个嵌入临床流程的生成式人工智能(AI)放射系统,可在毫秒内识别危及生命的病症,显著提高工作效率。该系统为全球放射科医生短缺问题提供了有效解决方案。相关论文发表在最新一期《美国医学会杂志》旗下的《JAMA Network Open》期刊上。
当OpenAI以65亿美元估值收购前苹果传奇设计师乔纳森·伊夫(Jony Ive)的AI硬件初创公司io时,AI行业对大模型公司的生态战略产生了热议。
平面设计师有救了! 复旦大学和字节跳动团队联合提出CreatiDesign新模型,可实现高精度、多模态、可编辑的AI图形设计生成。
你有没有想过,编程这件事情可能彻底变了?开发者正在从单纯使用AI工具,转向将AI视为构建软件的全新基础。这不是什么小调整,而是一场彻底的范式转变。想想看,那些我们一直习以为常的核心概念——版本控制、代码审查、甚至"开发者"的定义——都在因为AI agent驱动的工作流而被重新定义。
AI能看图,也能讲故事,但能理解“物体在哪”“怎么动”吗? 空间智能,正是大模型走向具身智能的关键拼图。
人在火山引擎发布会现场,会上令人头晕目眩的发了一堆东西。
谁说强化学习只能是蛋糕上的樱桃,说不定,它也可以是整个蛋糕呢?
最近,字节跳动团队联合华中科技大学发布的基准数据集 WildDoc 引起了对 OCR 能力的再衡量。
2025年5月,美国数字健康企业 Akido Labs 宣布完成6000万美元B轮融资,由 McKesson Ventures 和 Polaris Partners 联合领投,老股东 Andreessen Horowitz(a16z)与 SVB Capital 跟投。融资所得将主要用于扩大其核心平台 ScopeAI 的部署,尤其是在医疗资源匮乏的社区加速落地。
本文将介绍 DeepMath-103K 数据集。该工作由腾讯 AI Lab 与上海交通大学团队共同完成。
企业搜索聊天机器人开发商 Glean 在威灵顿管理公司领投的 F 轮融资中筹集了 1.5 亿美元。这再次表明投资者对企业搜索市场的乐观态度,该领域还有亚马逊云服务、谷歌、Snowflake 等竞争者参与角逐。
Benchmark 合伙人 Eric Vishria 最近跟 Banana Capital 合伙人 Turner Novak 在其播客 The Peel 做了一个非常精彩的对话,这是我最近觉得非常不错的一个访谈。
要说AI商业化最成功的领域,广告绝对算一个。