阿里Qwen3.7竞技场杀至国产第一!一手实测:分分钟破解奥赛难题,图文视觉全都难不倒
阿里Qwen3.7竞技场杀至国产第一!一手实测:分分钟破解奥赛难题,图文视觉全都难不倒阿里正加速Qwen主模型的迭代节奏。
搜索
阿里正加速Qwen主模型的迭代节奏。
现有的开源多模态搜索智能体普遍受困于「裁剪 - 再搜索」的串行处理模式,面对多目标时往往陷入交互冗长、错误级联累积的泥沼。
攻克AI落地难题,清华团队推出RWAI框架与真实场景竞技场,通过标准化人机交互、任务集机制与人类反馈体系,显著提升产业应用效率。平台已实现落地周期缩短70%以上,并为AI开发者和企业提供了可复制的最佳实践。
太疯狂了!Claude Mythos单月狂扫423个安全漏洞,产出飙升14倍,连藏了20年的老Bug都被连根拔起。
大模型的能力边界正在不断拓展,从文字到视觉,再到音频,全模态理解已渐成现实。然而,当你问一个多模态大模型「这首歌的高潮从第几秒开始?」或者「第 30 秒之后乐器编配发生了什么变化?」,得到的往往是一个模糊甚至错误的回答。
劈柴和Hassabis把半年大招一晚清仓了!Gemini Omni任意输入生成视频,3.5 Flash断层碾压一切,Spark 7×24h云端替你干活。这次,谷歌是要把OpenAI和Anthropic一起给埋了。
5 月 19 日,Andrej Karpathy 在 X 上宣布加入 Anthropic。个人近况:我已加入 Anthropic。我认为未来几年在 LLMs 前沿的工作将具有特别重要的塑造性。我非常激动能加入这里的团队并重回研发。我仍然对教育充满热情,并计划适时恢复我在这方面的工作
阿里你的嘴是真严啊,怎么一眨眼Qwen 3.7预览版突然就上线了!
我被AI杀了?
你空有一身绝绝子搞钱经验,却在AI时代越用越焦虑?今天,首个AI专家市场「袋袋」上线:不考提示词,不拼敲代码,只要你会聊天,就能一键将你的脑子「数字资产化」,让你的判断力变成全球24小时自动躺赚的「逻辑版税」!
前北京人形数据负责人创业,给出即插即用的灵巧操作方案。
Cursor模型更新,最新版本已来到Composer 2.5。
没有新的GPU,没有新的智算卡。
自从黄仁勋在 GTC 上大手一挥,鼓励企业把 token 消耗量算进工程师的 KPI,魔幻的事情就一天比一天多了。
黄仁勋刚走,苏妈就来了。
过去一段时间,很多人对大模型都有一个明显感受:token 总是不够用。
GPU 烧算力,电网烧钱,最后是普通消费者买单。
伯克利等发布FST框架:通过快慢分层解决大模型持续学习死局。
你是否在使用Agent工作或者写代码时,总感觉上下文不够用?或者感觉反复使用Agent时并没有变得更聪明?感觉目前的记忆方案仍然不够用?今日,香港中文大学联合浙江大学发布的一篇论文关注了这个问题,并引起了学术界广泛讨论:你以为Agent在「记忆」,其实只是在记备忘录。
AI shopping 的热度正在升温。
最近,京东和中科院信工所展开了Self-Taught RLVR的系列研究,并连发三篇后训练新作。
Sam Altman 今天在 X 上扔出一个数字:ChatGPT Images 2.0 在印度已经生成超过 10 亿张图。距离产品发布只有 27 天。TechCrunch 和第三方数据验证了印度确实是最大市场——但全球增长远没有那么均匀,这更像一场区域性起飞。
经常切换使用CC、Codex、OpenClaw这类Agent的人会发现:同一个模型,放进不同系统里,表现可能完全不同。
近日,能量桥科技(上海)有限公司(以下简称“能量桥”)宣布完成新一轮融资,由 Monolith 砺思资本领投,中科创星跟投。
近年来,3D 高斯泼溅(3D Gaussian Splatting, 3DGS)凭借其卓越的新视角合成能力和实时的渲染效率,极大地推动了神经渲染技术的发展。然而,当研究者试图直接从 3DGS 中提取精确的 3D 几何表面(Mesh 等)时,往往会面临严重的几何失真问题。
刚刚,国际权威市场调研机构英富曼(Omdia)发布最新的《中国AI云市场份额2025》报告。2025年中国AI云市场总规模达567亿元人民币,其中,阿里云在AI IaaS和MaaS-MPS两大子市场均位列第一,总份额从上半年的35.8%上涨至38.1%,整体稳居第一,超过二到四名总和。
「以 1/10 的成本,性能几乎追平 Claude Opus 4.7 这个级别的模型。」
传统API集成已死!在这个Agent满地跑的时代,被低估的搜索终于迎来了第四次范式转移。AnySearch的问世,让Agent告别了单一的网页总结功能,转而通过获取可信的结构化信息,真正具备触达并连接现实世界的能力。
最近一段时间,Agent 又一次成为 AI 圈最热的关键词。
过去,一部动画短片的诞生往往需要数月甚至一年的漫长周期。从分镜、原画、建模到渲染,每一个环节都堆砌着密集的人力与时间成本。但在上周末,北京三里屯的一场活动,彻底颠覆了这一传统认知。