老天保佑Qwen救救阿里巴巴

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
老天保佑Qwen救救阿里巴巴
5513点击    2026-07-02 15:00

老天保佑Qwen救救阿里巴巴


金山银山前路有


「同志们朋友们,版本回调了!


搞AI应用的家人们没活了。胜利女神的天平又一次倾向了大模型公司一边。有鉴于此,我们将复刻致敬葬AI一年前的系列——把模型公司挨个写一遍。


之前已经写过了Kimi、智谱和豆包,其他模型公司敬请期待😘」


阿里巴巴是一家很神奇的公司。


现在AI火成这个样子。GLM 5.2达到Opus 4.8水平,智谱彻底摆脱2G公司老教授组团爆金币的刻板印象,市值突破万亿港元,约等于1/2阿里。


我在做完第一期葬AI基准测试后,立即发现了GLM 5.2牛逼,同时发现的还有Qwen 3.7 Max也很牛逼,只比GLM差一点点,达到了Opus 4.7水平。


阿里的牛逼之处就在这里。Qwen 3.7 Max是当之无愧的国模第二,显著领先字节的Seed 2.1 Pro。


但是大伙就是认为阿里是一家老登公司。在模型牛逼的情况下,我们亲爱的阿里巴巴,股价就这么梦回十二年前,美美跌破发行价。


老天保佑Qwen救救阿里巴巴

https://funeralai.cc/test/


这是因果啊家人们。


阿里往死里干美团小王,虽然小王一头白发,下罪己诏说股价崩了自己有很大责任,但阿里也没好日子啊。中高P年包直接缩水小一半好吧。


所以啊,到底干外卖还是AI,这是阿里两条路线的斗争,不是外卖压倒AI,就是AI压倒外卖。


道理很简单,全球科技巨头都All in AI,但阿里还在干外卖,那空头不干你干谁。


好了,扯淡结束。让我们来正经论述一下阿里的AI业务。


阿里是一家喜欢搞组织改革的公司,它的AI业务也处在非常激烈的组织变动中。


首先是林俊旸出走,催化阿里搞出Token事业群(ATH),合并所有AI业务,将原属于阿里云、淘天等的AI业务划到新事业群里。


然后是在ATH事业群中成立Token Foundry事业部,合并了所有模型团队,由吴妈直接领导,老板直管大模型。


最近是文笔非常优美的《置身钉内》,催化了阿里合并Agent产品,钉钉老大换人,Mulerun和悟空合并。


所以阿里目前的AI业务是这个情况。


ATH事业群,下辖Token Foundry事业部、MaaS事业部、千问APP事业部、悟空事业部和创新事业部。


Token Foundry事业部,包含了Qwen、Wan、Happy horse等系列模型;


MaaS事业部,最近把难用的百炼后台套壳为简洁的千问云;


千问APP事业部,主要是夸克团队在做的千问APP;


悟空事业部,包含了钉钉和2B Agent悟空;


创新事业部,目前主要剩个Qoder,之前在这的MuleRun刚和钉钉合并。


老天保佑Qwen救救阿里巴巴


一目了然,阿里在大整合AI业务。


从组织、模型再到产品,逐步进行大整合。目标是实现一家公司、一个模型、一个产品。「阿里-Qwen-千问」三轴心。


问题要从千问APP说起。


众所周知,豆包APP断档式领先,其中最重要的因素可能是多模态。


大伙在聊天框里打字,那各个Chatbot就是没什么区别。考虑到Qwen模型好很多,千问APP理论上应该更聪明。但家人们用豆包也不需要多聪明啊。


我印象最深刻的两个豆包使用场景是:年初葬爱家族去通化滑雪,出租车司机一直开着豆包语音聊天,从俄乌战场一路聊到县城房价;


我家装修漏水,装修公司扯皮,我妈给豆包打电话,豆包找出了装修公司老板的联系方式,我妈电话打给老板,问题解决了。


这么好的功能,不抄真是可惜了。


令我震撼的是,千问APP其实是有语音视频功能的。但是藏在输入框上的工具栏里,你得猛猛左滑才能找出来。


老天保佑Qwen救救阿里巴巴


藏这么深,说明不是千问APP想不到,更不是没能力搞多模态。单纯是坚信非共识,在给Chatbot加Agent能力上一路狂奔👍


除了做办公三件套这些基础能力外,还有打通淘宝、高德,让Agent帮你点奶茶、订餐馆、打车等一系列能力aka千问办事。


首先,这是创新,要肯定的。像前两天热炒的豆包谎称可以打电话订餐馆,其实千问APP几个月前就有这功能,真可以让AI打电话订餐。


但问题是,涉及到跨APP的工具调用会带来严重的任务成功率低的问题。更重要的是,Chatbot是一阶能力,Agent是二阶能力,之间的漏斗可能筛掉90%的人。


一阶能力都没补全,想靠未经验证的二阶能力弯道超车,着实平地干拔。


当然也有可能,千问产品经理在大气层。赌的是大模型Agentic能力快速上涨,这些复杂任务越来越流畅。


这些都是产品细节问题。最重要的是,千问APP推出得太晚了。


豆包APP从23年开始干,25年中上线了视频通话功能。等到25年底,豆包表情包、二创视频满天飞了,千问APP才上线。之前的通义和夸克这俩APP,约等于合并后从头再来。


所以,从错过豆包的经验教训,你可以理解阿里今天干的所有事——要合并,要力出一孔,要集中力量做AI。


不过好消息是,AI行业整体版本更新了。大伙发现豆包也不挣钱,或者说2C的AI应用就是不挣钱。


唯一的由邪恶的Anthropic验证出来的AI挣钱路径是,卷编程能力,面向生产力场景。只要模型能力足够牛逼,自然有大把人求着送钱。


最鲜活的例子就是智谱,收入多少完全不重要,只要GLM能打穿编程场景,追上Opus 4.8,那它就值得半个阿里。


就像是智谱老板唐杰说的那样,「AI时代的本质就是技术的快速进步——当你停下来打磨产品,可能第二天就发现底层技术已经落后、产品已经没人用;当你停下来思考商业模式,AI世界已经再次被颠覆。」


所以,一切还是回到模型能力上。


只要Qwen模型能够持续领先,那它的生产力Agent如Qoder work等,做好是很自然的事情。


如智谱故事。因为GLM会员难抢,所以很多人下载智谱的Agent产品Zcode。这里要表扬智谱一句,抄Codex是对的,不像Kimi work抄都抄错对象,抄了产品一坨的Claude cowork。


老天保佑Qwen救救阿里巴巴


如Seedance故事。只要模型能力够强,自然有冕神和LibTV这样的分销商,竭尽全力自己补贴,帮火山引擎冲业绩。小云雀、即梦的视频Agent做得怎么样,根本不重要好吧。


所以,问题回到了如何评价Qwen上。


好消息是,Qwen确实是领先的。坏消息是,总差那么一点点。


你从Qwen的模型发布上都能看出来,阿里老板对Qwen最重要的期待就是打穿一个点,彻底破圈,让人民群众觉得Qwen牛逼。


为此,Qwen 3.7 Max和GLM一样舍弃了多模态能力,专注编程和长程任务场景。


但就差一点点。你从智谱自己跑的Benchmark都能看出来,Qwen在好几项测试得分是持平或超越GLM、Opus的。两者实际能力差距可能不到一个百分点。


老天保佑Qwen救救阿里巴巴


但就是这一点点差距,决定了GLM是国模第一。在Fable 5被限制的这一个月里,GLM也是世界人民能自由用上的最强大模型。


第一的奖赏远远大于第二名。这段时期所有人都在讨论智谱,没有人讨论Qwen。


所以啊,存在一个国模临界点。


当一个大模型的能力能够持平A畜O社的旗舰模型,或者开源出类似CoT那样超乎绝伦的产品形态时,整个世界的注意力都会集中到这个模型上,它会被赋予挑战邪恶科技巨头垄断的骑士大战恶龙一样的角色。


我问一个炒股老哥,要是年底Qwen率先超越Fable 5,阿里股价能拉20个点吗?老哥第一反应是,别说20个点,100个点问题不大。


我对Qwen还是非常乐观的。因为两者最新模型能力非常接近,而Qwen 3.7 Max比GLM 5.2早发布了一个月,并且Qwen的更新频率比GLM略快。


所以,下一代Qwen模型大概率能够领先GLM,成为国模第一。


但问题就出在这里。


Qwen现在就很牛逼,短期内大概率突破临界点,但这代表阿里巴巴集团会遵循一种线性关系变得伟大起来吗?


所以问题又回到了,Qwen牛逼不代表阿里股价要涨。因为大伙心中阿里不是一家纯粹的AI公司,它还在打烂仗。


顺便插一句,作为阿里股东,这里我要点名批评Happy horse。


成天刷榜骗哥们可以,别把自己骗了。视频模型刷榜是没用的,因为视频好坏大伙一眼能看出来。Happy horse生成的画面油成那样,你说自己超过Seedance是没人信的。


这是一个常识问题,不要成天考验大伙的常识。


最后抽象地总结一下吧。


ChatBot是第一阶段的竞争。第二阶段的竞争,生产力Agent,才刚刚开始。


你能明显发现,阿里和字节两家的Agent产品,都还在赛马。字节有豆包专业版、Trae work、Coze和飞书的一堆Agent。阿里有千问桌面版、Qoder work,Mulerun刚和钉钉悟空合并。


显然,这种状态不可能持续多久。之后的情况一定是BAT各自合并出一个Agent产品。


这方面,腾讯吃了元宝和模型不行的红利,不用纠结,主推Workbuddy就行。


相比起ChatBot,Agent产品更加考验模型的长程任务能力。字节的基模能力不行会成为一个更大的问题。


大伙的潜意识会因为豆包产品强而滤镜Seed模型。但Seed 2.1 Pro事实上是二流国模水平,落后GLM、Qwen和Kimi,和我们亲爱的MiniMax M3水平接近。


这也是一个很好玩的问题,为什么字节产品和视频模型无敌,而Seed基模一直没做起来?


经过我的一番思考,原因很可能是:Seed团队太火了,外界预期太高,总有人撺掇研究员出去创业,动摇军心。


反观做出大结果的Deepseek、Seedance和GLM,都是之前没什么人关心,团队可以专注地猥琐发育aka边缘创新,模型能力逐步突破临界点,外界后知后觉猛然意识到这团队憋了个大的。


这是一个组织问题。


即便Seed工资很高,豆包股猛猛发。但总不能让研究员们人均开上法拉利。而创业bro真有人开上法拉利。投资人拿这些诱惑你,确实难顶。


归根结底还是,大模型是一个工程问题,依靠整个团队都纯粹专注努力,那些可恶的投资人(特指两家盯着字节的VC和FA)和竞对成天挖人干扰军心可不行。


另一个原因是,C端产品做得好,对模型的编程能力不一定是促进。你看掌握了充足C端数据的公司,谷歌、Grok、Meta,模型一个比一个拉。


众所周知,豆包产品团队自己做了很多后训练,音视频功能背后也不止一个模型。产品做得好,团队话语权大,模型团队自然多一个爹。爹强儿弱很合理。


所以啊,阿里外界形象拖累人民群众对Qwen的预期,这真的是福报,要珍惜。


文章来自于"葬AI",作者 "葬愛咸鱼"。

关键词: AI新闻 , 阿里AI , Qwen , 人工智能
AI转型,免费服务,就找AITNT
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md