击败GPT、Gemini,复旦×创智孵化创业团队「模思智能」,语音模型上新了
击败GPT、Gemini,复旦×创智孵化创业团队「模思智能」,语音模型上新了近日,由复旦邱锡鹏担任首席科学家的模思智能发布了多说话人自动语音识别(ASR)模型 MOSS-Transcribe-Diarize,不但可以语音转文字,还可以将音频片段与对话中不同的说话者关联起来,性能超过了 GPT-4o、Gemini、豆包等一众模型。
搜索
近日,由复旦邱锡鹏担任首席科学家的模思智能发布了多说话人自动语音识别(ASR)模型 MOSS-Transcribe-Diarize,不但可以语音转文字,还可以将音频片段与对话中不同的说话者关联起来,性能超过了 GPT-4o、Gemini、豆包等一众模型。
前两天听同事说豆包在浦东美术馆接活儿了,不光带人逛展,还包讲解的那种。(震惊.jpg)
2025年是字节App工厂迎来收获的一年:豆包以过亿日活领跑AI应用赛道,红果短剧月活迈过2亿门槛,汽水音乐月活数据开始逼近网易云音乐,曾经的“弃子”多闪重回社交榜榜首……
CES每年都在找「下一个iPhone时刻」。2026年,答案可能不在手机,而在你家客厅。而谷歌却悄悄在最不起眼的地方——你家客厅的电视机里,埋下了一颗重磅炸弹。不需要昂贵的头显,也不需要把芯片植入大脑,谷歌直接宣布:电视机,长脑子了。
编辑|张倩、陈陈 当智能体(Agent)开始深度介入人类世界,关于豆包 AI 手机的讨论可能只是个开始。 在此之前,手机、电脑软件都是给人用的 —— 人负责一步步操作,系统负责把信息存好、算好。但现在
从走出「微笑曲线」到即将「上春晚」求爆发。
《晚点 LatePost》独家获悉,火山引擎将成为 2026 年中央广播电视总台春节联欢晚独家 AI 云合作伙伴,字节跳动旗下的智能助手豆包也将配合上线多种互动玩法,抖音曾于 2019 年与 2021 年两次成为春晚的独家互动平台。
最近这段时间,谷歌DeepMind的官方纪录片《The Thinking Game》在AI圈传播挺广。
前段时间,跟豆包一拍即合。
今天,在 FORCE 原动力大会上,火山引擎发布豆包大模型1.8、豆包视频生成模型 Seedance 1.5 pro。经过一年多的持续升级,豆包大模型家族在多模态理解和生成能力、Agent 能力上,已位于全球第一梯队。