独家|阿里通义实验室语音团队负责人鄢志杰离职,系达摩院十三位“扫地僧”成员
独家|阿里通义实验室语音团队负责人鄢志杰离职,系达摩院十三位“扫地僧”成员阿里通义实验室语音团队负责人鄢志杰已于近期离职,离职时间为2月15日,按照以前的P序列(原阿里内部职级体系)比照,其职级为P10。鄢志杰是智能语音领域的技术大牛。公开资料显示,2003年,鄢志杰大学本科毕业,升入中科大语音实验室,攻读博士学位,师从语音领域专家王仁华教授(科大讯飞创始人之一,曾任科大讯飞公司董事长)。
搜索
阿里通义实验室语音团队负责人鄢志杰已于近期离职,离职时间为2月15日,按照以前的P序列(原阿里内部职级体系)比照,其职级为P10。鄢志杰是智能语音领域的技术大牛。公开资料显示,2003年,鄢志杰大学本科毕业,升入中科大语音实验室,攻读博士学位,师从语音领域专家王仁华教授(科大讯飞创始人之一,曾任科大讯飞公司董事长)。
现在是 2025 年,新论文要以博客形式出现。
南洋理工大学的研究团队提出了MedRAG模型,通过结合知识图谱推理增强大语言模型(LLM)的诊断能力,显著提升智能健康助手的诊断精度和个性化建议水平。MedRAG在真实临床数据集上表现优于现有模型,准确率提升11.32%,并具备良好的泛化能力,可广泛应用于不同LLM基模型。
在 Sora 引爆世界模型技术革命的当下,3D 场景作为物理世界的数字基座,正成为构建动态可交互 AI 系统的关键基础设施。当前,单张图像生成三维资产的技术突破,已为三维内容生产提供了 "从想象到三维" 的原子能力。
一天前如果我跟你说, 有这样一个模型,原本只能生成文字,现在可以文生图、图生图、连续对话改图、自由修改提示语、每张图生成时间不超过10s
一家高校实验室 ,能走出多少个知名 AI 初创公司的创始人?
语音Agent市场在2024年下半年迎来爆发式增长。据Cartesia统计,在最新一届YC中,构建语音相关产品的公司占比达22%。
OpenAI的全模态模型没来,谷歌的全模态图像生成器倒是抢先上线了!Gemini 2.0 Flash中上线的原生图像生成功能,动动嘴就能PS,还能轻松制作海报和表情包,动漫和漫画圈已经沸腾了。
正式并入阿里 AI To C 业务之后,通义有了新的动作。
随着大模型时代的到来,搜推广模型是否具备新的进化空间?能否像深度学习时期那样迸发出旺盛的迭代生命力?带着这样的期待,阿里妈妈搜索广告在过去两年的持续探索中,逐步厘清了一些关键问题,成功落地了多个优化方向。