国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类
国产最强语音大模型诞生,MaskGCT宣布开源,声音效果媲美人类近期,港中大(深圳)联手趣丸科技联合推出了新一代大规模声音克隆 TTS 模型 ——MaskGCT。该模型在包含 10 万小时多语言数据的 Emilia 数据集上进行训练,展现出超自然的语音克隆、风格迁移以及跨语言生成能力,同时保持了较强的稳定性。MaskGCT 已在香港中文大学(深圳)与上海人工智能实验室联合开发的开源系统 Amphion 发布。
近期,港中大(深圳)联手趣丸科技联合推出了新一代大规模声音克隆 TTS 模型 ——MaskGCT。该模型在包含 10 万小时多语言数据的 Emilia 数据集上进行训练,展现出超自然的语音克隆、风格迁移以及跨语言生成能力,同时保持了较强的稳定性。MaskGCT 已在香港中文大学(深圳)与上海人工智能实验室联合开发的开源系统 Amphion 发布。
海外和国内 AI + 教育创业情况如何?
智源深澜已经与国内外多家生物科技公司展开合作,包括先进生物基材料的研发、抗体优化等。
用生成式AI,重构旅行平台。
PUMA(emPowering Unified MLLM with Multi-grAnular visual generation)是一项创新的多模态大型语言模型(MLLM),由商汤科技联合来自香港中文大学、港大和清华大学的研究人员共同开发。它通过统一的框架处理和生成多粒度的视觉表示,巧妙地平衡了视觉生成任务中的多样性与可控性。
以生成式AI突破PCBA设计自动生成市场。
36氪获悉,知行机器人科技(苏州)有限公司(以下简称“知行机器人”)于近期完成数千万元B轮融资,本轮融资由诚美资本与中关村智友科学家基金联合领投。融得资金将用于公司核心产品及系统的研发、拓展及推广。
分享一篇近期由华为和阿卜杜拉国王科技大学合作完成的一项生信分析与大语言模型相结合的工作,相关成果发表在《Advanced Science》上。
近日,极佳科技联合中国科学院自动化研究所、理想汽车、北京大学、慕尼黑工业大学等单位提出DriveDreamer4D,是首个利用世界模型增强 4D 驾驶场景重建效果的工作。
专注具身智能的北京灵生科技有限公司(以下简称「灵生科技」)近日宣布完成千万级天使轮融资,投资方包括天容海色、万物为创投、夸克电力。融资资金将用于灵生类脑产品线研发。