KugelAudio

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
KugelAudio
访问
116
12782

可自行托管的实时文本转语音模型


KugelAudio 是一款可自行部署的实时文本转语音 AI 模型,支持低于 60 毫秒的低延迟推理与语音克隆,可选择本地部署或通过 API 调用。它对语法规则敏感,可以自然处理电话号码、IBAN、地址和药品名称等特殊文本,支持超过 25 种语言、词级时间戳与 IPA 音标,还提供了 LiveKit、Pipecat 和 Vapi 的适配插件,由四人团队在柏林开发。