生成式语音模型,仅需 2 秒音频样本即可克隆声纹,支持六种语言、噪声去除、风格迁移等多任务能力
2 秒样本即可学习个人声线,实现高保真克隆
支持 6 种语言、噪声去除、内容编辑、风格迁移
可在文本‑引导下生成语音,也能对已有音频进行局部修补
基于 Azure Speech Service 的开源前端,提供文本转语音、语速与音调调节,支持多语言与本地部署,便于开发者快速集成
开源前端工具,使用微软 Speech API 支持无限长度文本、批量转换及多语言语音输出,具 SSML 与长文本切片功能
AI 文本转语音工具,提供900 + 声音、80 + 语言与120 种口音,支持语速、音调、音量自定义,适用于配音、播客与多语言客服
开源 TTS,支持多语言、低显存运行,具备零样本语音克隆和高质量语音合成
AI视频配音工具,支持30+语言和450+逼真人声,具备自动字幕、机器翻译、语音克隆和多说话人识别,适合跨语言视频本地化
多语言、多音色(男、女、童声)文本转语音,提供多音字纠错、局部变速、情感调节、音效与背景音乐等编辑功能;适用于教育、短视频、广告等多场景
您的邮箱地址不会被公开。 必填项已用 * 标注
评论 *
显示名称 *
邮箱 *
网站
在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。
基于 Azure Speech Service 的开源前端,提供文本转语音、语速与音调调节,支持多语言与本地部署,便于开发者快速集成