开源 TTS,支持多语言、低显存运行,具备零样本语音克隆和高质量语音合成
多语言 TTS(英语、中文、日语等),无需音素即可直接输入任意文本。
超 40 种情感与语调标记,支持笑声、抽泣等音效。
零/少样本语音克隆,仅需 10‑30 秒音频即可生成高保真克隆语音。
两种模型规格(OpenAudio‑S1 4 B、Mini 0.5 B),集成 RLHF,推理速度快,提供 Gradio WebUI 与 Docker 镜像
提供 120+ 多语言、20+ 口音的高保真 AI 语音,并支持 10-30 秒样本的快速语音克隆
AI 驱动的视频本地化平台,支持130+语言的自动翻译、语音克隆、多人说话人检测与口型同步,提供一键生成字幕与配音的完整工作流
AI 配音与声音克隆平台,提供 40+ 语言、70+ 音色、情感语音与高保真克隆,支持批量配音与多角色创作
企业级多语言TTS平台,提供自然音色、语音克隆、超过35种语言的API和嵌入式播放器,支持网页、文档和应用的无障碍音频化
Azure AI 语音服务的可视化工具集,无代码创建项目,提供实时/批量语音转文本、文本转语音、语音翻译、发音评估与自定义语音模型,支持 100 + 语言与多场景(字幕、呼叫中心等)
面向跨境电商的 AI 视频本地化平台,提供 100+ 语言的自动翻译、配音、语音克隆与智能字幕
您的邮箱地址不会被公开。 必填项已用 * 标注
评论 *
显示名称 *
邮箱 *
网站
在此浏览器中保存我的显示名称、邮箱地址和网站地址,以便下次评论时使用。
提供 120+ 多语言、20+ 口音的高保真 AI 语音,并支持 10-30 秒样本的快速语音克隆