AI语音AI开放服务/开源项目AI语音克隆
GPT-SoVITS
GPT-SoVITS 综合介绍
GPT-SoVITS是一个开源的少样本语音合成工具,能够通过少量的语音样本实现高质量的文本到语音转换。支持零样本和少样本训练,具备跨语言支持,适用于英语、日语和中文。提供了一系列WebUI工具,包括声音伴奏分离、自动训练集分割、中文语音识别和文本标注,帮助初学者创建训练数据集和GPT/SoVITS模型。
GPT-SoVITS 功能列表
- 零样本TTS:输入5秒的声音样本即可体验即时文本到语音转换。
- 少样本TTS:只需1分钟的训练数据即可微调模型,提高声音相似度和真实感。
- 跨语言支持:支持训练数据集以外的语言推理,目前支持英语、日语和中文。
- WebUI工具:集成了声音伴奏分离、自动训练集分割、中文语音识别和文本标注等工具。
GPT-SoVITS 使用帮助
- 在Windows系统上可以直接通过下载的prezip文件安装并启动WebUI
- 提供了快速安装脚本,可以通过conda进行环境准备和安装
- 支持使用Docker进行部署
- 提供了预训练模型下载链接
- 支持命令行操作模式
GPT-SoVITS 下载