GPT-SoVITS 综合介绍

 

GPT-SoVITS是一个开源的少样本语音合成工具,能够通过少量的语音样本实现高质量的文本到语音转换。支持零样本和少样本训练,具备跨语言支持,适用于英语、日语和中文。提供了一系列WebUI工具,包括声音伴奏分离、自动训练集分割、中文语音识别和文本标注,帮助初学者创建训练数据集和GPT/SoVITS模型。

 

GPT-SoVITS

 

 

GPT-SoVITS 功能列表

 

  • 零样本TTS:输入5秒的声音样本即可体验即时文本到语音转换。
  • 少样本TTS:只需1分钟的训练数据即可微调模型,提高声音相似度和真实感。
  • 跨语言支持:支持训练数据集以外的语言推理,目前支持英语、日语和中文。
  • WebUI工具:集成了声音伴奏分离、自动训练集分割、中文语音识别和文本标注等工具。

 

 

GPT-SoVITS 使用帮助

 

  • 在Windows系统上可以直接通过下载的prezip文件安装并启动WebUI
  • 提供了快速安装脚本,可以通过conda进行环境准备和安装
  • 支持使用Docker进行部署
  • 提供了预训练模型下载链接
  • 支持命令行操作模式

 

 

GPT-SoVITS 下载

 

GPT-SoVITS-beta0217 Windoes下载

相关导航