AI语音AI开放服务/开源项目 AI语音克隆

GPT-SoVITS

GPT-SoVITS：提供用户友好的文字转语音TTS功能，支持多语言和少样本学习，用最少的样本实现最自然的语音合成体验。

标签：AI开放服务/开源项目 AI语音克隆少样本TTS 文字转语音语音克隆语音合成零样本TTS

链接直达">手机查看

其他站点:GPT-SoVITS 使用教程 colab免费运行GPT-SoVITS Multi-voice-TTS-GPT-SoVITS（在线运行）

GPT-SoVITS 综合介绍

GPT-SoVITS是一个开源的少样本语音合成工具，能够通过少量的语音样本实现高质量的文本到语音转换。支持零样本和少样本训练，具备跨语言支持，适用于英语、日语和中文。提供了一系列WebUI工具，包括声音伴奏分离、自动训练集分割、中文语音识别和文本标注，帮助初学者创建训练数据集和GPT/SoVITS模型。

GPT-SoVITS

GPT-SoVITS 功能列表

零样本TTS：输入5秒的声音样本即可体验即时文本到语音转换。
少样本TTS：只需1分钟的训练数据即可微调模型，提高声音相似度和真实感。
跨语言支持：支持训练数据集以外的语言推理，目前支持英语、日语和中文。
WebUI工具：集成了声音伴奏分离、自动训练集分割、中文语音识别和文本标注等工具。

GPT-SoVITS 使用帮助

在Windows系统上可以直接通过下载的prezip文件安装并启动WebUI
提供了快速安装脚本，可以通过conda进行环境准备和安装
支持使用Docker进行部署
提供了预训练模型下载链接
支持命令行操作模式

GPT-SoVITS 下载

GPT-SoVITS-beta0217 Windoes下载

相关导航

Uberduck AI是个让你由文本制作成歌声或说话声音的AI平台，用于音乐和创意产业。每月提供300分钟文本转语音服务。

自得语音

自得语音，独特的AI语音角色，实时创造个性化的克隆语音。

OpenVoice/MeloTTS

OpenVoice拥有即时声音克隆技术，可进行多语言语音合成及风格控制，中文语音克隆明显提升。

有道数字人

有道数字人，利用AI技术创造逼真的虚拟形象，提升内容生产与交互效率。

edge-tts模块让Python代码实现无需浏览器和特定操作系统就能调用微软Edge的文本转语音服务。

FreeTTS是一个在线的文字转语音转换器，能快捷地将文本转变为自然语音，并支持MP3下载。提供免费语音转文本、语音增强、音频剪辑等服务。