VoiceCraft_零样本语音克隆与文本转语音

综合介绍

VoiceCraft是一个专注于语音技术的项目，旨在通过填充神经编码语言模型的方式进行零样本语音克隆和文本转语音(TTS)操作。该项目能够引用少量参考资料来克隆或编辑未见过的声音，并提供了相关代码和模型权重，适用于包括有声书、网络视频和播客在内的数据。

采用先进的语音识别系统
提供零样本文本转语音(TTS)性能
支持开源许可协议发布
支持环境设置和示例推理
提供训练指南和数据集上传

使用conda和pip进行环境配置
克隆GitHub仓库以获取所有文件
运行提供的notebook文件以进行语音编辑和TTS推理
遵循许可协议使用代码和模型

ElevenLabs——用AI赋予每段文字生命，让内容以任何语言和声音被听见。

edge-tts模块让Python代码实现无需浏览器和特定操作系统就能调用微软Edge的文本转语音服务。

Reecho提供瞬间克隆任何声音的能力，生成极为逼真的人工智能语音，体验前所未有的AI语音克隆技术。。

Uberduck AI是个让你由文本制作成歌声或说话声音的AI平台，用于音乐和创意产业。每月提供300分钟文本转语音服务。

自得语音，独特的AI语音角色，实时创造个性化的克隆语音。

OpenVoice拥有即时声音克隆技术，可进行多语言语音合成及风格控制，中文语音克隆明显提升。