综合介绍

VoiceCraft是一个专注于语音技术的项目,旨在通过填充神经编码语言模型的方式进行零样本语音克隆和文本转语音(TTS)操作。该项目能够引用少量参考资料来克隆或编辑未见过的声音,并提供了相关代码和模型权重,适用于包括有声书、网络视频和播客在内的数据。

 

 

功能列表

采用先进的语音识别系统
提供零样本文本转语音(TTS)性能
支持开源许可协议发布
支持环境设置和示例推理
提供训练指南和数据集上传

 

 

使用帮助

使用conda和pip进行环境配置
克隆GitHub仓库以获取所有文件
运行提供的notebook文件以进行语音编辑和TTS推理
遵循许可协议使用代码和模型

相关导航