AI语音AI开放服务/开源项目AI语音克隆

Retrieval-based-Voice-Conversion-WebUI

Retrieval-based-Voice-Conversion-WebUI是一个基于VITS的简单易用的语音转换框架,可以实现任意说话人之间的语音转换,包括歌曲的翻唱和实时的变声。

标签:
其他站点:colab运行

综合介绍

Retrieval-based-Voice-Conversion-WebUI是一个基于VITS的简单易用的语音转换框架,可以实现任意说话人之间的语音转换,包括歌曲的翻唱和实时的变声。它具有低延迟、优秀的变声效果、少量数据训练等特点,支持N卡、A卡、I卡的加速,提供网页界面和实时变声界面,还可以调用UVR5模型来快速分离人声和伴奏,使用最先进的人声音高提取算法RMVPE来根绝哑音问题。

 

底模使用接近50小时的开源高质量VCTK训练集训练,无版权方面的顾虑,请大家放心使用

请期待RVCv3的底模,参数更大,数据更大,效果更好,基本持平的推理速度,需要训练数据量更少。

 

Retrieval-based-Voice-Conversion-WebUI

训练推理界面

 

Retrieval-based-Voice-Conversion-WebUI

实时变声界面

 

 

功能列表

 

  • 训练自己的语音转换模型,只需10分钟的语音数据即可
  • 使用预训练的语音转换模型,支持多种采样率和音色
  • 使用网页界面或实时变声界面进行语音转换,支持端到端的低延迟
  • 使用UVR5模型来分离人声和伴奏,支持多种格式的音频文件
  • 使用RMVPE算法来提取人声音高,支持pytorch/onnx/DirectML

 

 

使用帮助

 

  • 下载或克隆本仓库,安装所需的依赖和预模型
  • 运行go-web.bat或go-realtime-gui.bat,选择想要执行的操作
  • 根据界面提示,选择输入和输出的语音文件或设备,调整参数和选项
  • 点击开始或停止,享受语音转换的乐趣

相关导航