Retrieval-based-Voice-Conversion-WebUI

AI语音AI开放服务/开源项目 AI语音克隆

Retrieval-based-Voice-Conversion-WebUI

Retrieval-based-Voice-Conversion-WebUI是一个基于VITS的简单易用的语音转换框架，可以实现任意说话人之间的语音转换，包括歌曲的翻唱和实时的变声。

标签：AI开放服务/开源项目 AI语音克隆VITS 人声克隆人声合成变声语音转换

链接直达">手机查看

其他站点:colab运行

综合介绍

Retrieval-based-Voice-Conversion-WebUI是一个基于VITS的简单易用的语音转换框架，可以实现任意说话人之间的语音转换，包括歌曲的翻唱和实时的变声。它具有低延迟、优秀的变声效果、少量数据训练等特点，支持N卡、A卡、I卡的加速，提供网页界面和实时变声界面，还可以调用UVR5模型来快速分离人声和伴奏，使用最先进的人声音高提取算法RMVPE来根绝哑音问题。

底模使用接近50小时的开源高质量VCTK训练集训练，无版权方面的顾虑，请大家放心使用
请期待RVCv3的底模，参数更大，数据更大，效果更好，基本持平的推理速度，需要训练数据量更少。

Retrieval-based-Voice-Conversion-WebUI

训练推理界面

Retrieval-based-Voice-Conversion-WebUI

实时变声界面

功能列表

训练自己的语音转换模型，只需10分钟的语音数据即可
使用预训练的语音转换模型，支持多种采样率和音色
使用网页界面或实时变声界面进行语音转换，支持端到端的低延迟
使用UVR5模型来分离人声和伴奏，支持多种格式的音频文件
使用RMVPE算法来提取人声音高，支持pytorch/onnx/DirectML

使用帮助

下载或克隆本仓库，安装所需的依赖和预模型
运行go-web.bat或go-realtime-gui.bat，选择想要执行的操作
根据界面提示，选择输入和输出的语音文件或设备，调整参数和选项
点击开始或停止，享受语音转换的乐趣

相关导航

创新AI技术，提供1000+声音选项与142+种语言的文本转语音服务。

用Quivr建立你的第二大脑，通过AI增强你的生产力，实现快捷高效的信息检索和管理。

QAnything是支持多种格式文件的本地化、跨语言知识库问答系统，确保数据安全并提供高性能问答体验。

智能语音分析服务，支持语音转文本，多语言实时转录。英文语音支持意图和情绪检测。

MindGraph

开源图形知识项目，助力自然语言数据的图形化管理和智能处理。抽取知识为可视化知识图谱。

morphic

morphic是一个结合了多种AI技术的现代化搜索引擎，优秀的搜索结果展示界面。