Skip to content

Commit 725db87

Browse files
authored
Update README.md
1 parent dfb298d commit 725db87

File tree

1 file changed

+108
-106
lines changed

1 file changed

+108
-106
lines changed

README.md

+108-106
Original file line numberDiff line numberDiff line change
@@ -1,106 +1,108 @@
1-
<div align="center">
2-
3-
<h1>Retrieval-based-Voice-Conversion-WebUI</h1>
4-
一个基于VITS的简单易用的语音转换(变声器)框架<br><br>
5-
6-
[![madewithlove](https://forthebadge.com/images/badges/built-with-love.svg)](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI)
7-
8-
<img src="https://counter.seku.su/cmoe?name=rvc&theme=r34" /><br>
9-
10-
[![Open In Colab](https://img.shields.io/badge/Colab-F9AB00?style=for-the-badge&logo=googlecolab&color=525252)](https://colab.research.google.com/github/liujing04/Retrieval-based-Voice-Conversion-WebUI/blob/main/Retrieval_based_Voice_Conversion_WebUI.ipynb)
11-
[![Licence](https://img.shields.io/github/license/liujing04/Retrieval-based-Voice-Conversion-WebUI?style=for-the-badge)](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI/blob/main/%E4%BD%BF%E7%94%A8%E9%9C%80%E9%81%B5%E5%AE%88%E7%9A%84%E5%8D%8F%E8%AE%AE-LICENSE.txt)
12-
[![Huggingface](https://img.shields.io/badge/🤗%20-Spaces-yellow.svg?style=for-the-badge)](https://huggingface.co/lj1995/VoiceConversionWebUI/tree/main/)
13-
14-
[![Discord](https://img.shields.io/badge/RVC%20Developers-Discord-7289DA?style=for-the-badge&logo=discord&logoColor=white)](https://discord.gg/HcsmBBGyVk)
15-
16-
</div>
17-
18-
------
19-
20-
[**更新日志**](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI/blob/main/Changelog_CN.md)
21-
22-
[**English**](./docs/README.en.md) | [**中文简体**](./README.md) | [**日本語**](./docs/README.ja.md) | [**한국어**](./docs/README.ko.md)
23-
24-
25-
> 点此查看我们的[演示视频](https://www.bilibili.com/video/BV1pm4y1z7Gm/) !
26-
27-
> 使用了RVC的实时语音转换: [w-okada/voice-changer](https://github.com/w-okada/voice-changer)
28-
29-
> 底模使用接近50小时的开源高质量VCTK训练集训练,无版权方面的顾虑,请大家放心使用
30-
31-
> 后续会陆续加入高质量有授权歌声训练集训练底模
32-
33-
## 简介
34-
本仓库具有以下特点
35-
+ 使用top1检索替换输入源特征为训练集特征来杜绝音色泄漏
36-
+ 即便在相对较差的显卡上也能快速训练
37-
+ 使用少量数据进行训练也能得到较好结果(推荐至少收集10分钟低底噪语音数据)
38-
+ 可以通过模型融合来改变音色(借助ckpt处理选项卡中的ckpt-merge)
39-
+ 简单易用的网页界面
40-
+ 可调用UVR5模型来快速分离人声和伴奏
41-
42-
## 环境配置
43-
推荐使用poetry配置环境。
44-
45-
以下指令需在Python版本大于3.8的环境中执行:
46-
```bash
47-
# 安装Pytorch及其核心依赖,若已安装则跳过
48-
# 参考自: https://pytorch.org/get-started/locally/
49-
pip install torch torchvision torchaudio
50-
51-
#如果是win系统+Nvidia Ampere架构(RTX30xx),根据 #21 的经验,需要指定pytorch对应的cuda版本
52-
#pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
53-
54-
# 安装 Poetry 依赖管理工具, 若已安装则跳过
55-
# 参考自: https://python-poetry.org/docs/#installation
56-
curl -sSL https://install.python-poetry.org | python3 -
57-
58-
# 通过poetry安装依赖
59-
poetry install
60-
```
61-
62-
你也可以通过pip来安装依赖:
63-
64-
**注意**: `MacOS``faiss 1.7.2`版本会导致抛出段错误,在手动安装时请使用命令`pip install faiss-cpu==1.7.0`指定使用`1.7.0`版本
65-
66-
```bash
67-
pip install -r requirements.txt
68-
```
69-
70-
## 其他预模型准备
71-
RVC需要其他一些预模型来推理和训练。
72-
73-
你可以从我们的[Hugging Face space](https://huggingface.co/lj1995/VoiceConversionWebUI/tree/main/)下载到这些模型。
74-
75-
以下是一份清单,包括了所有RVC所需的预模型和其他文件的名称:
76-
```bash
77-
hubert_base.pt
78-
79-
./pretrained
80-
81-
./uvr5_weights
82-
83-
#如果你正在使用Windows,则你可能需要这个文件,若ffmpeg已安装则跳过
84-
./ffmpeg
85-
```
86-
之后使用以下指令来启动WebUI:
87-
```bash
88-
python infer-web.py
89-
```
90-
如果你正在使用Windows,你可以直接下载并解压`RVC-beta.7z`,运行`go-web.bat`以启动WebUI。
91-
92-
仓库内还有一份`小白简易教程.doc`以供参考。
93-
94-
## 参考项目
95-
+ [ContentVec](https://github.com/auspicious3000/contentvec/)
96-
+ [VITS](https://github.com/jaywalnut310/vits)
97-
+ [HIFIGAN](https://github.com/jik876/hifi-gan)
98-
+ [Gradio](https://github.com/gradio-app/gradio)
99-
+ [FFmpeg](https://github.com/FFmpeg/FFmpeg)
100-
+ [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
101-
+ [audio-slicer](https://github.com/openvpi/audio-slicer)
102-
103-
## 感谢所有贡献者作出的努力
104-
<a href="https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI/graphs/contributors" target="_blank">
105-
<img src="https://contrib.rocks/image?repo=liujing04/Retrieval-based-Voice-Conversion-WebUI" />
106-
</a>
1+
<div align="center">
2+
3+
<h1>Retrieval-based-Voice-Conversion-WebUI</h1>
4+
一个基于VITS的简单易用的语音转换(变声器)框架<br><br>
5+
6+
[![madewithlove](https://forthebadge.com/images/badges/built-with-love.svg)](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI)
7+
8+
<img src="https://counter.seku.su/cmoe?name=rvc&theme=r34" /><br>
9+
10+
[![Open In Colab](https://img.shields.io/badge/Colab-F9AB00?style=for-the-badge&logo=googlecolab&color=525252)](https://colab.research.google.com/github/liujing04/Retrieval-based-Voice-Conversion-WebUI/blob/main/Retrieval_based_Voice_Conversion_WebUI.ipynb)
11+
[![Licence](https://img.shields.io/github/license/liujing04/Retrieval-based-Voice-Conversion-WebUI?style=for-the-badge)](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI/blob/main/%E4%BD%BF%E7%94%A8%E9%9C%80%E9%81%B5%E5%AE%88%E7%9A%84%E5%8D%8F%E8%AE%AE-LICENSE.txt)
12+
[![Huggingface](https://img.shields.io/badge/🤗%20-Spaces-yellow.svg?style=for-the-badge)](https://huggingface.co/lj1995/VoiceConversionWebUI/tree/main/)
13+
14+
[![Discord](https://img.shields.io/badge/RVC%20Developers-Discord-7289DA?style=for-the-badge&logo=discord&logoColor=white)](https://discord.gg/HcsmBBGyVk)
15+
16+
</div>
17+
18+
------
19+
20+
[**更新日志**](https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI/blob/main/Changelog_CN.md)
21+
22+
[**English**](./docs/README.en.md) | [**中文简体**](./README.md) | [**日本語**](./docs/README.ja.md) | [**한국어**](./docs/README.ko.md)
23+
24+
25+
> 点此查看我们的[演示视频](https://www.bilibili.com/video/BV1pm4y1z7Gm/) !
26+
27+
> 使用了RVC的实时语音转换: [w-okada/voice-changer](https://github.com/w-okada/voice-changer)
28+
29+
> 底模使用接近50小时的开源高质量VCTK训练集训练,无版权方面的顾虑,请大家放心使用
30+
31+
> 后续会陆续加入高质量有授权歌声训练集训练底模
32+
33+
## 简介
34+
本仓库具有以下特点
35+
+ 使用top1检索替换输入源特征为训练集特征来杜绝音色泄漏
36+
+ 即便在相对较差的显卡上也能快速训练
37+
+ 使用少量数据进行训练也能得到较好结果(推荐至少收集10分钟低底噪语音数据)
38+
+ 可以通过模型融合来改变音色(借助ckpt处理选项卡中的ckpt-merge)
39+
+ 简单易用的网页界面
40+
+ 可调用UVR5模型来快速分离人声和伴奏
41+
42+
## 环境配置
43+
推荐使用poetry配置环境。
44+
45+
以下指令需在Python版本大于3.8的环境中执行:
46+
```bash
47+
# 安装Pytorch及其核心依赖,若已安装则跳过
48+
# 参考自: https://pytorch.org/get-started/locally/
49+
pip install torch torchvision torchaudio
50+
51+
#如果是win系统+Nvidia Ampere架构(RTX30xx),根据 #21 的经验,需要指定pytorch对应的cuda版本
52+
#pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu117
53+
54+
# 安装 Poetry 依赖管理工具, 若已安装则跳过
55+
# 参考自: https://python-poetry.org/docs/#installation
56+
curl -sSL https://install.python-poetry.org | python3 -
57+
58+
# 通过poetry安装依赖
59+
poetry install
60+
```
61+
62+
你也可以通过pip来安装依赖:
63+
64+
**注意**: `MacOS``faiss 1.7.2`版本会导致抛出段错误,在手动安装时请使用命令`pip install faiss-cpu==1.7.0`指定使用`1.7.0`版本
65+
66+
```bash
67+
pip install -r requirements.txt
68+
```
69+
70+
## 其他预模型准备
71+
RVC需要其他一些预模型来推理和训练。
72+
73+
你可以从我们的[Hugging Face space](https://huggingface.co/lj1995/VoiceConversionWebUI/tree/main/)下载到这些模型。
74+
75+
以下是一份清单,包括了所有RVC所需的预模型和其他文件的名称:
76+
```bash
77+
hubert_base.pt
78+
79+
./pretrained
80+
81+
./uvr5_weights
82+
83+
#如果你正在使用Windows,则你可能需要这个文件,若ffmpeg和ffprobe已安装则跳过; ubuntu/debian 用户可以通过apt install ffmpeg来安装这2个库
84+
./ffmpeg
85+
86+
./ffprobe
87+
```
88+
之后使用以下指令来启动WebUI:
89+
```bash
90+
python infer-web.py
91+
```
92+
如果你正在使用Windows,你可以直接下载并解压`RVC-beta.7z`,运行`go-web.bat`以启动WebUI。
93+
94+
仓库内还有一份`小白简易教程.doc`以供参考。
95+
96+
## 参考项目
97+
+ [ContentVec](https://github.com/auspicious3000/contentvec/)
98+
+ [VITS](https://github.com/jaywalnut310/vits)
99+
+ [HIFIGAN](https://github.com/jik876/hifi-gan)
100+
+ [Gradio](https://github.com/gradio-app/gradio)
101+
+ [FFmpeg](https://github.com/FFmpeg/FFmpeg)
102+
+ [Ultimate Vocal Remover](https://github.com/Anjok07/ultimatevocalremovergui)
103+
+ [audio-slicer](https://github.com/openvpi/audio-slicer)
104+
105+
## 感谢所有贡献者作出的努力
106+
<a href="https://github.com/liujing04/Retrieval-based-Voice-Conversion-WebUI/graphs/contributors" target="_blank">
107+
<img src="https://contrib.rocks/image?repo=liujing04/Retrieval-based-Voice-Conversion-WebUI" />
108+
</a>

0 commit comments

Comments
 (0)