GitHub - BaiShuoQwQ/diffsinger_dataset_tools: Tools for making the Diffsinger dataset

tools_config：

singer:         当前数据的歌手名, 决定数据处理时的文件夹
#language:      当前数据的语言, 目前仅支持'zh'即中文
dictionary:     当前使用的字典文件
SOFA_ckpt:      当前使用的SOFA模型
FBL_ckpt:       当前使用的FBL模型
SOME_ckpt:      当前使用的SOME模型

文件夹：

work_audios:                复制要处理的音频于此
data/singer/original:       原始音频
data/singer/norm:           响度匹配音频
data/singer/wavs:           切片音频
data/singer/lab:            歌词lab标注
data/singer/textgrids:      TextGrid标注
data/singer/bad:            自动筛选较差的标注
data/singer/ds:             ds文件
data/singer/singer_dataset: 最终数据集

使用:

ckpt: 将rmvpe, SOFA, FBL, SOME模型及其可能的配置文件放入对应文件夹; 下方已列出推荐模型来源
    rmvpe: https://github.com/yxlllc/RMVPE/releases/tag/230917
    SOFA: https://github.com/qiuqiao/SOFA/discussions
    FBL: https://github.com/autumn-DL/FoxBreatheLabeler/releases/tag/0.2
    SOME: https://github.com/openvpi/SOME/releases/tag/v1.0.0-baseline
tools_config.yaml: 使用前按实际修改
quick_start.py: 自动将data/work_audios内的汉语普通话歌声wav文件制作成最终数据集

Name		Name	Last commit message	Last commit date
Latest commit History 16 Commits
LICENSES		LICENSES
ckpt		ckpt
data		data
dictionary		dictionary
modules		modules
work_audios		work_audios
.gitattributes		.gitattributes
.gitignore		.gitignore
README.md		README.md
build_dataset.py		build_dataset.py
check_tg.py		check_tg.py
ds_dataset.py		ds_dataset.py
htk2textgrid.py		htk2textgrid.py
quick_start.py		quick_start.py
requirements.txt		requirements.txt
slice_tg.py		slice_tg.py
summary_pitch.py		summary_pitch.py
tools_config.yaml		tools_config.yaml
validate_labels.py		validate_labels.py
validate_lengths.py		validate_lengths.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

About

Releases

Languages

BaiShuoQwQ/diffsinger_dataset_tools

Folders and files

Latest commit

History

Repository files navigation

About

Topics

Resources

Stars

Watchers

Forks

Releases

Languages