2023-07-26 (Wed)

VC Client

RVC など深層学習を用いて音声変換するプログラムを試してみた。

基本的に説明書の通りにやるだけなのだが、pyworld のビルドに失敗した。"Install Failed building wheel for pyworld: Object of type PosixPath is not JSON serializable" にあるように、pip install--no-build-isolation をつければいいらしいが、requirements.txt でインストールする時にどうやればいいのか分からなかったので、別個インストールした。

# Install Miniconda
bash ~/Desktop/Miniconda3-latest-Linux-x86_64.sh 
conda config --set auto_activate_base false

# Make a conda environment
conda create -n vcclient-dev python=3.10
conda activate vcclient-dev

# Install the program
git clone https://github.com/w-okada/voice-changer.git
cd voice-changer/server
pip install numpy==1.23.5
pip install pyworld --no-build-isolation
vim requirements.txt # comment out pyworld
pip install -r requirements.txt

sudo apt-get install libportaudio2 libasound-dev

# Launch
python3 MMVCServerSIO.py -p 18888 --https true --content_vec_500 pretrain/checkpoint_best_legacy_500.pt --content_vec_500_onnx pretrain/content_vec_500.onnx --content_vec_500_onnx_on true --hubert_base pretrain/hubert_base.pt --hubert_base_jp pretrain/rinna_hubert_base_jp.pt --hubert_soft pretrain/hubert/hubert-soft-0d54a1f4.pt --nsf_hifigan pretrain/nsf_hifigan/model --crepe_onnx_full pretrain/crepe_onnx_full.onnx --crepe_onnx_tiny pretrain/crepe_onnx_tiny.onnx --rmvpe pretrain/rmvpe.pt --model_dir model_dir --samples samples.json

読んだ