【源码】基于深度学习的语音转换项目

项目简介

本项目是一个基于深度学习的语音转换系统，借助生成式对抗网络（GAN）和自编码器结构，通过训练模型学习原始语音和目标语音之间的映射关系，实现不同语音之间的转换。项目涵盖音频处理、深度学习模型构建、模型训练、音频生成等多个步骤。

假设用户已经下载了本项目的源码文件。

复制项目仓库： bash cd voice-conversion
安装依赖库： bash pip install -r requirements.txt
准备数据：
使用make_dataset_vctk.py从VCTK语料库中创建数据集： bash python3 make_dataset_vctk.py data_root_dir h5py_path train_proportion
使用make_single_samples.py从数据集中采样音频片段： bash python3 make_single_samples.py the_h5py_path index_path n_samples seg_len speaker_used_path
训练模型：
运行main.py进行模型训练： bash python3 main.py --load_model --flag train --hps_path mixture_10_.json --dataset_path your_dataset_path.h5 --output_model_path your_model_output_path
测试模型：
使用VC_test.py加载预训练模型并测试语音转换效果： bash python3 VC_test.py --model_path your_pretrained_model_path --input_audio_path your_input_audio_path --output_audio_path your_output_audio_path

点击下载 【提取码: 4003】【解压密码: www.makuang.net】