项目简介
本项目借助Python和Web框架构建了一个ChatTTS语音生成系统,为用户提供了简易部署的ChatTTS环境与直观易用的Web界面。用户能通过该界面操作,利用ChatTTS模型实现文本到语音的转换,适合有快速语音生成需求的用户和开发者。
项目的主要特性和功能
- 离线一键部署:无需复杂环境配置与网络,可快速启动系统。
- 长文本语音生成:支持长文本分段生成音频,并进行音量归一化处理,保证音色一致性。
- 口语化处理:具备自动口语化处理功能,同时支持手动精调文本,以生成更满意的语音。
- 本地音色上传:允许用户上传本地 *.pt 格式的音色文件,自定义语音生成效果。
安装使用步骤
安装方式一:一键部署(推荐)
步骤一:下载代码运行库和ChatTTS模型库
下载代码运行库(codes_and_runtime_cpu
或 codes_and_runtime_gpu
)和ChatTTS模型库(asset
),并解压至同一目录。
步骤二:运行程序
运行 run.bat
文件,若浏览器未自动打开,复制cmd中显示的网址到浏览器地址栏。Linux系统可参照 run.bat
中的命令运行。
安装方式二:自行配置Python环境
步骤一:创建并激活conda新环境
bash
conda create --name chattts-simpleui
conda activate chattts-simpleui
步骤二:安装Python依赖
bash
pip install -r requirements.txt
步骤三:安装GPU版PyTorch(如果需要)
bash
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cuXX(填写你的CUDA版本)
步骤四:下载模型库并运行程序
下载模型库,在终端运行 webui.py
文件:
bash
streamlit run webui.py
下载地址
点击下载 【提取码: 4003】