【源码】基于FastAPI和Gradio的ChatTTS文本转语音服务

项目简介

本项目是基于FastAPI和Gradio构建的文本转语音（TTS）服务，可支持中英文文本的语音合成，并具备流式返回功能。通过Docker Compose实现容器化部署，简化了本地部署流程，适合开发者快速上手。不过，该项目存在合成速度较慢和偶尔发音不稳定的问题。

项目的主要特性和功能

支持中英文文本的语音合成任务。
支持流式传输音频数据，适用于长文本或实时音频流场景。
利用Gradio构建简单用户界面，用户可通过界面输入文本生成语音。
通过Docker Compose实现一键容器化部署，简化本地运行流程。
支持多说话人，用户可选择不同说话人（通过ID标识）进行语音合成。
支持固定音色、语速、停顿等参数设置，提升语音合成灵活性。

安装使用步骤

假设用户已经下载了本项目的源码文件。

1. 进入项目目录

bash cd ChatTTS-Deploy-using-FastAPI-and-Gradio

2. 下载模型

进入backend/models/目录，下载ChatTTS模型： bash cd backend/models/ git lfs clone https://www.modelscope.cn/mirror013/ChatTTS.git

3. 本地部署

安装环境依赖

创建并激活Python虚拟环境，安装依赖： bash conda create -n tts python==3.9 conda activate tts pip install --upgrade pip cd backend pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple

运行后端服务

进入backend/fastapi目录，启动后端服务： bash cd backend/fastapi python api.py

4. Docker部署

使用Docker Compose进行容器化部署： bash docker compose build docker compose up 该命令将构建并启动FastAPI和Gradio服务，FastAPI服务将暴露在9880端口，Gradio服务将暴露在7860端口。

5. 使用Gradio前端

通过浏览器访问http://localhost:7860，使用Gradio界面输入文本并生成语音。

Menu

Share

【源码】基于FastAPI和Gradio的ChatTTS文本转语音服务

项目简介

项目的主要特性和功能

安装使用步骤

1. 进入项目目录

2. 下载模型

3. 本地部署

安装环境依赖

运行后端服务

4. Docker部署

5. 使用Gradio前端

注意事项

参考

下载地址

【源码】基于Python的猫眼电影票房数据分析系统

【源码】基于Arduino的易经随机卦象生成器

【源码】基于Java的超星学习通PDF下载工具

【源码】基于 Python 的智慧职教作业考试自动化系统

【源码】基于思源笔记的插件开发示例

【源码】基于Arduino的智能花盆控制系统

【源码】基于Arduino平台的ELRS到USB游戏手柄桥接项目

【源码】基于Python的西瓜视频百万英雄答题助手

【源码】基于ROS和MoveIt的双臂机器人控制系统

【源码】基于Arduino的植物健康监测和灌溉系统