项目简介
本项目是一个基于TensorFlow和PyTorch的中文聊天机器人系统,支持Seq2Seq和SeqGAN模型。用户可使用自定义语料进行训练,生成符合特定场景的对话模型。系统提供TensorFlow 1.x、TensorFlow 2.x和PyTorch版本,适配不同开发环境与需求。
项目的主要特性和功能
- 多框架支持:涵盖TensorFlow 1.x、TensorFlow 2.x和PyTorch框架,用户可按需选择。
- Seq2Seq模型:基于该模型的对话生成,支持中文对话,具备良好语境理解与生成能力。
- SeqGAN模型:提供增强版模型,进一步提升对话生成效果。
- 自定义语料训练:用户能用自己的语料训练模型,提高对话质量。
- 简单易用的接口:系统提供操作简便的接口,方便用户与机器人交互。
- 预训练模型支持:提供预训练模型,用户可直接使用或微调。
安装使用步骤
环境准备
- 操作系统:建议使用Ubuntu 14.04或更高版本。
- Python版本:Python 3.5或更高版本。
- 依赖库:
- TensorFlow 1.x版本:
tensorflow==1.10.1
或tensorflow-gpu==1.10.1
,flask==0.11.1
- TensorFlow 2.x版本:
tensorflow==2.0.0
,flask==0.11.1
- PyTorch版本:
torch==2.0.0
,flask==0.11.1
- TensorFlow 1.x版本:
代码执行步骤
Seq2Seq版本
- 下载代码和语料:下载项目代码和语料文件(如小黄鸡语料)。
- 放置语料文件:将语料文件放入
data
目录下。 - 执行代码:
- 运行
data_util.py
进行数据预处理。 - 运行
execute.py
进行模型训练。 - 运行
app.py
启动可视化对话模块。
- 运行
- 配置超参数:在
seq2seq.ini
和seq2seq_sever.ini
文件中配置超参数。
SeqGAN版本
- 下载代码和语料:下载项目代码和语料文件。
- 放置语料文件:将语料文件放入
source_data
目录下。 - 执行代码:
- 运行
source_data_util.py
进行数据预处理。 - 运行
execute.py
进行模型训练。 - 运行
app.py
启动可视化对话模块。
- 运行
预训练模型使用
- 下载预训练模型:从提供的链接下载预训练模型。
- 更新字典:运行
data_util.py
更新字典。 - 使用模型:加载预训练模型进行对话生成。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】