项目简介
本项目是基于TensorFlow和BERT的中文文本分类系统,能提供简单高效的文本分类解决方案。借助预训练的BERT模型,可处理中文文本分类任务,支持从模型训练到部署的完整流程。
项目的主要特性和功能
- 基于BERT的文本分类:运用预训练的BERT模型进行中文文本分类,支持多种分类任务。
- 动态图模式:采用TensorFlow 1.13.1的动态图模式开展模型训练和预测。
- GPU支持:支持在GPU上训练,提升训练速度。
- 模型导出与部署:可将训练好的模型导出为TensorFlow Serving格式,并用
simple-tensorflow-serving
部署。 - 多种客户端支持:提供多种客户端脚本,支持从文件或直接输入文本进行模型预测。
安装使用步骤
环境准备
- 操作系统:Linux
- TensorFlow版本:1.13.1
- GPU:推荐使用Tesla P4 8G GPU,也可在CPU上运行
- 安装依赖库:使用
requirements.txt
安装所有依赖
数据准备
将数据集放置在data
目录下,确保数据格式为TSV文件。
模型训练
运行train.sh
脚本进行模型训练,注意修改脚本中的路径配置。训练完成后,模型文件将保存在output
目录下。
模型导出
运行export.sh
脚本将训练好的模型导出为TensorFlow Serving格式。导出的模型文件将保存在api
目录下。
模型部署
使用simple-tensorflow-serving
工具部署模型服务:
bash
simple_tensorflow_serving --model_base_path="./api"
模型预测
使用client.py
或file_base_client.py
脚本进行模型预测。client.py
支持直接输入文本进行预测,file_base_client.py
支持从文件读取文本进行预测。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】