项目简介
本项目是基于CPM(Chinese Pretrained Models)模型的中文文本生成项目,聚焦于作文生成任务。项目涵盖数据预处理、模型训练、文本生成、Http服务等代码模块,目的是简化模型的训练与使用流程。
项目的主要特性和功能
- 数据预处理:可从txt文件读取作文,进行分词、编码与切割,生成训练数据。
- 模型训练:采用GPT2模型训练,支持多GPU并行计算,能自定义训练参数。
- 文本生成:依据训练好的模型,可生成作文、小说、新闻等中文文本。
- 用户界面:借助Streamlit框架,提供基于Web的交互式界面,用户能通过界面输入参数生成作文。
安装使用步骤
安装依赖
- 安装Python 3.6或以上版本。
- 安装
pip
包管理器。 - 使用
pip
安装所需库,如transformers
、sentencepiece
、torch
等。
运行程序
- 使用命令行运行
zuowen
命令,按提示输入参数进行作文生成。 - 使用
zuowen-ui
命令,启动基于Web的作文生成器界面。 - 使用
zuowen-preprocess
命令,进行作文数据的预处理。 - 使用
zuowen-trainer
命令,训练作文生成模型。
模型训练与使用
- 通过
zuowen-trainer
命令,可自定义训练参数训练作文生成模型。 - 训练完成后,使用
zuowen
命令或Web界面,输入标题和上下文,生成作文。
注意:项目代码和数据可能需根据实际情况调整和配置,以确保正常运行。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】