项目简介
本项目是基于Pytorch构建的多特征分类框架,支持多特征序列标注和普通分类任务。封装性佳,用户可直接参考demo,利用csv文件开展训练和预测工作。
项目的主要特性和功能
- 拥有多特征分类能力,可处理字符型(最好为单个词)与数值型特征。
- 能够输出详细的分类详情。
- 提供普通分类(全连接神经网络NormClassifier)和序列标注(Bi - LSTM - CRF SeqClassifier)两种模型。
- 支持数据预处理,为非数值类数据构建词表并借助Embedding获取低维稠密向量,对数值类数据进行标准化处理。
- 运用sklearn获取f1分数。
安装使用步骤
安装
在命令行执行以下命令安装项目所需库:
shell script
pip install -U nymph
使用
假设已下载项目源码文件,以下是使用说明:
普通分类
- 训练模型:参考
./examples/train_demo_by_norm.py
文件中的代码。示例代码中训练数据路径为./data/test.csv
,模型保存路径为demo_saves
。 - 预测模型:参考
./examples/predict_demo_by_norm.py
文件中的代码。同样使用./data/test.csv
作为数据,从demo_saves
加载已训练的模型。
序列标注
- 训练模型:参考
./examples/train_demo_by_seq.py
文件中的代码。训练数据路径为./data/test.csv
,模型保存路径为demo_saves_seq
。 - 预测模型:参考
./examples/predict_demo_by_seq.py
文件中的代码。使用./data/test.csv
作为数据,从demo_saves_seq
加载已训练的模型。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】