littlebot
Published on 2025-04-18 / 1 Visits
0

【源码】基于Pytorch的多特征分类系统

项目简介

本项目是基于Pytorch构建的多特征分类框架,支持多特征序列标注和普通分类任务。封装性佳,用户可直接参考demo,利用csv文件开展训练和预测工作。

项目的主要特性和功能

  • 拥有多特征分类能力,可处理字符型(最好为单个词)与数值型特征。
  • 能够输出详细的分类详情。
  • 提供普通分类(全连接神经网络NormClassifier)和序列标注(Bi - LSTM - CRF SeqClassifier)两种模型。
  • 支持数据预处理,为非数值类数据构建词表并借助Embedding获取低维稠密向量,对数值类数据进行标准化处理。
  • 运用sklearn获取f1分数。

安装使用步骤

安装

在命令行执行以下命令安装项目所需库: shell script pip install -U nymph

使用

假设已下载项目源码文件,以下是使用说明:

普通分类

  • 训练模型:参考./examples/train_demo_by_norm.py文件中的代码。示例代码中训练数据路径为./data/test.csv,模型保存路径为demo_saves
  • 预测模型:参考./examples/predict_demo_by_norm.py文件中的代码。同样使用./data/test.csv作为数据,从demo_saves加载已训练的模型。

序列标注

  • 训练模型:参考./examples/train_demo_by_seq.py文件中的代码。训练数据路径为./data/test.csv,模型保存路径为demo_saves_seq
  • 预测模型:参考./examples/predict_demo_by_seq.py文件中的代码。使用./data/test.csv作为数据,从demo_saves_seq加载已训练的模型。

下载地址

点击下载 【提取码: 4003】【解压密码: www.makuang.net】