项目简介
本项目借助机器学习算法对中文外卖评论进行情感分析。基于给定数据集,运用多种机器学习模型对评论内容进行情感预测,同时对比不同模型的表现。
项目的主要特性和功能
数据集
包含中文外卖评论以及对应的情感标签(正面或负面)。
数据预处理
利用jieba库对评论进行中文分词,清理噪音和无用信息。
机器学习模型训练
涵盖多种经典机器学习算法的训练过程,如Naive Bayes、SVM、Decision Tree、KNN、Logistic Regression和Random Forest,用于情感分类任务。
模型评估和结果可视化
计算各模型在测试集上的准确率,使用柱状图对比不同模型的预测准确率,同时对比使用jieba分词和不使用jieba分词的模型表现。
安装使用步骤
安装依赖库
需安装以下Python库: - numpy - pandas - scikit-learn - matplotlib - jieba
下载数据集
访问指定的数据下载链接(http://idatascience.cn/dataset-detail?table_id=429),下载所需数据集。
运行代码
- 下载项目代码到本地。
- 在终端中进入项目根目录。
- 运行
python predic_main.py
命令,开始情感分析系统的训练和评估过程。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】