littlebot
Published on 2025-04-16 / 0 Visits
0

【源码】基于Python的电信投诉文本语义分析工具

项目简介

本项目是基于Python开发的电信投诉文本语义分析工具,主要对海量非结构化电信投诉文本数据进行挖掘以提取商业价值。版本1.1具备结构化信息提取、产品分类、地址提取三大功能,已应用于广东电信工信部申诉压降及智能预警优化项目,使移动网络质量文本数据的地址信息提取率提升了33%。

项目的主要特性和功能

  1. 结构化信息处理:把电信投诉内容中的非结构化信息转化为结构化数据,方便存储到数据库或表格文件。
  2. 匹配产品信息:依据《产品列表》,从投诉受理内容正文中精准提取客户投诉的产品,便于后续统计分析。
  3. 地址信息提取:从投诉内容里提取地址信息,按省、市、区、街道的格式存储为表格文件,用于定位投诉多发网点。

安装使用步骤

运行环境

推荐在Windows系统下的Anaconda(Python 3.6版本)中运行,后续会转化为exe可执行文件,以保证在非Python环境下也能正常运行。

使用步骤

  1. 打开文件选择窗口,选择待处理的文本数据文件,确保文件中待处理文本数据的列名固定为“受理内容”(后续版本会支持在预览区域选择列名)。
  2. 选择文件后,程序会更新界面并读取数据。
  3. 点击相应功能按钮进行结构化信息处理、产品信息匹配和地址信息提取操作。地址信息提取速度较慢,请耐心等待。
  4. 处理完成后,可点击保存数据按钮,将处理结果导出到Excel文件。

注意事项

  • 产品列表需要包含产品的近似名称,并且要及时更新。
  • 确保输入的映射关系正确(若涉及自定义映射功能)。
  • 本工具仅适用于处理中文的电信投诉文本数据。

下载地址

点击下载 【提取码: 4003】【解压密码: www.makuang.net】