项目简介
本项目是一个试题知识点推荐系统,用户输入一段试题文本,系统会输出与之相关的知识点。系统通过解析word文档中的知识点,借助Neo4j数据库构建知识图谱,再利用设计的算法从知识图谱中找出与输入试题相关的知识点。此外,系统还具备知识图谱的管理功能。
项目的主要特性和功能
- 知识点推荐:依据输入的试题文本,从知识图谱中精准推荐相关知识点。
- 知识图谱管理:提供知识图谱的管理功能,方便对知识点和关系进行维护。
- 多技术融合:运用PaddleNLP和正则表达式联合抽取关键词,利用OCR技术提取图片文字。
安装使用步骤
环境准备
推荐使用GPU进行训练,预测阶段CPU或GPU均可。使用以下命令安装环境依赖:
pip install -r requirements.txt
环境依赖如下:
- neo4j~=5.8.1
- pandas~=2.0.0
- numpy~=1.23.2
- paddlepaddle-gpu==2.4.2.post117
- paddleocr==2.6.1.3
- paddlenlp==2.5.2
- Flask~=2.2.3
- jupyter
- mammoth==1.5.1
- beautifulsoup4~=4.12.2
数据准备
- 下载文档文件(Google Driver需要访问外网),并解压到
./csv
目录下。 - 在项目目录下运行以下命令生成构建知识图谱的数据表(csv文件):
python generate_kg_table
- 在Aura创建一个免费的Neo4j实例,然后在”import“页面中导入模型,具体做法是点击红框中的按钮,导入
./csv
目录下的neo4j_importer_model.json
文件。 - 在左侧的“Files”一栏中点击“Browse”按钮导入
./csv
目录下的csv数据表文件,最后Run Import自动导入数据。
系统功能测试
- 在本地启动服务器:
python -m flask --app flask_server run
- 在
test_client.ipynb
中测试系统功能。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】