项目简介
本项目是基于Java的论文查重系统,通过计算原文文件和抄袭版论文文件的相似度来输出重复率。系统运用SimHash算法进行文本相似度检测,支持文件输入输出,还能通过命令行参数指定文件路径。
项目的主要特性和功能
- 文本相似度检测:采用SimHash算法计算原文和抄袭版论文的相似度。
- 文件输入输出:可通过命令行参数指定原文文件、抄袭版论文文件和输出答案文件的路径。
- 性能优化:借助性能分析工具找出代码性能瓶颈并改进。
- 单元测试:提供至少10个测试用例,保证程序能正确处理各种情况,同时使用插件查看测试分支覆盖率等指标。
安装使用步骤
配置开发环境
- 安装Java 17。
- 安装Intellij IDEA 2021作为IDE。
- 安装JUnit 4.12进行单元测试。
- 安装JProfiler 9.2进行性能分析。
编译和运行
- 使用Intellij IDEA打开项目。
- 配置项目依赖,确保所有必要的库和插件已安装。
- 编译项目并运行主类
main.Demo
。
命令行参数
在命令行中运行程序时,需提供三个参数:
- 原文文件的绝对路径。
- 抄袭版论文文件的绝对路径。
- 输出答案文件的绝对路径。
示例:java -cp target/classes main.Demo /path/to/orig.txt /path/to/orig_add.txt /path/to/output.txt
查看结果
程序运行后,输出答案文件中将包含原文与抄袭版论文的重复率,精确到小数点后两位。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】