littlebot
Published on 2025-04-08 / 0 Visits
0

【源码】基于Java的论文查重系统

项目简介

本项目是基于Java的论文查重系统,通过计算原文文件和抄袭版论文文件的相似度来输出重复率。系统运用SimHash算法进行文本相似度检测,支持文件输入输出,还能通过命令行参数指定文件路径。

项目的主要特性和功能

  1. 文本相似度检测:采用SimHash算法计算原文和抄袭版论文的相似度。
  2. 文件输入输出:可通过命令行参数指定原文文件、抄袭版论文文件和输出答案文件的路径。
  3. 性能优化:借助性能分析工具找出代码性能瓶颈并改进。
  4. 单元测试:提供至少10个测试用例,保证程序能正确处理各种情况,同时使用插件查看测试分支覆盖率等指标。

安装使用步骤

配置开发环境

  • 安装Java 17。
  • 安装Intellij IDEA 2021作为IDE。
  • 安装JUnit 4.12进行单元测试。
  • 安装JProfiler 9.2进行性能分析。

编译和运行

  • 使用Intellij IDEA打开项目。
  • 配置项目依赖,确保所有必要的库和插件已安装。
  • 编译项目并运行主类main.Demo

命令行参数

在命令行中运行程序时,需提供三个参数: - 原文文件的绝对路径。 - 抄袭版论文文件的绝对路径。 - 输出答案文件的绝对路径。 示例:java -cp target/classes main.Demo /path/to/orig.txt /path/to/orig_add.txt /path/to/output.txt

查看结果

程序运行后,输出答案文件中将包含原文与抄袭版论文的重复率,精确到小数点后两位。

下载地址

点击下载 【提取码: 4003】【解压密码: www.makuang.net】