littlebot
Published on 2025-04-08 / 1 Visits
0

【源码】基于Python的机器翻译不一致性自动修复工具

项目简介

本项目名为TransRepair,是一个用于自动修复翻译模型不一致性的工具。其实现源自ICSE 2020的论文《Automatic Testing and Improvement of Machine Translation》,可对翻译模型进行检测与修复,有效提高翻译的一致性。

项目的主要特性和功能

  1. 自动修复翻译模型的不一致性。
  2. 支持选择不同的翻译模型进行测试,默认使用百度翻译API。
  3. 构建上下文相似语料库,可通过GloVe和Spacy进行扩充。
  4. 利用StanfordParser进行结构性过滤,筛选符合要求的变异句。
  5. 对翻译结果进行一致性分析,还可自行训练词对齐模型。

安装使用步骤

假设用户已经下载了本项目的源码文件: 1. 选择要测试的翻译模型:在TranslationAPI/translationAPI.pytranslationBlackBox(query)方法中更改翻译模型;若使用百度翻译,需填入自己的appid和appkey。 2. 下载StandfordParser,参考教程https://www.cnblogs.com/gaofighting/p/9768023.html ,下载后在StructureFilter/StanfordParser.py中更改路径,将nlp = StanfordCoreNLP('你的路径')修改为实际路径。 3. 运行: - 一次输入一句进行翻译不一致性检测与修复,运行main.py即可。 - 按文件进行检测与修复,可按相应逻辑处理文件输入。

下载地址

点击下载 【提取码: 4003】【解压密码: www.makuang.net】