项目简介
本项目名为TransRepair,是一个用于自动修复翻译模型不一致性的工具。其实现源自ICSE 2020的论文《Automatic Testing and Improvement of Machine Translation》,可对翻译模型进行检测与修复,有效提高翻译的一致性。
项目的主要特性和功能
- 自动修复翻译模型的不一致性。
- 支持选择不同的翻译模型进行测试,默认使用百度翻译API。
- 构建上下文相似语料库,可通过GloVe和Spacy进行扩充。
- 利用StanfordParser进行结构性过滤,筛选符合要求的变异句。
- 对翻译结果进行一致性分析,还可自行训练词对齐模型。
安装使用步骤
假设用户已经下载了本项目的源码文件:
1. 选择要测试的翻译模型:在TranslationAPI/translationAPI.py
的translationBlackBox(query)
方法中更改翻译模型;若使用百度翻译,需填入自己的appid和appkey。
2. 下载StandfordParser,参考教程https://www.cnblogs.com/gaofighting/p/9768023.html ,下载后在StructureFilter/StanfordParser.py
中更改路径,将nlp = StanfordCoreNLP('你的路径')
修改为实际路径。
3. 运行:
- 一次输入一句进行翻译不一致性检测与修复,运行main.py
即可。
- 按文件进行检测与修复,可按相应逻辑处理文件输入。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】