项目简介
本项目利用深度学习技术,借助PyTorch框架,结合卷积神经网络(CNN)和Transformer或LSTM模型,实现将分子骨架式图像高效转换为InChI表达式,达成高精度的分子结构识别与转换。
项目的主要特性和功能
- 图像到InChI转换:利用深度学习模型把分子图像转换为InChI表达式。
- 多种模型支持:支持Transformer和LSTM两种模型架构,用户可按需选择。
- 数据预处理:具备数据下载、解压和预处理功能,保证数据集格式正确、质量良好。
- 模型训练与评估:支持模型的训练、评估和优化,提供详细配置参数和训练流程。
- 图形用户界面:提供简单的GUI界面,便于用户上传图像并进行InChI转换操作。
安装使用步骤
1. 环境准备
- 使用Anaconda:通过项目根目录下的
environment.yml
文件创建Anaconda环境。bash conda env create -f environment.yml
- 手动安装依赖:根据项目提供的依赖列表手动安装所需Python包。
2. 数据准备
- 数据下载:从Kaggle下载数据集并解压到指定目录。
bash https://www.kaggle.com/c/bms-molecular-translation
- 数据预处理:运行预处理脚本生成训练和验证数据集。
bash python prepare.py --root <project_root> --pre_config <prepare_config>
3. 模型训练
- 配置模型参数:根据需求选择合适的模型配置文件(如
transformer_config.yaml
)。 - 开始训练:运行训练脚本启动模型训练。
bash python train.py --model_name transformer --instance my_train --data ./config/data.yaml
4. 模型评估
- 评估模型性能:使用评估脚本计算模型在验证集上的性能。
bash python evaluate.py --model_path <model_path> --data_path <data_path>
5. 使用GUI
- 启动GUI:运行
ui.py
脚本启动图形用户界面。bash python ui.py
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】