项目简介
本项目是基于视觉模型的实体链接项目,借助深度学习模型达成图像实体与文本实体的链接。项目基于PyTorch框架开发,结合CLIP模型与自定义实体链接模型,实现了高效的实体识别和链接功能。
项目的主要特性和功能
- 跨模态实体链接:可处理图像和文本之间的实体链接,匹配图像中的实体与文本描述。
- 依赖预训练模型:运用预训练的CLIP模型和自定义的实体链接模型,能快速准确识别图像中的实体。
- 灵活的模型加载和切换:支持多种模型加载方式,可根据不同任务需求灵活切换模型。
- 简单的API接口:提供简单易用的API接口,便于用户进行实体链接的推理和测试。
安装使用步骤
安装步骤
- 复制项目仓库到本地或服务器上。
- 安装依赖库,可通过以下方式:
- 使用pip安装所需依赖:
bash pip install -r requirements.txt
- 使用conda创建虚拟环境并安装依赖:
bash conda create --name myenv python=3.8 pip requests torch torchvision numpy pandas scikit-learn matplotlib scikit-image opencv-python scipy yacs pycocotools joblib dataclasses seqeval timm seaborn boto3 typing pandas_profiling pytorch-lightning wandb transformers plotly scikit-learn notebook Jupyter PyQt5 pip pycparser dgl deeparch vizdoom pytest
- 使用pip安装所需依赖:
- 确保CUDA版本为11.7,下载并安装MMkg MM Entity Linking算法的依赖库。
使用示例
```python from PIL import Image from mmkg_mm_entity_linking import MMEntityLinking
image = Image.open("path/to/image") probs = MMEntityLinking().inference(image, ["a dog", "a cat"]) ```
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】