【源码】基于Python语言的深度跨模态哈希检索系统

项目简介

本项目聚焦于基于Python语言的深度跨模态哈希检索程序的设计与实现。通过运用深度学习技术，设计跨模态哈希检索算法，并在三个基准数据集上开展实验，与先进的跨模态哈希算法进行对比分析。

此步骤未详细说明，需按照项目需求准备相应数据。

提取图文特征： bash cd Chinese-CLIP/ export CUDA_VISIBLE_DEVICES=0 export PYTHONPATH=$PYTHONPATH:$(pwd)/src python -u src/eval/extract_features.py --extract-image-feats --extract-text-feats --image-data="$DATAPATH/datasets/$dataset_name/lmdb/$split/imgs" --text-data="$DATAPATH/datasets/$dataset_name/$split_texts.jsonl" --img-batch-size=32 --text-batch-size=32 --context-length=24 --resume=$resume --vision-model=ViT-B-16 --text-model=RoBERTa-wwm-ext-base-chinese
进行KNN检索： bash cd Chinese-CLIP/ python -u src/eval/make_topk_predictions.py --image-feats="$DATAPATH/datasets/$dataset_name/$split_imgs.img_feat.jsonl" --text-feats="$DATAPATH/datasets/$dataset_name/$split_texts.txt_feat.jsonl" --topN=10 --eval-batch-size=32768 --output="$DATAPATH/datasets/$dataset_name/$split_predictions.jsonl"
计算召回率： bash python src/eval/evaluation.py $DATAPATH/datasets/$dataset_name/$split_texts.jsonl $DATAPATH/datasets/$dataset_name/$split_predictions.jsonl

分析评估结果，对比所提出算法与现有算法的性能。

注：上述步骤假设用户已经下载了本项目的源码文件，并具备相应的Python开发环境。

点击下载 【提取码: 4003】【解压密码: www.makuang.net】