项目简介
YOLOT是一个基于YOLO算法的目标检测项目,结合了Detectron2框架的强大功能,提供了高效、灵活的目标检测解决方案。该项目支持多GPU训练、灵活的配置系统以及丰富的可视化工具,适用于各种目标检测任务。
项目的主要特性和功能
- 基于Detectron2框架:利用Detectron2的高效性和扩展性,支持快速模型训练和推理。
- 多GPU训练支持:支持多GPU并行训练,显著提升训练效率。
- 灵活的配置系统:通过配置文件管理模型和训练过程的各项参数,便于自定义和扩展。
- 预训练模型支持:提供预训练模型,用户可以直接使用或在此基础上进行微调。
- COCO数据集支持:支持COCO数据集的训练和测试,便于用户快速上手。
安装使用步骤
1. 环境准备
- 操作系统:Windows 10或以上
- Python版本:≥ 3.7(建议使用Python 3.9.7)
- PyTorch版本:≥ 1.8(需支持CUDA)
- CUDA版本:≥ 11.1(建议与PyTorch版本匹配)
- gcc & g++:≥ 5.4
- Microsoft C++:≥ 14.0
2. 安装依赖
- 安装PyTorch:根据CUDA版本选择合适的PyTorch版本并安装:
bash pip install torch==2.1.1 torchvision==0.16.1 torchaudio==2.1.1 --index-url https://download.pytorch.org/whl/cu121
- 安装gcc和g++:下载并安装MinGW,确保gcc和g++版本符合要求。
- 安装Microsoft C++ Build Tools:下载并安装Visual Studio Build Tools,确保C++环境配置正确。
- 安装Detectron2:通过相应命令安装(文档未给出完整命令)。
- 安装mish-cuda和YOLOT:复制YOLOT源码并安装mish-cuda:
bash cd YOLOF cd mish-cuda python setup.py build install cd .. python setup.py develop
3. 准备数据集和预训练模型
- 下载COCO数据集:在
datasets
目录下创建coco
文件夹,并下载COCO 2017数据集:bash http://images.cocodataset.org/zips/train2017.zip http://images.cocodataset.org/zips/val2017.zip http://images.cocodataset.org/annotations/annotations_trainval2017.zip
解压并放置到coco
文件夹中。 - 下载预训练模型:在
pretrained_models
目录下放置预训练模型文件。
4. 训练和测试
- 训练模型:使用以下命令进行训练:
bash python ./tools/train_net.py --num-gpus 1 --config-file ./configs/yolof_R_50_C5_1x.yaml
根据GPU数量调整--num-gpus
参数。 - 测试模型:使用以下命令进行测试:
bash python ./tools/train_net.py --num-gpus 1 --config-file ./configs/yolof_R_50_C5_1x.yaml --eval-only MODEL.WEIGHTS /path/to/checkpoint_file
5. 常见问题
- GPU内存不足:调整
IMS_PER_BATCH
参数,减小batch size。 - 索引值所在设备不匹配:确保所有张量在GPU上运行。
- 学习率过大:调整
BASE_LR
参数,降低学习率。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】