项目简介
本项目聚焦计算机视觉领域,基于PyTorch框架开展研究。实现了多种经典卷积神经网络(CNN)架构用于图像分类任务,如LeNet、AlexNet、VGGNet、ResNet、MobileNet等。同时,正在开发目标识别检测相关模型,像Faster RCNN/FPN、SSD/RetinaNet、YOLO v3等。
项目的主要特性和功能
- 多种图像分类模型:实现多个经典图像分类模型,使用不同数据集训练,如LeNet用CIFAR数据集,AlexNet、ResNet、MobileNetV2用5种花的数据集。
- 训练与评估:为各图像分类模型提供训练和验证脚本,可评估模型在图像分类任务上的性能。
- 预测功能:各图像分类模型都有预测脚本,能对输入图像进行分类预测。
- 数据预处理:定义标准数据预处理流程,包括图像大小调整、裁剪、转换为张量、标准化等,满足模型训练和预测需求。
- 模型管理:支持加载预训练模型权重及保存训练后的模型权重。
- 持续更新:后续会增加新的模型和功能,如GoogLeNet、ShuffleNet等图像分类模型以及更多目标识别检测模型。
安装使用步骤
- 安装环境:安装Anaconda3(建议),创建Python 3.6.6的环境,安装VScode 1.50.1作为IDE,使用pip安装pytorch 1.3和torchvision 0.4.0。
- 准备数据集:对于使用5种花数据集的模型,手动下载相应数据集,并按模型所需的数据格式组织。
- 运行训练脚本:根据需求选择合适的图像分类模型,运行对应的训练脚本进行模型训练。
- 运行预测脚本:使用训练好的图像分类模型,运行预测脚本对输入图像进行分类预测。
注意:项目代码主要基于PyTorch框架,若要进行模型定制或修改,建议具备一定的PyTorch和Python编程基础。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】