项目简介
本项目是基于MMAction2框架构建的视频动作识别系统,借助深度学习技术对视频中的动作进行识别。系统读取训练好的模型,对输入视频开展动作分类,输出识别出的动作类别及其对应的概率。
项目的主要特性和功能
- 模型配置灵活:支持I3D、SlowFast、TimeSformer等多种基于3D卷积网络的动作识别模型,可通过配置文件选择使用。
- 数据处理强大:内置多种数据预处理和后处理模块,支持视频帧的采样、解码、裁剪、翻转等操作,以及结果的平均和概率计算。
- 训练选项丰富:提供优化器类型、学习率策略、批次大小、验证间隔等丰富的训练选项,可按需自行配置。
- 支持多GPU训练:能充分利用计算资源,提高训练速度。
- 可视化测试:支持在训练过程中进行可视化,展示训练指标变化和测试时的动作分类结果。
安装使用步骤
环境配置
创建并激活新的Python环境:
bash
conda create -n mmaction python=3.8
conda activate mmaction
安装PyTorch和MMAction2:
bash
pip install torch==1.13 torchvision==0.14.0 -i https://pypi.tuna.tsinghua.edu.cn/simple
mim install mmcv -i https://pypi.tuna.tsinghua.edu.cn/simple
数据集准备
(需根据项目文档准备数据集)
模型训练
进入MMAction2目录,修改配置文件,如slowfast_r50_8xb8-4x16x1-256e_kinetics400-rgb.py
。
使用以下命令启动训练:
bash
bash tools/dist_train.sh configs/recognition/slowfast/slowfast_r50_8xb8-4x16x1-256e_kinetics400-rgb.py 4 --work-dir /path/to/workdir
模型测试
使用训练好的模型进行测试:
bash
bash tools/dist_test.sh configs/recognition/slowfast/slowfast_r50_8xb8-4x16x1-256e_kinetics400-rgb.py /path/to/checkpoint.pth 8 --work-dir /path/to/test_res
结果可视化
调整测试脚本的参数,将测试结果可视化,观察模型性能表现。
注意事项
使用本项目时,需确保正确安装所有依赖库,并按照项目文档要求准备数据集。
下载地址
点击下载 【提取码: 4003】