项目简介
本项目聚焦于人工智能、机器学习与大数据领域,从算法、平台、应用三个层面开展学习与实践。算法层面帮助研究生熟悉基础算法;平台层面助力学生掌握项目开发所需工具;应用层面训练学生运用平台与算法完成具体事务,并结合实验室项目,全面提升学生实践能力。
项目的主要特性和功能
算法功能
实现Kmeans、KNN、Logistic Regression、Softmax Regreesion、BP神经网络、CART、贝叶斯方法、PCA等基础算法,加深学生对相关领域算法的理解。
平台功能
- Hadoop生态环境:包含基于Kafka的消息订阅系统、基于Sqoop和Flume的数据ETL、基于Oozie的流程管理平台等,以及Spark环境下非结构化数据读写和基于Spark Mllib的机器学习应用实践。
- Tensorflow:涵盖简单CNN对MNIST手写体的数字识别、AlexNet、VGGNet、GoogLeNet、ResNet、LSTM等内容。
- Docker和Kubernetes容器集群平台:可在CentOS或Ubuntu上安装部署环境,搭建ELK日志系统,在Kubernetes环境下搭建Tensorflow并完成相关任务。
应用功能
完成文本分类、运动目标检测、运动目标识别等具体应用,也可选择在Docker平台中完成其中任意一个应用。
安装使用步骤
- 下载本项目源码文件后,根据不同算法实现需求,安装Python、C、C++、Java等程序设计语言的开发环境。
- 对于平台部分,按照文档要求依次搭建Hadoop生态环境、Tensorflow环境、Docker和Kubernetes容器集群平台环境。
- 针对算法实现,除数学运算可调用现有库函数外,其他部分手动编写代码实现。
- 搭建好平台环境后,运行示例程序进行测试,确保环境正常。
- 进行应用部分开发,完成演示Demo。
- 完成10个学习报告,内容包含运行环境说明、数据准备、算法流程或平台搭建说明、运行效果或结论。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】