项目简介
本项目是个人学习机器学习时编写的笔记,围绕西瓜书第一版和《机器学习实战》构建。鉴于西瓜书理论性强但缺少代码实现,其他含代码书籍与西瓜书内容匹配度低,因此创建此项目。项目基于Python 3.6.4环境,聚焦决策树相关内容,因西瓜书理论部分丰富,笔记中的理论阐述相对简略。
项目的主要特性和功能
- 决策树实现:实现决策树的创建与分类,包含预剪枝和后剪枝操作,提升决策树性能。
- 数据处理:能够处理决策树中的缺失值,提供数据预处理、信息论计算等辅助函数。
- 持久化操作:支持决策树的存储和加载,便于模型复用。
- 可视化:提供决策树可视化工具,帮助直观理解决策树结构。
安装使用步骤
- 确保已安装Python 3.6.4环境。
- 下载本项目的源码文件。
- 根据需求修改数据集和标签列表。
- 运行
main.py
文件,构建决策树模型。 - 可选择进行后剪枝操作,使用
treePlotter.py
对决策树进行可视化。 - 测试决策树模型,评估其性能。
下载地址
点击下载 【提取码: 4003】【解压密码: www.makuang.net】