黑马程序员技术交流社区

标题: 【上海校区】python机器学习无基础到入门的心得----入门篇2 ... [打印本页]

作者: 不二晨    时间: 2018-6-29 09:37
标题: 【上海校区】python机器学习无基础到入门的心得----入门篇2 ...
什么是ID3决策树

本章节代码


上面的图片就是决策树的最终展现图


优点

缺点:

适用数据类型: 标称型


决策树术语

椭圆形节点代表终止模块, 也叫叶子结点, 任何到达叶子结点的数据必然属于叶子结点的分类
正方形代表判断模块
从判断模块引出的左右箭头称作分支

原始香农熵: 表示数据的无序程度,混合的数据越多, 熵越高 公式为
信息增益: 在划分数据集之前之后信息发生变化叫做信息增益, 具体是累加原始香农熵, 计算出信息增益值, 熵越高, 信息增益值越低, 公式为
随机森林: 多个决策树
集成方法: 利用多个分类器共同决定
有放回的随机抽样: 拿出去一部分进行随机, 随机完必须拿回来,否则在随机抽样不放回, 训练集永远都是新的


本人归纳:

具体:
1. 选出起决定性作用的特征, 去重特征那列的值, 遍历不重复特征值, 划分出最优子集, 递归

【转载】原文地址:https://blog.csdn.net/qq351469076/article/details/80770310



作者: 吴琼老师    时间: 2018-7-5 16:44





欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2