黑马程序员技术交流社区
标题:
【上海校区】Resample方法
[打印本页]
作者:
梦缠绕的时候
时间:
2019-1-24 10:09
标题:
【上海校区】Resample方法
Bootstrap
在原有的训练数据集上重复性地随机选取n个数据.
核心思想在于,给定训练集,当你认为给定的训练集不能够很好地反应数据的真实分布时,可以采用重采样的方法,来增大样本.
Bagging
bootstrap aggregating
在原有的训练数据集D DD上,采用bootstrap的方法独立选取m mm个训练集分别训练m mm个分类器/回归,然后组合成最终的分类器/回归.
Bagging的方法能够提升不稳定分类器的识别准确率,因为它有效地平均了多个分类器之间的不稳定性.
Boosting
Boosting同样是生成多个子分类器,但是多个子分类器的产生是有序的,即一个分类器依赖于前一个分类器,并且子分类器着重关注于前一个分类器误分类的样本.
作者:
不二晨
时间:
2019-1-24 14:42
奈斯
欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/)
黑马程序员IT技术论坛 X3.2