黑马程序员技术交流社区

标题: 【上海校区】数据挖掘篇——特征工程之特征降维 [打印本页]

作者: 梦缠绕的时候    时间: 2020-3-19 10:53
标题: 【上海校区】数据挖掘篇——特征工程之特征降维
0. 特征工程    首先介绍下,特征工程是什么:利用数据领域的相关知识来创建能够使机器学习算法达到最佳性能的特征的过程[1.wiki]。特征工程是一个较大领域,它通常包括特征构建、特征提取和特征选择这三个子模块,重要性排序:特征构建>特征提取>特征选择。

    先来介绍几个术语:
  • 特征构建:从原始数据中构建出特征,有时也称作特征预处理,包括缺失值处理、异常值处理、无量纲化(标准化/归一化)、哑编码等。
  • 特征提取:将原特征转换为一组具有明显物理意义或统计意义或核的新特征。
  • 特征选择:从特征集合中挑选一组最具统计意义的特征子集。

    其中本文主要总结下可统一用于特征降维的特征提取和特征选择技术方法,特征构建涉及技术点较少,下回再分解。
1. 特征降维WHAT:将高维空间的特征通过删减或变换转为低维空间特征
WHY:降低时间/空间复杂度、降低提取特征开销、降噪、提升鲁棒性、增强可解释性、便于可视化;
HOW:主要有两种方式,即特征选择和特征提取。
1.1 特征选择(子集筛选):
特征选择方法主要分为三种:
1.2 特征提取(投影or转换):


作者: 梦缠绕的时候    时间: 2020-3-19 10:53
有问题欢迎添加小优
DKA-2018




欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2