数据挖掘又被译为资料勘探、数据采矿,是数据库知识发现(knowledgediscoveryindatabase)中的一个步骤。一般是指从大量数据中自动搜索隐藏于其中的有特殊关系的信息的过程。通常与计算机科学有关,通过统计、在线分析引言在大数据时代,如何对数据进行抽取转化成有用的信息并应用于各行各业,变得越来越重要。
1.有监督学习:从给定的训练数据集中学习出函数,用于对新数据的预测。该训练数据集包括输入和输出,或称为特征和目标(响应)。训练集中的目标(响应)需要人工标注获得。常见的监督学习算法包括统计分类和回归分析。
2.无监督学习:该训练数据集仅有特征,没有人工标注的目标(响应)。常见的无监督学习算法包括聚类和密度估计。
3.半监督学习:介于监督学习与有监督学习之间,训练数据集中包含人工标注数据和无标注数据。
好深奥呀,这玩意能学透吗
|
|