机器学习其实就是一帮计算机科学家想让计算机向人一样的思考所研发出来的一套计算机理论。
首先机器学习的英文名称为Machine Learning,他实际上指的是让计算机具备向人一样的学习能力的高(qi)端(ji)技(yin)巧(qiao),进而从堆积如山的数据中寻找到有用的知识。
机器学习的应用领域也非常广发,现在很多公司都有关于机器学习相关算法的应用,机器学习相关算法在人工智能和大数据领域都有着十分重要的作用。也可以堪称是着两个领域的核心。 什么是人类学习:
在讨论计算机如何进行学习之前,不妨先来看看我们人类是怎么学习的:
人类的学习按逻辑顺序可分为三给阶段:输入,整合;输出。以英语为例,在入门时我们都逃不出背单词的苦海,不积累一定的词汇量后续学习将无从谈起,这就是输入阶段。然而你很快发现,无论你被再多的单词也无法和歪果仁愉快的交流。你必须学习语法,学习一些约定成俗的习惯用语,才知道如何的把单词地道的转换为句子。最后,有词汇量做基石,又有语法作为架构,我们就能够在特定的场合用英文来表达自己的想法。这就是输出阶段,也是我们学习英语的初衷。
学习其他的东西也一样,概括来说,都要经历从积累经验到总结规律,最终灵活运用这三个阶段。
那么完全完全可以对人类的学习下如下的定义:人类学习是一个人根绝过往的经验,对一类问题形成某种认识或总结出一定的规律,然后利用这些知识对新的问题下定义的过程。
什么是机器学习
上面我们讲到了人类的学习规律,但是当我们用人类的大脑和计算机做对比时我们就发现,人类学习能力强,但记性差,反应慢,还容易坏。计算机虽然呆,但容量大,计算快,还稳定。那么如何能融合这两者的优势呢?显然最简单的方式就是教会计算机学习~。那么人类可以从自己获得的经验中获取知识,而计算机却无法做到,只能从我们投喂数据中学习规律。几十年来,很多计算机科学家和应用数学家总结出了不少教会计算机学习的方法,他们就是各种这样的机器学习算法。至此我们可以对机器学习下一个这样的定义:机器学习就是指用某些算法指导计算机利用已知数据得出适当的模型,利用此模型对新的情景得出判断的过程。由此看来机器学习的思想并不复杂,他仅仅是对人类生活中学习规律的模拟,在这个过程中,最关键的是数据,是数据,是数据,重要的事情说三遍。 No data, No intelligence
如果说模型是我们希望造出来的火箭,那么数据就是点燃它的燃料。数据量直接决定我们火箭只是个概念玩具还是能够载人登月,还是能够飞出太阳系探索智慧生物。这也就是机器学习和大数据是如此密不可分的原因。 机器学习所用到的学科门类
机器学习萌芽于19世纪60年代,大约在20年前机器学习才开始兴起,它是一门跨学科的交融,它跨越了概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科,你甚至可以了解到。他可以作为实际工具应用到从政治到地质学的多种领域,解决其中的很多问题。甚至可以这么说,机器学习对于任何需要解释并操作数据的领域都有所帮助。机器学习用到了统计学的知识,在过去的半个世纪里,发达国家的多数工作岗位,已经从体力劳动转化到脑力劳动,过去的工作基本上都是有明确定义的,类似于把物品A搬到B处,但这样的工作目前正在消失。如今的情况具有很大的二义性,类似于“最大化利润”,”最小化风险”,“找到最好的市场策略”……,诸如此类的工作已成为常态,虽然可从互联网上找到海量数据,但这并没有简化知识工人的工作难度,针对具体任务所在相关数据的意义所在,这正是基本的技能要求,正如谷歌公司的首席经济学家Hal Varian所说的那样:我不断的告诉大家,未来10年最热门的行业是统计学家,很多人认为我是在开玩笑,是又能想到计算机工程师会是20世纪90年代最诱人的职业呢? 大量的经济活动都依赖于数据,我们不能在海量的数据中迷失,机器学习将有助于我们穿越数据迷雾,从中取得大量信息。
|