Hadoop入门实战手册——为云思，云舞的同学打基础

wangnet

本帖最后由夏一站于 2013-6-7 14:29 编辑

1.1
什么是Hadoop？
Hadoop 由 Apache Software Foundation 公司于 2005 年秋天作为 Lucene 的子项目 Nutch 的一部分正式引入。它受到最先由 Google Lab 开发的 MapReduce 和 Google File System 的启发。2006 年 3 月份，MapReduce 和 Nutch Distributed File System (NDFS) 分别被纳入称为 Hadoop 的项目中。
Hadoop并不仅仅是一个用于存储的分布式文件系统，而是设计用来在由通用计算设备组成的大型集群上执行分布式应用的基础框架。它由Apache基金会开发。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力高速运算和存储。简单地说来，Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。
Hadoop框架中最核心的设计就是：MapReduce和HDFS。
1)
MapReduce的思想是由Google的一篇论文所提及而被广为流传的，简单的一句话解释MapReduce就是“任务的分解与结果的汇总”。
2)
HDFS是Hadoop分布式文件系统（Hadoop Distributed File System）的缩写，为分布式计算存储提供了底层支持。
1.2
为什么要选择Hadoop？

下面列举hadoop主要的一些特点：
1)
扩容能力（Scalable）：能可靠地（reliably）存储和处理千兆字节（PB）数据。
2)
成本低（Economical）：可以通过普通机器组成的服务器群来分发以及处理数据。这些服务器群总计可达数千个节点。
3)
高效率（Efficient）：通过分发数据，hadoop可以在数据所在的节点上并行地（parallel）处理它们，这使得处理非常的快速。
4)
可靠性（Reliable）：hadoop能自动地维护数据的多份复制，并且在任务失败后能自动地重新部署（redeploy）计算任务。

暂且列这些内容，云计算要引进hadoop课程，所以网上自学了相关的基础内容，现在把我的资源与大家分享，希望大家都能够取得进步。。

曹睿翔 · 曹睿翔

都没人顶？云丝的兄弟姐妹们，不要浮躁，别人的努力辛苦要支持！

曹睿翔 · 曹睿翔

下载还不回复，让我知道了，可是扣技术分！

秦兰之 · 秦兰之

我吓，我下。

秦兰之 · 秦兰之

支持，下来看看，好东西别人不吝啬，我们就不能浪费。

王楚鑫 · 王楚鑫

报告、我偷偷的下载了、、

王婷婷 · 王婷婷

真心的不知道 Hadoop 是什么。{:soso_e113:}

张龙欢 · 张龙欢

顶一下！！！

紫衣侯 · 紫衣侯

看看。。。。

ㄗs：/|丶hearts · ㄗs：/|丶hearts

不知道Hadoop是神马下来看看学习学习

陈昊 · 陈昊

观望中

袁梦希 · 袁梦希

我也来支持个嘿嘿

毛杰 · 毛杰

很给力，支持！

张禄宇 · 张禄宇

downloading.........

Just_Only · Just_Only

云很喜欢，搞起。。。

穆爱明 · 穆爱明

感谢分享!

穆爱明 · 穆爱明

了解一下，有备无患

zms2100 · zms2100

纯文档有点干瘪瘪，不过学习了........谢谢LZ分享。

Unicorn319 · Unicorn319

多谢分享~~~~~~~~~`

GISQZC · GISQZC

好像是物联云里面的吧，看看

帐号		自动登录	找回密码
密码			加入黑马

Hadoop入门实战手册——为云思，云舞的同学打基础

评分

19 个回复

浏览过的版块

黑马骑士勋章