A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

本帖最后由 夏一站 于 2013-6-7 14:29 编辑

1.1
什么是Hadoop?
Hadoop 由 Apache Software Foundation 公司于 2005 年秋天作为 Lucene 的子项目 Nutch 的一部分正式引入。它受到最先由 Google Lab 开发的 MapReduce 和 Google File System 的启发。2006 年 3 月份,MapReduce 和 Nutch Distributed File System (NDFS) 分别被纳入称为 Hadoop 的项目中。
Hadoop并不仅仅是一个用于存储的分布式文件系统,而是设计用来在由通用计算设备组成的大型集群上执行分布式应用的基础框架。它由Apache基金会开发。用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。简单地说来,Hadoop是一个可以更容易开发和运行处理大规模数据的软件平台。
Hadoop框架中最核心的设计就是:MapReduce和HDFS。
1)
MapReduce的思想是由Google的一篇论文所提及而被广为流传的,简单的一句话解释MapReduce就是“任务的分解与结果的汇总”。
2)
HDFS是Hadoop分布式文件系统(Hadoop Distributed File System)的缩写,为分布式计算存储提供了底层支持。
1.2
为什么要选择Hadoop?

下面列举hadoop主要的一些特点:
1)
扩容能力(Scalable):能可靠地(reliably)存储和处理千兆字节(PB)数据。
2)
成本低(Economical):可以通过普通机器组成的服务器群来分发以及处理数据。这些服务器群总计可达数千个节点。
3)
高效率(Efficient):通过分发数据,hadoop可以在数据所在的节点上并行地(parallel)处理它们,这使得处理非常的快速。
4)
可靠性(Reliable):hadoop能自动地维护数据的多份复制,并且在任务失败后能自动地重新部署(redeploy)计算任务。


暂且列这些内容,云计算要引进hadoop课程,所以网上自学了相关的基础内容,现在把我的资源与大家分享,希望大家都能够取得进步。。

Hadoop入门实战手册.pdf

881.16 KB, 下载次数: 195

评分

参与人数 2技术分 +1 黑马币 +4 收起 理由
wangnet + 4 很给力!
曹睿翔 + 1 很给力!

查看全部评分

19 个回复

倒序浏览
都没人顶?云丝的兄弟姐妹们,不要浮躁,别人的努力辛苦要支持!
回复 使用道具 举报
下载还不回复,让我知道了,可是扣技术分!
回复 使用道具 举报
我吓,我下。
回复 使用道具 举报
支持,下来看看,好东西别人不吝啬,我们就不能浪费。
回复 使用道具 举报
报告、我偷偷的下载了、、
回复 使用道具 举报
真心的不知道 Hadoop 是什么。{:soso_e113:}
回复 使用道具 举报
顶一下!!!
回复 使用道具 举报
看看。。。。
回复 使用道具 举报
不知道Hadoop是神马  下来看看 学习学习
回复 使用道具 举报
观望中
回复 使用道具 举报
我也来支持个  嘿嘿
回复 使用道具 举报
很给力,支持!
回复 使用道具 举报
downloading.........
回复 使用道具 举报
云 很喜欢,搞起。。。
回复 使用道具 举报
感谢分享!
回复 使用道具 举报
了解一下,有备无患
回复 使用道具 举报
纯文档有点干瘪瘪,不过学习了........谢谢LZ分享。
回复 使用道具 举报
多谢分享~~~~~~~~~`
回复 使用道具 举报
好像是物联云里面的吧,看看
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马