【郑州校区】大数据离线阶段Day2之Hadoop集群启动、初体验

【郑州校区】大数据离线阶段Day2之Hadoop集群启动、初体验

1． 启动方式

要启动Hadoop集群，需要启动HDFS和YARN两个集群。

注意：首次启动HDFS时，必须对其进行格式化操作。本质上是一些清理和准备工作，因为此时的HDFS在物理上还是不存在的。

hdfs namenode–format或者hadoop namenode –format

1.1． 单节点逐个启动

在主节点上使用以下命令启动HDFS NameNode：

hadoop-daemon.sh start namenode

在每个从节点上使用以下命令启动HDFS DataNode：

hadoop-daemon.sh start datanode

在主节点上使用以下命令启动YARN ResourceManager：

yarn-daemon.sh start resourcemanager

在每个从节点上使用以下命令启动YARN nodemanager：

yarn-daemon.sh start nodemanager

以上脚本位于$HADOOP_PREFIX/sbin/目录下。如果想要停止某个节点上某个角色，只需要把命令中的start改为stop即可。

1.2． 脚本一键启动

如果配置了etc/hadoop/slaves和ssh免密登录，则可以使用程序脚本启动所有Hadoop两个集群的相关进程，在主节点所设定的机器上执行。

hdfs：$HADOOP_PREFIX/sbin/start-dfs.sh

yarn: $HADOOP_PREFIX/sbin/start-yarn.sh

停止集群：stop-dfs.sh、stop-yarn.sh

2． 集群web-ui

一旦Hadoop集群启动并运行，可以通过web-ui进行集群查看，如下所述：

NameNode http://nn_host:port/ 默认50070.

ResourceManager http://rm_host:port/ 默认 8088.

3． Hadoop初体验3.1． HDFS使用

从Linux本地上传一个文本文件到hdfs的/test/input目录下

hadoop fs -mkdir -p /wordcount/input

hadoop fs -put /root/somewords.txt /test/input

3.2． 运行mapreduce程序

在Hadoop安装包的hadoop-2.7.4/share/hadoop/mapreduce下有官方自带的mapreduce程序。我们可以使用如下的命令进行运行测试。

示例程序jar:

hadoop-mapreduce-examples-2.7.4.jar

计算圆周率:

hadoop jar hadoop-mapreduce-examples-2.7.4.jar pi 20 50

关于圆周率的估算，感兴趣的可以查询资料Monte Carlo方法来计算Pi值。

传智播客·黑马程序员郑州校区地址

河南省郑州市高新区长椿路11号大学科技园（西区）东门8号楼三层

联系电话 0371-56061160/61/62

来校路线地铁一号线梧桐街站A口出

帐号		自动登录	找回密码
密码			加入黑马

0 个回复