【郑州校区】大数据离线阶段Day2之Hadoop集群启动、初体验1. 启动方式 要启动Hadoop集群,需要启动HDFS和YARN两个集群。 注意:首次启动HDFS时,必须对其进行格式化操作。本质上是一些清理和准备工作,因为此时的HDFS在物理上还是不存在的。 hdfs namenode–format或者hadoop namenode –format 1.1. 单节点逐个启动在主节点上使用以下命令启动HDFS NameNode: hadoop-daemon.sh start namenode 在每个从节点上使用以下命令启动HDFS DataNode: hadoop-daemon.sh start datanode 在主节点上使用以下命令启动YARN ResourceManager: yarn-daemon.sh start resourcemanager 在每个从节点上使用以下命令启动YARN nodemanager: yarn-daemon.sh start nodemanager 以上脚本位于$HADOOP_PREFIX/sbin/目录下。如果想要停止某个节点上某个角色,只需要把命令中的start改为stop即可。 1.2. 脚本一键启动如果配置了etc/hadoop/slaves和ssh免密登录,则可以使用程序脚本启动所有Hadoop两个集群的相关进程,在主节点所设定的机器上执行。 hdfs:$HADOOP_PREFIX/sbin/start-dfs.sh yarn: $HADOOP_PREFIX/sbin/start-yarn.sh 停止集群:stop-dfs.sh、stop-yarn.sh 2. 集群web-ui一旦Hadoop集群启动并运行,可以通过web-ui进行集群查看,如下所述: NameNode http://nn_host:port/ 默认50070. ResourceManager http://rm_host:port/ 默认 8088.
3. Hadoop初体验3.1. HDFS使用从Linux本地上传一个文本文件到hdfs的/test/input目录下 hadoop fs -mkdir -p /wordcount/input hadoop fs -put /root/somewords.txt /test/input 3.2. 运行mapreduce程序在Hadoop安装包的hadoop-2.7.4/share/hadoop/mapreduce下有官方自带的mapreduce程序。我们可以使用如下的命令进行运行测试。 示例程序jar: hadoop-mapreduce-examples-2.7.4.jar 计算圆周率: hadoop jar hadoop-mapreduce-examples-2.7.4.jar pi 20 50 关于圆周率的估算,感兴趣的可以查询资料Monte Carlo方法来计算Pi值。 传智播客·黑马程序员郑州校区地址 河南省郑州市 高新区长椿路11号大学科技园(西区)东门8号楼三层
|