黑马程序员技术交流社区

标题: 【上海校区】无法停止hadoop集群（stop-all.sh） [打印本页]

作者: 梦缠绕的时候 时间: 2019-1-25 09:59
标题: 【上海校区】无法停止hadoop集群（stop-all.sh）
执行 ./bin/stop-all.sh 脚本一直提示没有可停止的namenode、datanode、secondarynode。可是输入 jps 命令，发现hadoop 已经启动。

[root@xxxxxx src]# bash hadoop-2.6.5/sbin/stop-all.sh
This script is Deprecated. Instead use stop-dfs.sh and stop-yarn.sh
Stopping namenodes on [master]
master: no namenode to stop
master: no datanode to stop
slave1: no datanode to stop
Stopping secondary namenodes [0.0.0.0]
0.0.0.0: no secondarynamenode to stop
stopping yarn daemons
no resourcemanager to stop
master: no nodemanager to stop
slave1: no nodemanager to stop
no proxyserver to stop

[root@xxxxxx src]# jps
27634 JobHistoryServer
16372 NameNode
27444 Master
27156 ResourceManager
2405 DataNode
2700 NodeManager
16541 SecondaryNameNode
11502 Jps

问题的原因是：hadoop在stop的时候依据的是datanode上的mapred和dfs进程号。而默认的进程号保存在/tmp下，linux默认会每隔一段时间（一般是一个月或者7天左右）去删除这个目录下的文件。因此删掉hadoop-hadoop-jobtracker.pid和hadoop- hadoop-namenode.pid两个文件后，namenode自然就找不到datanode上的这两个进程了。

解决办法
1、jps查看所有进程的pid，手动杀死进程 kill -9 pid，多个节点都需要操作！
为了避免下次也出现问题，在配置文件中$HADOOP_HOME/conf/hadoop-env.sh中添加如下，
export HADOOP_PID_DIR=${HADOOP_HOME}/pids

2、重启Hadoop集群，即可。

作者: 不二晨 时间: 2019-2-14 14:47

奈斯

欢迎光临黑马程序员技术交流社区 (http://bbs.itheima.com/)

黑马程序员IT技术论坛 X3.2