本帖最后由 xiaozuoquan 于 2018-11-12 12:43 编辑
一、在Docker容器中运行Hadoop集群
3个节点的hadoop集群搭建
1. pull docker image
[AppleScript] 纯文本查看 复制代码 sudo docker pull kiwenlau/hadoop:1.0
2. clone github repository
[AppleScript] 纯文本查看 复制代码 git clone [url=https://github.com/kiwenlau/hadoop-cluster-docker]https://github.com/kiwenlau/hadoop-cluster-docker[/url]
3. create hadoop network
[AppleScript] 纯文本查看 复制代码 sudo docker network create --driver=bridge hadoop
4. start container
[AppleScript] 纯文本查看 复制代码 cd hadoop-cluster-docker
sudo ./start-container.sh
输出:
start hadoop-master container...
start hadoop-slave1 container...
start hadoop-slave2 container...
root@hadoop-master:~#
- 启动3个容器,包含1个主节点和2个从节点
- 你将进入hadoop-master容器的/ root目录
5. start hadoop
[AppleScript] 纯文本查看 复制代码 ./start-hadoop.sh
6. run wordcount
[AppleScript] 纯文本查看 复制代码 ./run-wordcount.sh
输出
input file1.txt:
Hello Hadoop
input file2.txt:
Hello Docker
wordcount output:
Docker 1
Hadoop 1
Hello 2
2、任意大小的Hadoop集群
2.1. rebuild docker image
[AppleScript] 纯文本查看 复制代码 sudo ./resize-cluster.sh 5
指定参数> 1:2,3 ..
这个脚本只是使用不同的从属文件重建hadoop映像,这样可以强制所有从属节点的名称
2.1. start container
[AppleScript] 纯文本查看 复制代码 sudo ./start-container.sh 5
hadoop-cluster-docker-master.zip
(35.55 KB, 下载次数: 35)
|