黑马程序员技术交流社区

标题: 【上海校区】MapReduce功能实现七---小综合(多个job串行处理... [打印本页]

作者: 不二晨    时间: 2018-8-22 10:01
标题: 【上海校区】MapReduce功能实现七---小综合(多个job串行处理...

复杂的MapReduce处理中,往往需要将复杂的处理过程,分解成多个简单的Job来执行,第1个Job的输出做为第2个Job的输入,相互之间有一定依赖关系。下面以求平均值为例

1. 求Sum
2. 求Count

3. 计算平均数


[hadoop@h71 q1]$ vi ceshi.txt
2
8
8
3
2
3
5
3
0
2
7
[hadoop@h71 q1]$ hadoop fs -put ceshi.txt /input


每1个步骤看成一个Job,其中Job3必须等待Job1、Job2完成,并将Job1、Job2的输出结果做为输入,下面的代码演示了如何将这3个Job串起来



在Linux中执行该代码:



[hadoop@h71 q1]$ hadoop fs -lsr /output
drwxr-xr-x   - hadoop supergroup          0 2017-03-18 22:45 /output/avg
-rw-r--r--   2 hadoop supergroup          0 2017-03-18 22:45 /output/avg/_SUCCESS
-rw-r--r--   2 hadoop supergroup         22 2017-03-18 22:45 /output/avg/part-r-00000
drwxr-xr-x   - hadoop supergroup          0 2017-03-18 22:44 /output/count
-rw-r--r--   2 hadoop supergroup          0 2017-03-18 22:44 /output/count/_SUCCESS
-rw-r--r--   2 hadoop supergroup          9 2017-03-18 22:44 /output/count/part-r-00000
drwxr-xr-x   - hadoop supergroup          0 2017-03-18 22:44 /output/sum
-rw-r--r--   2 hadoop supergroup          0 2017-03-18 22:44 /output/sum/_SUCCESS
-rw-r--r--   2 hadoop supergroup          7 2017-03-18 22:44 /output/sum/part-r-00000


[hadoop@h71 q1]$ hadoop fs -cat /output/sum/part-r-00000
SUM     43
[hadoop@h71 q1]$ hadoop fs -cat /output/count/part-r-00000
COUNT   11
[hadoop@h71 q1]$ hadoop fs -cat /output/avg/part-r-00000
AVG     3.909090909090909


参考自:http://www.cnblogs.com/yjmyzz/p/4540469.html



作者: 不二晨    时间: 2018-8-23 17:07
奈斯
作者: 不二晨    时间: 2018-8-30 17:17
奈斯,加油加油




欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2