黑马程序员技术交流社区

标题: 【上海校区】sqoop学习2(数据导入与导出命令) [打印本页]

作者: 不二晨    时间: 2018-7-15 09:51
标题: 【上海校区】sqoop学习2(数据导入与导出命令)
最近学习了下这个导数据的工具,但是在export命令这里卡住了,暂时排不了错误。先记录学习的这一点吧sqoop是什么

sqoop(sql-on-hadoop):是用来实现结构型数据(如关系型数据库)和hadoop之间进行数据迁移的工具。它充分利用了mapreduce的并行特点以及批处理的方式加快数据的传输,同时也借助mapreduce实现了容错。

sqoop架构

1)sqoop目前有两个版本sqoop1(1.4.x)和sqoop2(1.99.x),这里安装的是sqoop1版本

2)sqoop1是由client端直接接入hadoop,任务通过解析生成对应的mapreduce执行

3)sqoop1架构图


4)导入(import)与导出(export)
导入:往hdfs上导数据
导出:从hdfs上导出去

导入流程:
1)读取要导入数据的表结构
2)读取参数,设置好job
3)调用mapreduce执行任务
----a 首先要对数据进行切分
----b 写入范围,以便读取
----c 读取范围参数(第二步中设置的参数)
----d 创建RecordReader并从数据库中读取数据
----e 创建map
----f 执行map

导出流程:导入过程的逆向过程

sqoop常用命令

命令初步认识

我导数据时候有时遇到导入不成功,报10020端口连接不上,试试在namenode上执行命令:
mr-jobhistory-daemon.sh start historyserver 之后再去导数据

1)version:显示sqoop版本2)help:查看sqoop帮助信息[root@spark1 ~]# sqoop help3)list-databases:打印出关系数据库所有的数据库名


数据库连接参数4)list-tables:打印出关系数据库某一数据库的所有表名


5)import:将数据库表的数据导入到hive中,如果在hive中没有对应的表,则自动生成与数据库表名相同的表增量导入数据从mysql导入到hdfs实例1:将mysql中wujiadong数据库中的表stud_info表中的数据导入到hdfs(--target-dir)



实例2:在1的基础上继续往这个文件中导入数据(append)[root@spark1 ~]# sqoop import --connect jdbc:mysql://spark1:3306/wujiadong --username root --table stud_info --append --target-dir 'hdfs://spark1:9000/user/sqoop_test'  可以看到比原来的多了解一个文件


实例3:在1基础上删除已存在文件并导入数据(--delete-target-dir)[root@spark1 ~]# sqoop import --connect jdbc:mysql://spark1:3306/wujiadong --username root --table stud_info --target-dir 'hdfs://spark1:9000/user/sqoop_test'   --delete-target-dir实例4:增量导入数据到hdfs实例5:指定条件导入(注意不能含中文)


实例6:启用压缩



实例7:导入空值(NULL)处理实例8:sql导入数据从mysql导入到hive实例1 :将mysql数据库wujiadong1中的stud_info表中数据导入到hive总的stud_info1表中(该表未先创建)实例2:将mysql数据库wujiadong1中的stud_info表中数据导入到hive的sqoop_test数据库的stud_info表中(该表未先创建)


实例3:在2的基础上用--hive-overwrite覆盖导入实例4:使用非默认分隔符“,”分隔hive表字段


实例5:增量导入数据从mysql导入到hbase(学完hbase再学)文件输出参数6)export:从hdfs中导出数据到关系数据库中

参考资料1:
sqoop中文手册

参考资料2:
Sqoop导入关系数据库到Hive

参考资料3:
sqoop安装文档

参考资料4:
Sqoop之导入导出操作


【转载地址】https://blog.csdn.net/YYDU_666/article/details/81033732



作者: wuqiong    时间: 2018-7-15 10:20

作者: 不二晨    时间: 2018-7-16 11:51
奈斯
作者: 吴琼老师    时间: 2018-7-18 14:58

作者: 梦缠绕的时候    时间: 2018-7-18 15:44

作者: 不二晨    时间: 2018-7-19 14:08
优秀




欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2