导入数据基本版:load data [local] inpath 'filepath' [overwrite] into table tab_name这个是导入数据的基本版,其中当添加上关键字local时是从本地文件路径中导入数据的,如果没有加上上local这个关键字就是将hdfs上面的数据移动到表所对应的指定目录上去了,原地址将不再保存数据了。
case when then == if-else
这个语法和if-else是差不多的,当满足when的条件的时候就执行then这个语法后面的命令。
select name,age,case when age > 24 then 'man' when age <= 24 then 'women' else 'shenmegui' end from doudou_1;
这个语法就是在select 和 from 中间添加了case when then语句,一般then后面可以添加一个新的临时字段或者在现有的字段上面执行操作。
union all
就是将两个数据表临时地合并成一个表展示出来,一般用在数据倾斜的场景。
Hive上的functions
查看函数的操作:show functions;这个操作就是将所有的函数全部都展示出来,但也展示名字而已。而如果要查看一个具体的函数的功能:desc function extended func_name; 具体的例子就自己实现一下看下吧
当一个文本文件里面有数组作为一个字段的时候,我们要怎么进行切分呢?在导入数据的基本版后面添加上collection items terminated by xxx;