CSV: 逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号),其文件以纯文本形式存储表格数据(数字和文本)。纯文本意味着该文件是一个字符序列,不含必须像二进制数字那样被解读的数据。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。通常都是纯文本文件。建议使用WORDPAD或是记事本(NOTE)来开启,再则先另存新档后用EXCEL开启,也是方法之一。
我们再来看看awk命令:
awk命令:
awk是行处理器: 相比较屏幕处理的优点,在处理庞大文件时不会出现内存溢出或是处理缓慢的问题,通常用来格式化文本信息
awk处理过程: 依次对每一行进行处理,然后输出
基本用法: [arvin@ArvinWoo ~]$ awk 动作 文件名
[arvin@ArvinWoo home]$ echo 'This Is A Text , Arvin Woo !!' | awk '{print $0}'
This Is A Text , Arvin Woo !!
[arvin@ArvinWoo home]$ echo 'This Is A Text , Arvin Woo !!' | awk '{print $1}'
This
[arvin@ArvinWoo home]$ echo 'This Is A Text , Arvin Woo !!' | awk '{print $2}'
Is
[arvin@ArvinWoo home]$ echo 'This Is A Text , Arvin Woo !!' | awk '{print $1 $2 $4 $3 }'
ThisIsTextA