本帖最后由 许庭洲 于 2014-7-26 21:16 编辑
1.ANSI(American National Standards Institute): 它使用7 bits来表示一个字符,总共表示128个字符,其中包括了英文字母、数字、标点符号等常用字符。
2.Unicode: 它固定使用16 bits(两个字节、一个字)来表示一个字符,共可以表示65536个字符。
3.Unicode big endian :字节序分为Big Endian字节序和Little Endian字节序。
例如,0X09CD
Big Endian字节序
0000: 0 9
0001: CD
Little Endian字节序是
0000: CD
0001: 0 9
4.utf-8: UTF意为通用字集转换格式(Universal Character Set TransformationFormat),UTF-8是Unicode的8位元格式。采用变长字节 (1 ASCII, 2 希腊字母, 3 汉字, 4 平面符号) 表示,网络传输, 即使错了一个字节,不影响其他字节,而双字节只要一个错了,其他也错。
|