黑马程序员技术交流社区

标题: 编码 [打印本页]

作者: zhangyangLengen    时间: 2014-11-7 20:56
标题: 编码
GB2312编码:是两个字节编码:两个整数都是负数
GBK编码是两个子节编码:在GB2312的基础上进行拓展的编码:第一个数是负数,有的时候第二数是正数
而UTF-8是三个字节编码的:有时候UTF-8能够解析1个字节编码,2个字节编码,和三个字节编码:关键是编码头
'\u0001' 到 '\u007F' 范围内的所有字符都是用单个字节表示的:
位值
字节 1
0
位 6-0
null 字符 '\u0000' 以及从 '\u0080' 到 '\u07FF' 的范围内的字符用两个字节表示:
位值
字节 1
1
1
0
位 10-6
字节 2
1
0
位 5-0

                        '\u0800' 到 '\uFFFF' 范围内的 char 值用三个字节表示:
位值
字节 1
1
1
1
0
位 15-12
字节 2
1
0
位 11-6
字节 3
1
0
位 5-0






欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2