GB2312编码:是两个字节编码:两个整数都是负数
GBK编码是两个子节编码:在GB2312的基础上进行拓展的编码:第一个数是负数,有的时候第二数是正数
而UTF-8是三个字节编码的:有时候UTF-8能够解析1个字节编码,2个字节编码,和三个字节编码:关键是编码头
'\u0001' 到 '\u007F' 范围内的所有字符都是用单个字节表示的: null 字符 '\u0000' 以及从 '\u0080' 到 '\u07FF' 的范围内的字符用两个字节表示:
'\u0800' 到 '\uFFFF' 范围内的 char 值用三个字节表示:
|