每个国家对自己的文字都有一套编码方式,utf-8集合了所有的编码方式,因此又被称为万国码。
我们国家汉子的码表是gbk以及后来出现包含更多汉子的gb2312,gb18030等.我在应用jsp时用默认的utf-8编码
经常出现乱码,多改成gbk。
至于UTF8修正版,主要有两点不同:
一,null字符编码成2个字节(1100000010000000)而不是标准的1个字节(00000000)。
二,在标准UTF-8编码中,超出基本多语言范围(BMP-BasicMultilingualPlain)的字符被编码为4字节格式,但是在修正的UTF-8编码中,他们由代理编码对(surrogatepairs)表示,然后这些代理编码对在序列中分别重新编码。
看具体情况,来确定用哪种编码方式。 |