编码表的问题

职业规划－刘倩老师

UTF-8和UTF-8修改版有什么区别？昨天做了编码的问题，有点现问题，求解。

王--明 · 王--明

谢谢老罗

老罗 · 老罗

王--明发表于 2012-2-28 17:59
谢谢了。明白了

明白了就好

王--明 · 王--明

吕猛发表于 2012-2-28 12:26
百度百科：UTF-8

　　java使用UTF-16表示内部文本，并支持用于字符串串行化的非标准的修正UTF-8编码。 UT ...

谢谢了。明白了:)

葛尧 · 葛尧

有些问题是需要自己动手查找百科的。

吕猛 · 吕猛

百度百科：UTF-8

　　java使用UTF-16表示内部文本，并支持用于字符串串行化的非标准的修正UTF-8编码。 UTF-8保存使用标准UTF-8和修正的UTF-8有两点不同：
　　修正的UTF-8中，null字符编码成2个字节（1100000010000000）而不是标准的1个字节（00000000），这样作可以保证编码后的字符串中不会嵌入null字符。因此如果在类C语言中处理字符串，文本不会在第一个null字符时截断（C字符串以null结尾）。
　　在标准UTF-8编码中，超出基本多语言范围（BMP-BasicMultilingualPlain）的字符被编码为4字节格式，但是在修正的UTF-8编码中，他们由代理编码对（surrogatepairs）表示，然后这些代理编码对在序列中分别重新编码。结果标准UTF-8编码中需要4个字节的字符，在修正后的UTF-8编码中将需要6个字节。

帐号		自动登录	找回密码
密码			加入黑马

编码表的问题

评分

5 个回复

评分

浏览过的版块

黑马骑士勋章