黑马程序员技术交流社区

标题: 编码表的问题 [打印本页]

作者: 王--明    时间: 2012-2-28 09:59
标题: 编码表的问题
UTF-8和UTF-8修改版有什么区别?昨天做了编码的问题,有点现问题,求解。
作者: 吕猛    时间: 2012-2-28 12:26
百度百科:UTF-8

  java使用UTF-16表示内部文本,并支持用于字符串串行化的非标准的修正UTF-8编码。  UTF-8保存使用标准UTF-8和修正的UTF-8有两点不同:
  修正的UTF-8中,null字符编码成2个字节(1100000010000000)而不是标准的1个字节(00000000),这样作可以保证编码后的字符串中不会嵌入null字符。因此如果在类C语言中处理字符串,文本不会在第一个null字符时截断(C字符串以null结尾)。
  在标准UTF-8编码中,超出基本多语言范围(BMP-BasicMultilingualPlain)的字符被编码为4字节格式,但是在修正的UTF-8编码中,他们由代理编码对(surrogatepairs)表示,然后这些代理编码对在序列中分别重新编码。结果标准UTF-8编码中需要4个字节的字符,在修正后的UTF-8编码中将需要6个字节。
作者: 葛尧    时间: 2012-2-28 15:45
有些问题是需要自己动手查找百科的。

作者: 王--明    时间: 2012-2-28 17:59
吕猛 发表于 2012-2-28 12:26
百度百科:UTF-8

  java使用UTF-16表示内部文本,并支持用于字符串串行化的非标准的修正UTF-8编码。  UT ...

谢谢了。明白了:)
作者: 老罗    时间: 2012-2-29 00:19
王--明 发表于 2012-2-28 17:59
谢谢了。明白了

明白了就好
作者: 王--明    时间: 2012-2-29 09:38
谢谢老罗




欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2