A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

© 王--明 黑马帝   /  2012-2-28 09:59  /  1654 人查看  /  5 人回复  /   0 人收藏 转载请遵从CC协议 禁止商业使用本文

UTF-8和UTF-8修改版有什么区别?昨天做了编码的问题,有点现问题,求解。

5 个回复

倒序浏览
百度百科:UTF-8

  java使用UTF-16表示内部文本,并支持用于字符串串行化的非标准的修正UTF-8编码。  UTF-8保存使用标准UTF-8和修正的UTF-8有两点不同:
  修正的UTF-8中,null字符编码成2个字节(1100000010000000)而不是标准的1个字节(00000000),这样作可以保证编码后的字符串中不会嵌入null字符。因此如果在类C语言中处理字符串,文本不会在第一个null字符时截断(C字符串以null结尾)。
  在标准UTF-8编码中,超出基本多语言范围(BMP-BasicMultilingualPlain)的字符被编码为4字节格式,但是在修正的UTF-8编码中,他们由代理编码对(surrogatepairs)表示,然后这些代理编码对在序列中分别重新编码。结果标准UTF-8编码中需要4个字节的字符,在修正后的UTF-8编码中将需要6个字节。
回复 使用道具 举报
有些问题是需要自己动手查找百科的。
回复 使用道具 举报
吕猛 发表于 2012-2-28 12:26
百度百科:UTF-8

  java使用UTF-16表示内部文本,并支持用于字符串串行化的非标准的修正UTF-8编码。  UT ...

谢谢了。明白了:)
回复 使用道具 举报
王--明 发表于 2012-2-28 17:59
谢谢了。明白了

明白了就好
回复 使用道具 举报
谢谢老罗
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马