A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

© 张明星 中级黑马   /  2012-3-28 09:50  /  1932 人查看  /  6 人回复  /   0 人收藏 转载请遵从CC协议 禁止商业使用本文

字符编码那部分,什么时候使用的是UTF-8,什么时候使用的是UTF-8修改版?有点乱

6 个回复

倒序浏览
utf-8一个汉字占用两个字节,一个英文占用两个字节
utf-8可以在全球所有的地方使用。
如果做的是简体中文的用gb2312可以省空间。
gb2312一个汉字占用两个字节,一个英文占用一个字节
回复 使用道具 举报
UTF_8是国际通用的编码,至于什么时候用,要看你的平台支持的编码格式。
回复 使用道具 举报
好像记得视频有说过  至于用什么编码 不是由你决定的  看平台 和要求  你只是被动的
回复 使用道具 举报
标准UTF-8和修正的UTF-8有两点不同:   
修正的UTF-8中,null字符编码成2个字节(1100000010000000)而不是标准的1个字节(00000000),这样作可以保证编码后的字符串中不会嵌入null字符。因此如果在类C语言中处理字符串,文本不会在第一个null字符时截断(C字符串以null结尾)。   在标准UTF-8编码中,超出基本多语言范围(BMP-BasicMultilingualPlain)的字符被编码为4字节格式,但是在修正的UTF-8编码中,他们由代理编码对(surrogatepairs)表示,然后这些代理编码对在序列中分别重新编码。结果标准UTF-8编码中需要4个字节的字符,在修正后的UTF-8编码中将需要6个字节。
回复 使用道具 举报
每个国家对自己的文字都有一套编码方式,utf-8集合了所有的编码方式,因此又被称为万国码。
我们国家汉子的码表是gbk以及后来出现包含更多汉子的gb2312,gb18030等.我在应用jsp时用默认的utf-8编码
经常出现乱码,多改成gbk。
至于UTF8修正版,主要有两点不同:
一,null字符编码成2个字节(1100000010000000)而不是标准的1个字节(00000000)。
二,在标准UTF-8编码中,超出基本多语言范围(BMP-BasicMultilingualPlain)的字符被编码为4字节格式,但是在修正的UTF-8编码中,他们由代理编码对(surrogatepairs)表示,然后这些代理编码对在序列中分别重新编码。
看具体情况,来确定用哪种编码方式。
回复 使用道具 举报
袁野 黑马帝 2012-3-28 23:15:06
7#
看需求啦
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马