A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

© 为梦而战 黑马帝   /  2011-12-27 21:23  /  2389 人查看  /  6 人回复  /   0 人收藏 转载请遵从CC协议 禁止商业使用本文

     应该来说,我们用什么编码表编码,解码的时候就用什么编码表解码。
比如:String s="北京";
         byte[] b1=s.getBytes("GBK");
         String s1=new String(b1,"GBK");
         System.out.println("s1="+s1);
但是如果我们解码的时候用了其它的编码表,那就得注意了。
比如:编码还用GBK,但解码时用了UTF-8。遇到这种情况,我们一般是对已解码的字符串再进行一次
UTF-8编码,然后用GBK再进行确码。但是GBK和UTF-8都能识别中文,也就是相同的中文在编码表中
都有相对应的数值。那再UTF-8编一次,再GBK解一次也得不到正确的中文。所以这种方法在两个编码表
都能识别中文的的码表中行不通。
    但是如果我们用GBK编码,而用ISO8859-1解码时,也会出现????这样的结果,那因为ISO8859-1不能识别中文,那么我们就可以对用ISO8859-1解码后的????字符串再进行一次ISO8859-1编码,然后再用GBK进行一次解码,这样就会解出正确的中文来了。
    所以,我们撑握这种方法的时候一定要注意当我们解码错误的时候,我们应该明确我们是用什么编表解码的,是识别中文的还是不识别中文的,这样我们才能在解码错误时,快速的找到正确的方法去解决问题



评分

参与人数 1技术分 +1 收起 理由
吴上储 + 1 赞一个!

查看全部评分

6 个回复

倒序浏览
本帖最后由 为梦而战 于 2011-12-27 21:53 编辑

GBK的特点是:两个字节代表一个中文
UTF-8的特点是:三个字节代表一个中文
需要补充的是:UTF-8有自己的标头,通过这个标头来判断是一次读一个字节去查表,还是一次读二个字节去查表,还是一次读三个字节去查表。
回复 使用道具 举报
:handshake
回复 使用道具 举报
支持一下,讲的挺好的,呵呵
回复 使用道具 举报
讲的很好,和视频里讲的原理一样,支持一下。
回复 使用道具 举报
monghuan 发表于 2011-12-29 11:22
支持一下,讲的挺好的,呵呵

:handshake
回复 使用道具 举报
罗全涛 发表于 2011-12-29 12:44
讲的很好,和视频里讲的原理一样,支持一下。

:handshake
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马