在编码解码时应该注意的

吴上储

   应该来说，我们用什么编码表编码，解码的时候就用什么编码表解码。
比如：String s="北京";
      byte[] b1=s.getBytes("GBK");
      String s1=new String(b1,"GBK");
      System.out.println("s1="+s1);
但是如果我们解码的时候用了其它的编码表，那就得注意了。
比如：编码还用GBK，但解码时用了UTF-8。遇到这种情况，我们一般是对已解码的字符串再进行一次
UTF-8编码，然后用GBK再进行确码。但是GBK和UTF-8都能识别中文，也就是相同的中文在编码表中
都有相对应的数值。那再UTF-8编一次，再GBK解一次也得不到正确的中文。所以这种方法在两个编码表
都能识别中文的的码表中行不通。
但是如果我们用GBK编码，而用ISO8859-1解码时，也会出现？？？？这样的结果，那因为ISO8859-1不能识别中文，那么我们就可以对用ISO8859-1解码后的？？？？字符串再进行一次ISO8859-1编码，然后再用GBK进行一次解码，这样就会解出正确的中文来了。
所以，我们撑握这种方法的时候一定要注意当我们解码错误的时候，我们应该明确我们是用什么编表解码的，是识别中文的还是不识别中文的，这样我们才能在解码错误时，快速的找到正确的方法去解决问题

为梦而战 · 为梦而战

本帖最后由为梦而战于 2011-12-27 21:53 编辑

GBK的特点是：两个字节代表一个中文
UTF-8的特点是：三个字节代表一个中文
需要补充的是：UTF-8有自己的标头，通过这个标头来判断是一次读一个字节去查表，还是一次读二个字节去查表，还是一次读三个字节去查表。

为梦而战 · 为梦而战

:handshake

刘基军 · 刘基军

支持一下，讲的挺好的，呵呵

罗全涛 · 罗全涛

讲的很好，和视频里讲的原理一样，支持一下。

为梦而战 · 为梦而战

monghuan 发表于 2011-12-29 11:22
支持一下，讲的挺好的，呵呵

:handshake

为梦而战 · 为梦而战

罗全涛发表于 2011-12-29 12:44
讲的很好，和视频里讲的原理一样，支持一下。

:handshake

帐号		自动登录	找回密码
密码			加入黑马

在编码解码时应该注意的

评分

6 个回复

浏览过的版块

黑马骑士勋章