黑马程序员技术交流社区

标题: 在编码解码时应该注意的 [打印本页]

作者: 为梦而战    时间: 2011-12-27 21:23
标题: 在编码解码时应该注意的
     应该来说,我们用什么编码表编码,解码的时候就用什么编码表解码。
比如:String s="北京";
         byte[] b1=s.getBytes("GBK");
         String s1=new String(b1,"GBK");
         System.out.println("s1="+s1);
但是如果我们解码的时候用了其它的编码表,那就得注意了。
比如:编码还用GBK,但解码时用了UTF-8。遇到这种情况,我们一般是对已解码的字符串再进行一次
UTF-8编码,然后用GBK再进行确码。但是GBK和UTF-8都能识别中文,也就是相同的中文在编码表中
都有相对应的数值。那再UTF-8编一次,再GBK解一次也得不到正确的中文。所以这种方法在两个编码表
都能识别中文的的码表中行不通。
    但是如果我们用GBK编码,而用ISO8859-1解码时,也会出现????这样的结果,那因为ISO8859-1不能识别中文,那么我们就可以对用ISO8859-1解码后的????字符串再进行一次ISO8859-1编码,然后再用GBK进行一次解码,这样就会解出正确的中文来了。
    所以,我们撑握这种方法的时候一定要注意当我们解码错误的时候,我们应该明确我们是用什么编表解码的,是识别中文的还是不识别中文的,这样我们才能在解码错误时,快速的找到正确的方法去解决问题




作者: 为梦而战    时间: 2011-12-27 21:41
本帖最后由 为梦而战 于 2011-12-27 21:53 编辑

GBK的特点是:两个字节代表一个中文
UTF-8的特点是:三个字节代表一个中文
需要补充的是:UTF-8有自己的标头,通过这个标头来判断是一次读一个字节去查表,还是一次读二个字节去查表,还是一次读三个字节去查表。
作者: 为梦而战    时间: 2011-12-28 21:08
:handshake
作者: 刘基军    时间: 2011-12-29 11:22
支持一下,讲的挺好的,呵呵
作者: 罗全涛    时间: 2011-12-29 12:44
讲的很好,和视频里讲的原理一样,支持一下。
作者: 为梦而战    时间: 2011-12-29 23:57
monghuan 发表于 2011-12-29 11:22
支持一下,讲的挺好的,呵呵

:handshake
作者: 为梦而战    时间: 2011-12-29 23:58
罗全涛 发表于 2011-12-29 12:44
讲的很好,和视频里讲的原理一样,支持一下。

:handshake




欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2