黑马程序员技术交流社区

标题: 编码解码问题 [打印本页]

作者: 马州州    时间: 2012-9-28 01:36
标题: 编码解码问题
import java.util.*;
class EncodeDemo
{
        public static void main(String[] args) throws Exception
        {
                String s ="你好";
                byte[] b1 = s.getBytes("GBK");
                String s1 = new String(b1,"utf-8");
                byte[] b2 = s1.getBytes("GBK");
                String s2 = new String(b2,"utf-8");
       }
}
上面程序第一次用GBK编码,但是解码的时候用utf-8解得,然后又用GBK编码,又用utf-8解码
怎么通过编码解码还原成“你好”
理论是完全行的通的,但是我转了老长时间还是“???”

作者: 孔肖    时间: 2012-9-28 10:23
首先,在编对了,解错的时候,要用解错的码再编回去,然后再用正确的码表解码。所以程序中后面再解回去的时候,
应该是  byte[] b2 = s1.getBytes("utf-8");      
            String s2 = new String(b2,"gbk");

但是,由于GBK和UTF-8码表都识别中文,所以这里还是会出现错误。如下,
public class Test
{
   public static void main(String[] args) throws Exception
   {
       String s ="你好";
       byte[] b1 = s.getBytes("gbk");
       System.out.println("b1 = "+Arrays.toString(b1));  // 这里可以看看它的编码:[-60, -29, -70, -61]
       String s1 = new String(b1,"utf-8");
       System.out.println(s1); // 由于GBK和UTF-8都识别中文,所以在解码时:???
      
       byte[] b2 = s1.getBytes("utf-8");      
       System.out.println("b2 = "+Arrays.toString(b2)); // 再用UTF-8编回去的时候:[-17, -65, -67, -17, -65, -67, -17, -65, -67]  拿到的源码已经发生的变化
       String s2 = new String(b2,"gbk");
       System.out.println(s2); // 所以再用GBK去解码时,是按照变化的源码进行解码的:锟斤拷锟?
  }

但是使用ISO8859-1就不会出现混乱的情况。这里要特别注意GBK和UTF-8。
}

作者: 黑幕    时间: 2012-9-28 10:35
楼上回答真给力 句句带注释 好清晰




欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2