黑马程序员技术交流社区
标题:
编码解码问题
[打印本页]
作者:
马州州
时间:
2012-9-28 01:36
标题:
编码解码问题
import java.util.*;
class EncodeDemo
{
public static void main(String[] args) throws Exception
{
String s ="你好";
byte[] b1 = s.getBytes("GBK");
String s1 = new String(b1,"utf-8");
byte[] b2 = s1.getBytes("GBK");
String s2 = new String(b2,"utf-8");
}
}
上面程序第一次用GBK编码,但是解码的时候用utf-8解得,然后又用GBK编码,又用utf-8解码
怎么通过编码解码还原成“你好”
理论是完全行的通的,但是我转了老长时间还是“???”
作者:
孔肖
时间:
2012-9-28 10:23
首先,在编对了,解错的时候,要用解错的码再编回去,然后再用正确的码表解码。所以程序中后面再解回去的时候,
应该是 byte[] b2 = s1.getBytes("utf-8");
String s2 = new String(b2,"gbk");
但是,由于GBK和UTF-8码表都识别中文,所以这里还是会出现错误。如下,
public class Test
{
public static void main(String[] args) throws Exception
{
String s ="你好";
byte[] b1 = s.getBytes("gbk");
System.out.println("b1 = "+Arrays.toString(b1)); // 这里可以看看它的编码:[-60, -29, -70, -61]
String s1 = new String(b1,"utf-8");
System.out.println(s1); // 由于GBK和UTF-8都识别中文,所以在解码时:???
byte[] b2 = s1.getBytes("utf-8");
System.out.println("b2 = "+Arrays.toString(b2)); // 再用UTF-8编回去的时候:[-17, -65, -67, -17, -65, -67, -17, -65, -67] 拿到的源码已经发生的变化
String s2 = new String(b2,"gbk");
System.out.println(s2); // 所以再用GBK去解码时,是按照变化的源码进行解码的:锟斤拷锟?
}
但是使用ISO8859-1就不会出现混乱的情况。这里要特别注意GBK和UTF-8。
}
作者:
黑幕
时间:
2012-9-28 10:35
楼上回答真给力 句句带注释 好清晰
欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/)
黑马程序员IT技术论坛 X3.2