应该来说,我们用什么编码表编码,解码的时候就用什么编码表解码。
比如:String s="北京";
byte[] b1=s.getBytes("GBK");
String s1=new String(b1,"GBK");
System.out.println("s1="+s1);
但是如果我们解码的时候用了其它的编码表,那就得注意了。
比如:编码还用GBK,但解码时用了UTF-8。遇到这种情况,我们一般是对已解码的字符串再进行一次
UTF-8编码,然后用GBK再进行确码。但是GBK和UTF-8都能识别中文,也就是相同的中文在编码表中
都有相对应的数值。那再UTF-8编一次,再GBK解一次也得不到正确的中文。所以这种方法在两个编码表
都能识别中文的的码表中行不通。
但是如果我们用GBK编码,而用ISO8859-1解码时,也会出现????这样的结果,那因为ISO8859-1不能识别中文,那么我们就可以对用ISO8859-1解码后的????字符串再进行一次ISO8859-1编码,然后再用GBK进行一次解码,这样就会解出正确的中文来了。
所以,我们撑握这种方法的时候一定要注意当我们解码错误的时候,我们应该明确我们是用什么编表解码的,是识别中文的还是不识别中文的,这样我们才能在解码错误时,快速的找到正确的方法去解决问题
|