黑马程序员技术交流社区

标题: 关于"联通"编码的问题? [打印本页]

作者: 王阳    时间: 2012-11-10 16:30
标题: 关于"联通"编码的问题?
public static void main(String[] args) {
          String str = "联通";

           byte [] arr = str.getBytes("gbk");
          for (byte b : arr) {
                        System.out.println(Integer.toBinaryString(b&255));
                }
        }

输出结果:
1100000110101010
11001101
10101000

今天看老毕的视频,说这段代码输出的结果有点类似UTF-8的编码形式,有点不理解,求解答。。

作者: 刘菲    时间: 2012-11-13 13:03
1.UTF-8可以用一个字节,两个字节或则三个字节来表示一个字符。
具体是通过UTF-8的头位信息来区分的。
头位是0,表示用一个字节
头位是110- - - -10- - - - - -,表示用两个字节
头位是1110- - - -10- - - - - -10- - - - - -,表示用三个字节
2.具体的楼主可以查阅api文档:
在java.io包中DataOutputStream 类中的writeUTF(String str)方法中UTF-8 修改版,
点击进去,里面写的很清楚。
3.此程序中的头字节刚好为110- - - - -10- - - - - - ,会被误用UTF-8来解码。
而原本却是用jbk编的码,所以会导致解码错误。
4.以上为本人理解,希望可以帮到楼主。
作者: 王阳    时间: 2012-11-13 20:14
谢谢,了解了。




欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2