为兼容各国地区,java的确是用了unicode码。 但你本地默认了一个编码,中国的大部分就是GBK了,这个好像叫做本地化编码。各国的本地化编码是不同的,java的unicode码只起到桥梁的作用。
例如: 日本的本地化编码是 ribm(假设的),它有自己的编码表。那么我们中国上日本的网站,怎么能识别日文呢,GBK也包含日文的,但与日本的ribm不能对应,这就会出现乱码。怎么办呢,unicode码国际通用编码,包含了几乎所有世界通用文字,是要把日本文字———编成unicode编码———再转换成中文GBK编码,这样,日本的文字就可以在中国这边正确的显示出来。
在java中也一样,为了兼容性,所有字符都先转成unicode编码再转换成本地编码,也就是我们用的GBK编码。毕老师说了,他为了解释简便就把中间的unicode转换过程一笔带过了,其实中间还有一个转换编码的过程。
|