准备知识:以前常用GB2312处理中文,现常用GBK,比GBK包含更多汉字,更新的是GB18030。Unicode是一种国际编码,它包含UTF-8、UTF-16、UTF-32三种方案。
实际情况:简体中文windows现都用GBK编码,港台流行Big5 码,英文国家自然用AscII码(或ISO-8859-1),世界上还存在其它编码。编码的不同,产生了乱码,一种国际编码---UNICODE 应运而生,它试图消灭乱码,一统天下。但它也有个缺点,就是比AscII码、GB码的存储空间大,因而其中的一种,不算耗空间、又世界通行的方案UTF-8,大热于天下---现大多数的网站都采用UTF-8编码,特别是国际性的。
大多数国际性的软件内部均采用UNICODE编码,在软件运行时,它获得本地支持系统(多数是操作系统)默认支持的编码格式,然后再将软件内部的UNICODE转化为本地系统默认支持的格式显示出来,Java就是如此(采用UNICODE编码)。 |