黑马程序员技术交流社区

标题: java一般都是采用什么样的编码呀? [打印本页]

作者: 荣凯旋    时间: 2012-1-14 11:52
标题: java一般都是采用什么样的编码呀?
本帖最后由 荣凯旋 于 2012-1-14 14:41 编辑

java一般都是采用什么样的编码呀? ASK11   unicode 等等 还有系统默认的编码是什么呢??
作者: 彭嘉聪    时间: 2012-1-14 12:20
利用
Properties p = System.getProperties();
并打印出来
就可以找到系统的信息
才用的是GBK编码
作者: 宋双    时间: 2012-1-14 12:52
常用的字符编码方式有ISO8859_1、GB2312、GBK、UTF-8/UTF-16/UTF-32。
ISO8859_1用来编码拉丁文,它由单字节(0-255)组成。
GB2312、GBK用来编码简体中文,它有单字节和双字节混合组成。最高位为1的字节和下一个字节构成一个汉字,最高位为0的字节是ASCII码。
UTF-8/UTF-16/UTF-32是国际标准UNICODE的编码方式。 用得最多的是UTF-8,主要是因为它在对拉丁文编码时节约空间。

作者: 祁焱    时间: 2012-1-14 13:34
系统默认编码是GBK,IO中的一些流对象可以指定具体的字符编码,具体你可以参见毕老师IO中字符编码的讲解。
作者: 荣凯旋    时间: 2012-1-14 14:40
谢谢啦哥们 欧拉
作者: 李晓军    时间: 2012-1-21 00:25
常用的有GBK和UTF-8,系统默认使用GBK,具体区别如下:
ASCII:英文码表,每个字符占1个字节。A是65,a是97,0是48
GB2312:兼容ASCII,包含中文,每个英文占1个字节(正数),中文占2个字节(2个负数)。
GBK、GB18030:兼容GB2312,包含更多中文,每个英文占1个字节(正数),中文占2个字节(第一个负数、第二个可正可负)。
Unicode:国际码表,每个字符占2个字节。Java中存储字符类型就是使用的Unicode编码。
UTF-8:国际码表,英文占1个字节,中文占3个字节。

作者: 黄秋    时间: 2012-1-21 04:03
准备知识:以前常用GB2312处理中文,现常用GBK,比GBK包含更多汉字,更新的是GB18030。Unicode是一种国际编码,它包含UTF-8、UTF-16、UTF-32三种方案。

实际情况:简体中文windows现都用GBK编码,港台流行Big5 码,英文国家自然用AscII码(或ISO-8859-1),世界上还存在其它编码。编码的不同,产生了乱码,一种国际编码---UNICODE 应运而生,它试图消灭乱码,一统天下。但它也有个缺点,就是比AscII码、GB码的存储空间大,因而其中的一种,不算耗空间、又世界通行的方案UTF-8,大热于天下---现大多数的网站都采用UTF-8编码,特别是国际性的。
  大多数国际性的软件内部均采用UNICODE编码,在软件运行时,它获得本地支持系统(多数是操作系统)默认支持的编码格式,然后再将软件内部的UNICODE转化为本地系统默认支持的格式显示出来,Java就是如此(采用UNICODE编码)。




欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2