常见码表简介:
ASCII:美国标准信息交换码。
用一个字节的7位可以表示。
ISO8859-1:拉丁码表。欧洲码表
用一个字节的8位表示。
GB2312:中国的中文编码表
GBK:中国的中文编码表的升级,融合了更多的中文文字符号。
Unicode:国际标准码,融合了多种文字。
所有文字都用两个字节来表示,java语言使用的就是Unicode
UTF-8:最多用三个字节表示一个字符
Java默认的是GBK码表。
接触频率比较高的两个码表是:GBK和UTF-8两个码表。
在GBK码表中,一个汉子占用两个字节;
在UTF-8中,一个汉子占用三个字节。
编码:字符串变字节数组。所用的方法:String——>byte[]:用str.getBytes(charsetName)
解码:字节数组变字符串。所用的方法:byte[]——>String:用new String(byte[],charsetName);
而涉及到编码解码的两个IO流是:
InputStreamReader;
OutputStreamWriter;
|
|