本帖最后由 贾波 于 2013-11-28 22:29 编辑
- public class Test {
- public static void main(String[] args) {
- try {
- byte[] unicodes = "a".getBytes("Unicode");
- System.out.println("unicodes=" + unicodes.length);
- for (int i = 0; i < unicodes.length; i++) {
- System.out.println(unicodes[i]);
- }
- } catch (UnsupportedEncodingException e) {
- // TODO Auto-generated catch block
- e.printStackTrace();
- }
- }
- }
复制代码 输出结果:
unicodes=4
-2
-1
0
97
在 Java 中直接使用 Unicode 转码时会按照 UTF-16LE 的方式拆分,并加上 BOM。
Unicode一个字符占两个字节。-2,-1是一个字节的BOM标志。
|