A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

© 简单ai... 中级黑马   /  2013-9-26 11:16  /  1918 人查看  /  4 人回复  /   0 人收藏 转载请遵从CC协议 禁止商业使用本文

本帖最后由 简单ai... 于 2016-3-26 01:27 编辑

复制代码



评分

参与人数 1技术分 +1 收起 理由
乔兵 + 1

查看全部评分

4 个回复

倒序浏览
在JAVA文件中硬编码中文字符,在eclipse中运行,控制台输出了乱码。

例如,我们在JAVA文件中写入以下代码:

String text = “大家好”;

System.out.println(text);

如果我们是在eclipse里编译运行,可能看到的结果是类似这样的乱码:????。那么,这是为什么呢?

我们先来看看整个字符的转换过程。

1. 在eclipse窗口中输入中文字符,并保存成UTF-8的JAVA文件。这里发生了多次字符编码转换。不过因为我们相信eclipse的正确性,所以我们不用分析其中的过程,只需要相信保存下的JAVA文件确实是UTF-8格式。

2. 在eclipse中编译运行此JAVA文件。这里有必要详细分析一下编译和运行时的字符编码转换。

- 编译:我们用javac编译JAVA文件时,javac不会智能到猜出你所要编译的文件是什么编码类型的,所以它需要指定读取文件所用的编码类型。默认 javac使用平台缺省的字符编码类型来解析JAVA文件。平台缺省编码是操作系统决定的,我们使用的是中文操作系统,语言区域设置通常都是中国大陆,所 以平台缺省编码类型通常是GBK。这个编码类型我们可以在JAVA中使用System.getProperty(“file.encoding”)来查 看。所以javac会默认使用GBK来解析JAVA文件。如果我们要改变javac所用的编码类型,就要加上-encoding参数,如javac -encoding utf-8 Test.java。

这里要另外提一下的是eclipse使用的是内置的编译器,并不能添加参数,如果要为javac添加参数则建议使用ANT来编译。不过这并非出现乱码的原因,因为eclipse可以为每个JAVA文件设置字符编码类型,而内置编译器会根据此设置来编译JAVA文件。

- 运行:编译后字符数据会以UNICODE格式存入字节码文件中。然后eclipse会调用java命令来运行此字节码文件。因为字节码中的字符总是 UNICODE格式,所以java读取字节码文件并没有编码转换过程。虚拟机读取文件后,字符数据便以UNICODE格式存储在内存中了。

3. 调用System.out.println来输出字符。这里又发生了字符编码转换。

System.out.println使用了PrintStream类来输出字符数据至控制台。PrintStream会使用平台缺省的编码方式来输出字 符。我们的中文系统上缺省方式为GBK,所以内存中的UNICODE字符被转码成了GBK格式,并送到了操作系统的输出服务中。因为我们操作系统是中文系统,所以往终端显示设备上打印字符时使用的也是GBK编码。如果到这一步,我们的字符如果不是GBK编码的话,终端就会显示出乱码。

那么,在eclipse运行带中文字符的JAVA文件,控制台显示了乱码,是在哪一步转换错误呢?我们一步步来分析。

    - 保存JAVA文件成UTF-8后,如果再次打开你没有看到乱码,说明这步是正确的。

    - 用eclipse本身来编译运行JAVA文件,应该没有问题。

   - System.out.println会把内存中正确的UNICODE字符解码成GBK,然后发到eclipse的控制台去。等等,我们看到在Run Configuration对话框的Common标签里,控制台的字符编码被设置成了UTF-8!问题就在这里。System.out.println已经把字符编码成了GBK,而控制台仍然以UTF-8的格式读取字符,自然会出现乱码。

     将控制台的字符编码设置为GBK,乱码问题解决。

(这里补充一点:eclipse的控制台编码是继承了workspace的设置的,通常控制台编码里没有GBK的选项而且不能输入。我们可以先在 workspace的编码设置中输入GBK,然后在控制台的设置中就可以看到GBK的选项了,设置好后再把workspace的字符编码设置改回utf- 8就是。)

评分

参与人数 1技术分 +1 收起 理由
乔兵 + 1 看好你,很给力!

查看全部评分

回复 使用道具 举报
暮雨 发表于 2013-9-26 11:27
在JAVA文件中硬编码中文字符,在eclipse中运行,控制台输出了乱码。

例如,我们在JAVA文件中写入以下代码 ...

我想知道创造输出流到文本,改变其编码格式,有什么方法没?目前是出来来的文本格式为GBK,但是如果我想将将输出流的文本编码格式改为其他格式可以怎么做?求大神指点

回复 使用道具 举报
xh396660787 发表于 2013-9-26 11:27
System.out.println(new String(tableTag.toHtml().getBytes("GB2312"),“GBK”));  ,这样可以吗? ...

这句代码是我抓取html文件标签用到 的转换方法,是可以的,我不知道输出流有没有这样的方法可以用,
有的话就太好了
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马