本帖最后由 liukun11 于 2017-8-30 17:37 编辑
在 【重庆校区】WEB中文乱码总结(上) 中已经对 GET 请求中文乱码的前两种方式做了介绍,那么接下来继续对 GET 请求的剩下一种方式以及 POST 请求的中文乱码解决方式作一个总结。 3. 通过 String 的构造方法。 1
| String name = new String(request.getParameter("name").getBytes("IOS-8859-1"),"UTF-8");
|
代码解释: 无论从浏览器提交时中文参数是什么编码格式,到达服务器时因为 Tomcat 编码方式的原因,采用 ISO-8859-1 的方式给解析成了乱码
request.getParameter(“name”) 获取到的就是一个通过 ISO-8859-1 方式解析之后的乱码,那么我们通过 getBytes(“ISO-8859-1”) 将它反解成原有编码的字符数组,相当于打回原形,这是一个正确的字符数组,然后通过 String 的构造方法将这个正确的字符数组转成 UTF-8 编码的字符串。因为代码相对简单,因此通常采用这种方式。
POST请求中文参数乱码解决
对于 POST 方式,表单中的参数值对是通过 request body 发送给服务器,此时浏览器会根据网页的 ContentType(“text/html; charset=编码”) 中指定的编码进行对表单中的数据进行编码,然后发给服务器。POST 的参数是在请求体中,直接到达后台,数据在 Servlet 中的 request 中。request 有一个缓冲区,request 的缓冲区采用的是 ISO-8859-1 编码,因为 requeset 是 Tomcat 负责创建的,所以用的是 Tomcat 的编码。解决方式是设置 request 缓冲区编码。在服务器端的程序中我们可以通过 request 对象 的 setCharacterEncoding 方法设置编码,然后通过 request 对象的 getParameter 获得正确的数据。 1
2
| request.setCharacterEncoding("UTF-8");
String value = requst.getParameter("name");
| 响应中文乱码通常情况我们都是通过 HttpServletResponse 对象向页面进行响应,HttpServletResponse 有两种响应方式,一种是 OutputStream 字节流,另一种是 PrintWriter 字符流。是否会出现中文乱码,以及乱码解决方式跟采用的流的类型有关。 字节流使用字节流不一定会出现中文乱码,取决于操作系统,工作空间以及浏览器打开页面时采用的编码。如果两端编码一致,则不会出现中文乱码,不一致则出现乱码。
1
2
| response.getOutPutStream.write("中文".getBytes("UTF-8"));
response.setHeader("Content-Type","text/html;charset=UTF-8");
|
总之是设置输出时的字节数组编码和浏览器解析时的编码一致。中文转成字节数组的时候,如果 IDE 工作空间的编码正好和浏览器一致,可以不用设置字符数组取出时的编码,但是为了保险起见,建议还是设置。 字符流使用字符流一定会出现中文乱码,HttpServletResponse 使用的字符流是有缓冲区的,缓冲区使用的默认编码是 IOS-8859-1,压根儿就不支持中文。
1
2
3
| response.setCharacterEncoding("UTF-8");
response.setHeader("Content-Type","text/html;charset=UTF-8");
response.getWriter().println("中文");
|
简化写法 1
2
| response.setContentType("text/html;charset=UTF-8");
response.getWriter().println("中文");
|
文件下载时的中文文件名乱码处理文件下载前,文件名一般是以 GET 请求方式的参数直接出现在浏览器的地址栏也就是 URL 中的,所以需要先通过解决 GET 请求中文乱码的方式将中文文件名接收成正常的中文。 在下载开始时,需要设置文件保存时采用的文件名,不同浏览器因为特性的不同需要分别设置,如 IE 等内核的浏览器要求 Content-Disposition 响应头中的中文文件名需要通过 URLEncoder 进行编码,而火狐浏览器要求 Content-Disposition 响应头中的中文文件名需要通过 Base64 进行编码。所以要通过请求头中的 User-Agent 头信息获取到浏览器类型后分别处理。 1
2
3
4
5
6
7
8
9
10
11
| // 1.接收参数,解决 GET 请求参数中文乱码,目的是将中文文件名转成正常中文
String filename = new String(request.getParameter("filename").getBytes("ISO-8859-1"),"UTF-8");
// 根据浏览器的类型处理保存的中文文件名的乱码问题:
String agent = request.getHeader("User-Agent");
if(agent.contains("Firefox")){
filename = base64EncodeFileName(filename);
}else{
filename = URLEncoder.encode(filename,"UTF-8");
}
// 2.2设置Content-Disposition头
response.setHeader("Content-Disposition", "attachment;filename="+filename);
|
通过 Base64 编码中文文件名的方法代码如下: 1
2
3
4
5
6
7
8
9
10
11
12
| // 参数为中文文件名
public static String base64EncodeFileName(String fileName) {
BASE64Encoder base64Encoder = new BASE64Encoder();
try {
return "=?UTF-8?B?"
+ new String(base64Encoder.encode(fileName
.getBytes("UTF-8"))) + "?=";
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
throw new RuntimeException(e);
}
}
|
|