javaIO流读取UTF-8的文本为什么开头有个乱码

本帖最后由杨震于 2012-9-11 10:03 编辑

import java.io.*;

public class FileWriterDemo {
      public static void main(String[] args) throws IOException {
            //使用FileRead的read方法读入并输出每次读的数据十六进制表示
            Reader p1 = new InputStreamReader(new FileInputStream("文档.txt"), "UTF-8");
            int p11 = 0;
            while ((p11 = p1.read()) != -1) {
                     System.out.println((char)p11);
            }
            p1.close();
   }
}
我去一个UTF-8编码的文本，开头总是有个乱码，不知道怎么回事

杨震 · 杨震

包含有汉字，用GBK可以，为什么用UTF-8就不行了，我这里Reader p1 = new InputStreamReader(new FileInputStream("文档.txt"), "UTF-8");
是用ＵＴＦ-8来读的啊，为什么开始一个总是问号，就是多一个问号在前面

AngieFans85 · AngieFans85

你的文档.txt的保存的编码形式一定不是utf-8的,所以出现汉字就会乱码.

杨震 · 杨震

马镱洵发表于 2012-9-11 11:23
你的文档.txt的保存的编码形式一定不是utf-8的,所以出现汉字就会乱码.

我文档里面保存的是UTF-8,就是开头是乱的

比如说文件里是：严严严
输出来是：?严严严

你试试看

AngieFans85 · AngieFans85

杨震发表于 2012-9-11 11:29
我文档里面保存的是UTF-8,就是开头是乱的

比如说文件里是：严严严

读取utf-8的格式的文件内容,首位会多一个?,其实你只要在读取之前先读一个字符就可以了:

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.Reader;
import java.io.UnsupportedEncodingException;
public class FileWriterDemo {
public static void main(String[] args) {
// 使用FileRead的read方法读入并输出每次读的数据十六进制表示
Reader p1 = null;
try {
p1 = new InputStreamReader(new FileInputStream("D:/文档.txt"),
"utf-8");
int p11 = 0;
char[] cs = new char[2];
// 这是先读一个字符
p1.read();
while ((p11 = p1.read(cs)) != -1) {
String str = new String(cs, 0, p11);
System.out.print(str);
}
} catch (UnsupportedEncodingException e) {
e.printStackTrace();
} catch (FileNotFoundException e) {
e.printStackTrace();
} catch (IOException e) {
e.printStackTrace();
} finally {
try {
p1.close();
} catch (IOException e) {
e.printStackTrace();
}
}
}
}

复制代码

杨震 · 杨震

我就是想知道为什么会这样？按正常读取为什么会多一个?，而非要用非正常手段

AngieFans85 · AngieFans85

杨震发表于 2012-9-11 11:48
我就是想知道为什么会这样？按正常读取为什么会多一个?，而非要用非正常手段 ...

你只要知道读取utf-8格式的文档内容是个例外就可以了,要问为什么,那就要去熟悉utf-8编码的知识.

帐号		自动登录	找回密码
密码			加入黑马

javaIO流读取UTF-8的文本为什么开头有个乱码

7 个回复