每个中文都占用两个字节, 如果一个一个读取肯定会乱码, 不是乱码而是会出现半个汉字这个现象。给你我的代码你看一下吧
public class Test10 {
public static void main(String[] args) throws Exception{
String str = "我爱kfc并且喜欢dota";
int num = trimGBK(str.getBytes("GBK"),8);//将字符串使用“GBK”编码,并定义截取长度
System.out.println(str.substring(0,num) );//打印输出
}
public static int trimGBK(byte[] buf,int n){ //定义方法
int num = 0;
boolean bChineseFirstHalf = false; //如果是一半汉字就返回false
for(int i=0;i<n;i++)
{
if(buf[i]<0 && !bChineseFirstHalf){ //判断是否是汉字
bChineseFirstHalf = true;
}else{
num++;
bChineseFirstHalf = false;
}
}
return num;
}
}
|