编程题：截取有汉字的字符串的函数 - 黑马程序员技术交流社区

package com.zakisoft.ch;
public class IsChineseOrNot {
// GENERAL_PUNCTUATION 判断中文的“号
// CJK_SYMBOLS_AND_PUNCTUATION 判断中文的。号
// HALFWIDTH_AND_FULLWIDTH_FORMS 判断中文的，号
private static final boolean isChinese(char c) {
Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
if (ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS
|| ub == Character.UnicodeBlock.CJK_COMPATIBILITY_IDEOGRAPHS
|| ub == Character.UnicodeBlock.CJK_UNIFIED_IDEOGRAPHS_EXTENSION_A
|| ub == Character.UnicodeBlock.GENERAL_PUNCTUATION
|| ub == Character.UnicodeBlock.CJK_SYMBOLS_AND_PUNCTUATION
|| ub == Character.UnicodeBlock.HALFWIDTH_AND_FULLWIDTH_FORMS) {
return true;
}
return false;
}
public static final boolean isChinese(String strName) {
char[] ch = strName.toCharArray();
for (int i = 0; i < ch.length; i++) {
char c = ch[i];
if (isChinese(c)) {
return true;
}
}
return false;
}
public static void main(String[] args) {
System.out.println(isChinese("き"));
System.out.println(isChinese("test,.?!%^&*(){}[]"));
System.out.println(isChinese("测试"));
System.out.println(isChinese("“测试”，。？！%……&*（）——{}【】”"));
}
public static final boolean isChineseCharacter(String chineseStr) {
char[] charArray = chineseStr.toCharArray();
for (int i = 0; i < charArray.length; i++) {
if ((charArray[i] >= 0x4e00) && (charArray[i] <= 0x9fbb)) {
return true;
}
}
return false;
}
/**
* @deprecated; 弃用。和方法isChineseCharacter比效率太低。
* */
public static final boolean isChineseCharacter_f2() {
String str = "！？";
for (int i = 0; i < str.length(); i++) {
if (str.substring(i, i + 1).matches("[\\u4e00-\\u9fbb]+")) {
return true;
}
}
return false;
}
}

复制代码

public static String splitString(String str,int byteLength) {
//如果字符串为空或者长度为0，则返回原串
if(str==null||str.length()==0)
return str;
//定义字节数组来存经GBK转换后的 byte序列
byte[] strByte = null;
try {
strByte = str.getBytes("GBK");
} catch (UnsupportedEncodingException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
//定义存储要截取段汉字字节数，初始化为0
int wordCount = 0;
//统计截取段所含有的汉字字节数
for(int i = 0;i <byteLength;i++){
int num = strByte[i];//num小于零是汉字，汉字通过strByte方法取出之后是小于零的
// 如果是汉字(负)，则统计截取字符串中的汉字所占字节数
if(num < 0){
wordCount++;
}
}
//如果汉字占奇数个字节数，则说明要截取了半个汉字,应当做是一个来处理
if(wordCount % 2 == 1)
wordCount = wordCount + 1;
//subString 的截取长度应该为要截取的字节数-其中包括的汉字个数（wordCount/2）
return str.substring(0, (byteLength-(wordCount/2)));
}
public static void main(String[] args) {
//定义一个字符串
String str = "我ABC汉DEF";
System.out.println(splitString(str,7));
}

复制代码