概念:
1, 模式匹配:就是检索与指定模式匹配的字符串。Java提供了专门进行模式匹配的类,在java.util.regex。
1) 建立模式对象:
使用Pattern类创建一个对象,称为模式对象。它调用类方法compile(String pattern)完成这一任务,参数pattern是一个正则表达式,称为模式对象使用的模式。若pattern指定的正则表达式有错,compile方法将抛出异常,PatternSyntaxException。
Pattern类可以调用类方法compile(String regex,int flag)返回一个pattern对象,
2) 建立匹配对象
模式对象调用方法matcher(CharSequence input);返回一个Matcher对象m,称为匹配对象,参数input可以是任何实现了CharSequence接口的类创建的对象。String和StringBuffer类都使用了CharSequence接口。
Matcher 对象可以使用3个方法寻找参数Input指定的字符序列中是否有与模式pattern匹配的子序列。
a) public boolean find();寻找input中第一个与模式pattern匹配的子序列,若find()返回true,m调用start()和end()可以得到该匹配模式子序列在input中的开始位置和结束位置。
b) public boolean matches();判断input是否完全与pattern匹配
c) public Boolean lookingAt();判断从input开始位置是否有与pattern匹配的子序列。若返回True, m调用start()和end()可以得到lookingAt()方法找到的匹配模式子序列在input中的开始位置和结束位置。
d) public Boolean find(int start);
e) public string replaceAll(String replacement);
f) public String replaceFirst(String replacement);
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class TestPattern {
public static void main(String[] args) {
Pattern p ;
Matcher m ;
String s1 = "0A1A2A3A4A5A6A7A8A9";
p = Pattern.compile("\\dA\\d");
m = p.matcher(s1);
System.out.println("matches1:"+m.matches());
while (m.find()) {
String str = m.group();
System.out.println("从"+m.start()+"到"+m.end()+"匹配模式子序列:");
System.out.println(str);
}
String temp = m.replaceAll("***");
System.out.println(temp);
System.out.println(s1);
m = p.matcher("9A0A0A3");
if (m.matches()) {
String str = m.group();
System.out.println(str);
System.out.println("matches:"+m.matches());
System.out.println("find:"+m.find());
}else {
System.out.println("不完全匹配!");
}
if (m.lookingAt()) {
String str = m.group();
System.out.println(str);
}
}
}
元字符模式:
在正则表达式中可以使用一对方括号扩起来的若干个字符,代表方括号中的任何一个字符。例如pattern=” [123]abc”,那么“1acb”、“2abc”、“3abc”都是与pattern 匹配的字符序列。
[abc] 代表abc中任何一个。
[^abc] 代表处理abc以外的任何字符。
[a-d] 代表a到d 的任何一个。
中括号里可以嵌套中括号,可以进行并,交,差运算。
[a-d[m-p]]代表a到d,或者M-p中任何字符(并)。
[a-z&&[def]]代表d,e,f中任何一个(交)。
[a-f&&[^bc]]代表a,d,e,f(差)。
元字符
正则表达式中的写法
意义
.
“.”
代表任何一个字符
\d
“\\d”
0-9任何一个数字
\D
“\\D”
任何一个非数字字符
\s
“\s”
空格类字符:‘\t’’\n’ ‘\x0B’ ,’\f’,’\r’
\S
“\S”
非空格类字符
\w
“\w”
可用以标识符的字符(不含$)
\W
“\W”
不能用于标识符的字符
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class YuanZiFuPattern {
public static void main(String[] args) {
Pattern p;
Matcher m;
String s1 = "23&12$A69Q90W";
p = Pattern.compile("[24680][13579]\\w");
m = p.matcher(s1);
while (m.find()) {
String str = m.group();
System.out.println("1:从"+m.start()+"到"+m.end()+"匹配模式子序列");
System.out.println(str);
}
String s2 = "as27Aiu86Adfs";
p = Pattern.compile("[1-9&&[^46]A][^234]");
m = p.matcher(s2);
while (m.find()) {
String str = m.group();
System.out.println("2:从"+m.start()+"到"+m.end()+"匹配模式子序列");
System.out.println(str);
}
}
}
模式的逻辑或
模式可以使用位运算符“|”进行逻辑或运算,得到一个新模式。
import java.util.regex.Matcher;
import java.util.regex.Pattern;
public class MoShiHuo {
public static void main(String[] args) {
Pattern p;
Matcher m;
String s1 = "loveyouhatemelove123jkjhate999love888";
p = Pattern.compile("love\\w{3}|hate\\w{2}");
m = p.matcher(s1);
while (m.find()) {
String str = m.group();
System.out.println("从"+m.start()+"到"+m.end()+"匹配模式子序列:");
System.out.println(str);
}
}
} |
|