黑马程序员技术交流社区
标题: Java正则表达式基础知识 [打印本页]
作者: 郭孟涛 时间: 2013-1-26 05:45
标题: Java正则表达式基础知识
你可以从比较简单的东西入手学习正则表达式。要想全面地掌握怎样构建正则表达式,可以去看JDK 文档的java.util.regex 的Pattern 类的文档。
字符 |
B | 字符B |
\xhh | 16进制值0xhh 所表示的字符 |
\uhhhh | 16进制值0xhhhh 所表示的Unicode字符 |
\t | Tab |
\n | 换行符 |
\r | 回车符 |
\f | 换页符 |
\e | Escape |
正则表达式的强大体现在它能定义字符集(character class)。下面是一些最常见的字符集及其定义的方式,此外还有一些预定义的字符集:
字符集 |
. | 表示任意一个字符 |
[abc] | 表示字符a ,b ,c 中的任意一个(与a|b|c 相同) |
[^abc] | 除a ,b ,c 之外的任意一个字符(否定) |
[a-zA-Z] | 从a 到z 或A 到Z 当中的任意一个字符(范围) |
[abc[hij]] | a,b,c,h,i,j 中的任意一个字符(与a|b|c|h|i|j 相同)(并集) |
[a-z&&[hij]] | h,i,j 中的一个(交集) |
\s | 空格字符(空格键, tab, 换行, 换页, 回车) |
\S | 非空格字符([^\s] ) |
\d | 一个数字,也就是[0-9] |
\D | 一个非数字的字符,也就是[^0-9] |
\w | 一个单词字符(word character),即[a-zA-Z_0-9] |
\W | 一个非单词的字符,[^\w] |
如果你用过其它语言的正则表达式,那么你一眼就能看出反斜杠的与众不同。在其它语言里,"\\ "的意思是"我只是要在正则表达式里插入一个反斜杠。没什么特别的意思。"但是在Java里,"\\ "的意思是"我要插入一个正则表达式的反斜杠,所以跟在它后面的那个字符的意思就变了。"举例来说,如果你想表示一个或更多的"单词字符",那么这个正则表达式就应该是"\\w+ "。如果你要插入一个反斜杠,那就得用"\\\\ "。不过像换行,跳格之类的还是只用一根反斜杠:"\n\t"。
这里只给你讲一个例子;你应该JDK 文档的java.util.regex.Pattern 加到收藏夹里,这样就能很容易地找到各种正则表达式的模式了。
原来\t \n这些是正则表达式里面
matches方法可以判断当前的字符串是否匹配给定的正则表达式。如果匹配,返回true,否则,返回false。matches方法的定义如下:
public boolean matches(String regex)
如上面给出的正则表达式我们可以用如下程序验证。
String[] ss = new String[]{"a98b", "c0912d", "c10b", "a12345678d", "ab"};
for(String s: ss)
System.out.println(s.matches("[ac]\\d*[bd]"));
输出结果:
true
作者: 许庭洲 时间: 2013-2-1 19:58
值得学习 ing!
作者: 焦健 时间: 2013-2-2 11:04
学习了。。。。
欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) |
黑马程序员IT技术论坛 X3.2 |