查了多方资料的一些浅显总结,希望有建议在帖子后补上,共同进步,谢谢! Java的正则表达式讲解:(为了能看清,本文正则表达式用中文的句号代替英文句点) 1 英文句点符号:匹配单个任意字符。 eg: 表达式”t。o 可以匹配:tno,t#o,teo等等。不可以匹配:tnno,to,Tno,t正o等。 2 方括号:只有方括号里面指定的字符才参与匹配,也只能匹配单个字符。 eg: 表达式:t[abcd]n 只可以匹配:tan,tbn,tcn,tdn。不可以匹配:thn,tabn,tn等。 3 | 符号。相当与“或”,可以匹配指定的字符,但是也只能选择其中一项进行匹配。 eg: 表达式:t(a|b|c|dd)n 只可以匹配:tan,tbn,tcn,tddn。不可以匹配taan,tn,tabcn 4 表示匹配次数的符号 file:///C:\Users\HD\AppData\Local\Temp\ksohtml\wps3E2B.tmp.png {n, }表示至少N次。 eg: 表达式:[0—9]{ 3 } \— [0-9]{ 2 } \— [0-9]{ 3 } 的匹配格式为:999—99—999 因为“—”符号在正则表达式中有特殊的含义,它表示一个范围,所以在前面加转义字符“\”。 5 ^符号:表示否 ^符号被称为“否”符号,如果用在方括号内,“^“表示不想匹配的字符。 eg: 表达式:[^x] 第一个字符不能是x 6:圆括号,和空白符号 “\s”是空白符号,只可以匹配一个空格、制表符、回车符、换页符,不可以匹配自己输入的多个空格。 ()是分组号,可以用ORO API提取处出值,后面将详细讨论。 7:正则表达式的一些快捷符号: \d表示[0—, \D表示[^0—, \w表示[0—9A—Z_a—, \W表示[^0—9A—Z_a—, \s表示[\t\n\r\f], \S表示[^\t\n\r\f] 8 一些常用的正则表达式: Java:(([a-z]|_)(\\w*)){6,20}匹配以字母或下划线开头,字母数字下划线结尾的字符串 JavaScript:/^(\-?)(\d+)$/匹配数字。/^\w+$/匹配字母数字下划线。 .+ 一个或多个字符 /0 第一次匹配的字符串 9 java类中使用正则表达式: eg1: Pattern p = Pattern.compile("t.n"); Matcher m = p.matcher(“ton”); if(m.matches()){ return true; } eg2:boolean bool=Pattern.matches (“t.n”,”ton”); 如果一个正则表达式要重复利用,用第一种,如果只匹配一次,第二种是最佳选择。 10 反斜线字符(‘\’)用于转义字符,同时还可以引用非转义字符(不包括非转义字母) 因此‘\\’表示‘\’,‘\{’表示{。 但是‘\y’就是错的,因为在不表示转义构造的 任何字母字符前 使用反斜线都是错误的。 根据 Java Language Specification 的要求,Java 源代码的字符串中的反斜线被解释为 Unicode 转义或其他 字符转义。因此必须在字符串字面值中使用两个反斜线,表示正则表达式受到保护,不被 Java 字节码编译器解释。例如,当解释为正则表达式时,字符串字面值 "\b" 与单个退格字符匹配,而 "\\b" 与单词边界匹配。字符串字面值 "\(hello\)" 是非法的,将导致编译时错误;要与字符串 (hello) 匹配,必须使用字符串字面值 "\\(hello\\)"。 注意:‘\b’是一个字符而‘ \\b’是两个字符
|