常用的正则表达式符号: a) [ ]:用来确定括号中开始和结束的字符,例如[a-z],[1-9]; b) [ ]:第二种意思是只能取包含里面的字符,如[358],[acghj]; c) { }:用来表示前面子表达式的出现频率,比如[0-9]{4,14},说明0-9数字出现的次数要在4到14之间,即前面表达式长度是大于等于4且小于等于14。如果{3},表示出现的次数只能是三次 d) \d:表示数字在0-9之间,在windows中要表示 \\d,例如:[1-9] \\de) \w:单词字符:[a-zA-Z_0-9] f) \n:表示第几个字符,n代表的是取0-9之间任意的数字 g) X+:用来表示一个字符一次或多次出现,X代表的是任意字符。比如(空格)+,a+。 h) X*:表示一个字符零次或多次出现。,比如0* i) .:点,代表任意字符,如果想代表普通一个字符,就是\\. j) ():意思是 组的概念为了可以让规则的结果被重用,可以将规则封装成一个组,用()完成,组的出现都有编号,从1开始,想要使用已有的组可以通过\n的形式来获取,n就是组的编号,例如:(.)\\1:代表一个组,(.)代表任意字符, \\1代表的是拿第一个字符,即与(.)比较,如果相同就是叠词。 k) $:代表的通常是取前面组的字符,和组一起用,也是从1开始,通过\n获取,它不是用在规则里面的,而是用在替换里取字符比较多。例如$1,就是取第一个元素 l) \b:单词的边界,在window中要\\b |