黑马程序员技术交流社区
标题:
【西安校区】python正则表达式
[打印本页]
作者:
逆风TO
时间:
2019-6-5 15:55
标题:
【西安校区】python正则表达式
(一)匹配的元字符
一、匹配字符的(4个-8个)
. 用来匹配任意一个字符(除了\n-换行符)
[...]用来匹配字符集
二、匹配字数的(5个)
* 匹配前一个字符0次或者多次,a*的结果是空字符串、aa,aaa,aaa,,,,,; 空格*表示可以有空格,有一个或者多个空格
+表示匹配前一个字符1次或多次,a+结果是a,aa,aaa,....
?匹配前一个字符0次或1次
{n,p}表示要匹配到n到p个字符(包括n,也包括p),a{n}表示刚好要匹配的是aX(包括a有两个字符)
*?/+?/ ?? 匹配模式为非贪婪,匹配尽可能少的字符
.+表示的是贪婪模式
三、匹配位置的(3个)
^ 开头
$结尾
\A/\Z指定的字符必须出现在开头或者结尾
共16个
(二)匹配的方法
re.match(pattern, string, flags=0),返回匹配的对象,从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。
re.search(pattern, string, flags=0),扫描整个字符串并返回第一个成功的匹配
re.match与re.search的区别
re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配
3.re.sub(pattern, repl, string, count=0, flags=0)
pattern : 正则中的模式字符串。
repl : 替换的字符串,也可为一个函数。
string : 要被查找替换的原始字符串。
count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。
4.re.compile(pattern[, flags])
pattern : 一个字符串形式的正则表达式
flags : 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:
re.I 忽略大小写
re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境
re.M 多行模式
re.S 即为 . 并且包括换行符在内的任意字符(. 不包括换行符)
re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库
re.X 为了增加可读性,忽略空格和 # 后面的注释
5.pattern.findall(string[, pos[, endpos]])
string : 待匹配的字符串。
pos : 可选参数,指定字符串的起始位置,默认为 0。
endpos : 可选参数,指定字符串的结束位置,默认为字符串的长度。
在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。
match 和 search 是匹配一次 findall 匹配所有。
6.re.finditer(pattern, string, flags=0)
在字符串中找到正则表达式所匹配的所有子串,并把它们作为一个迭代器返回。
7.re.split(pattern, string[, maxsplit=0, flags=0])
split 方法按照能够匹配的子串将字符串分割后返回列表
欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/)
黑马程序员IT技术论坛 X3.2