A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

(一)匹配的元字符

一、匹配字符的(4个-8个)

. 用来匹配任意一个字符(除了\n-换行符)
[...]用来匹配字符集


二、匹配字数的(5个)

* 匹配前一个字符0次或者多次,a*的结果是空字符串、aa,aaa,aaa,,,,,;  空格*表示可以有空格,有一个或者多个空格
+表示匹配前一个字符1次或多次,a+结果是a,aa,aaa,....
?匹配前一个字符0次或1次
{n,p}表示要匹配到n到p个字符(包括n,也包括p),a{n}表示刚好要匹配的是aX(包括a有两个字符)
*?/+?/ ?? 匹配模式为非贪婪,匹配尽可能少的字符
.+表示的是贪婪模式
三、匹配位置的(3个)

^ 开头
$结尾
\A/\Z指定的字符必须出现在开头或者结尾
共16个

(二)匹配的方法

re.match(pattern, string, flags=0),返回匹配的对象,从字符串的起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回none。
re.search(pattern, string, flags=0),扫描整个字符串并返回第一个成功的匹配
re.match与re.search的区别
          re.match只匹配字符串的开始,如果字符串开始不符合正则表达式,则匹配失败,函数返回None;而re.search匹配整个字符串,直到找到一个匹配

3.re.sub(pattern, repl, string, count=0, flags=0)
pattern : 正则中的模式字符串。
repl : 替换的字符串,也可为一个函数。
string : 要被查找替换的原始字符串。
count : 模式匹配后替换的最大次数,默认 0 表示替换所有的匹配。
4.re.compile(pattern[, flags])

pattern : 一个字符串形式的正则表达式

flags : 可选,表示匹配模式,比如忽略大小写,多行模式等,具体参数为:

re.I 忽略大小写
re.L 表示特殊字符集 \w, \W, \b, \B, \s, \S 依赖于当前环境
re.M 多行模式
re.S 即为 . 并且包括换行符在内的任意字符(. 不包括换行符)
re.U 表示特殊字符集 \w, \W, \b, \B, \d, \D, \s, \S 依赖于 Unicode 字符属性数据库
re.X 为了增加可读性,忽略空格和 # 后面的注释
5.pattern.findall(string[, pos[, endpos]])
string : 待匹配的字符串。
pos : 可选参数,指定字符串的起始位置,默认为 0。
endpos : 可选参数,指定字符串的结束位置,默认为字符串的长度。
在字符串中找到正则表达式所匹配的所有子串,并返回一个列表,如果没有找到匹配的,则返回空列表。

match 和 search 是匹配一次 findall 匹配所有。

6.re.finditer(pattern, string, flags=0)

在字符串中找到正则表达式所匹配的所有子串,并把它们作为一个迭代器返回。

7.re.split(pattern, string[, maxsplit=0, flags=0])

split 方法按照能够匹配的子串将字符串分割后返回列表


0 个回复

您需要登录后才可以回帖 登录 | 加入黑马