正则表达式分组中?:的作用
?: 表示不捕获当前分组
先看例子:<html>xxx</html>通过分组可以简写为: r"<([a-zA-Z1-6]+)>.*</\1>"
但是如果写成r"<(?:[a-zA-Z1-6]+)>.*</\1>", \1就不能取到前面的分组,会出现组引用无效的错误。
error: invalid group reference 1 at position 23
在re.findall中使用, 匹配合法的邮箱
y='123@qq.comaaa@163.combbb@126.comasdfasfs33333@adfcom'
以上结果原因是findll里面如果有分组,则只匹配分组的数据。在分组里加上?: 不捕获当前分组。
|
|