A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

© zhaoalei 中级黑马   /  2014-7-23 20:28  /  765 人查看  /  1 人回复  /   0 人收藏 转载请遵从CC协议 禁止商业使用本文

"href\s*=\s*(?:""(?<1>[^""]*)""|(?<1>\S+))“

1 个回复

倒序浏览
"href\s*=\s*(?:""(?<1>[^""]*)""|(?<1>\S+))"

中间有多个未转义的引号,搜索了一下,应该是这样的
href\s*=\s*(?:\"(?<1>[^\"]*)\"|(?<1>\S+))

href                        匹配 href
\s*                        匹配 = 之前的所有空格
=                        匹配 = 符号
\s*                        匹配 = 之后的所有空格
(?:                        匹配以下东西
\"(?<1>[^\"]*)\"        匹配以 " 开头,以 " 结尾,中间为不含 " 符号的字符串,并编号为 1
|                        或
(?<1>\S+)                匹配一串不含空格的字符串,编号为 1
)
放到一块儿就是获取页面内的标签(如 a 标签)的 href 属性,把属性值编号为 1
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马