黑马程序员技术交流社区
标题:
Java crawler 4j抓取过滤网址时候
[打印本页]
作者:
yang_zhi_xiang
时间:
2015-1-15 21:16
标题:
Java crawler 4j抓取过滤网址时候
shouldVisit方法 被访问的链接 visit中接收不到
具体是这样的 我创建一个正则 根据正则匹配url private final static Pattern SECONDURLREG_REQ = Pattern.compile("(list\\.jd\\.com/list\\.html\\?cat=1319(,\\d*)*)");
在shouldVisit方法中if(SECONDURLREG_REQ.matcher(href).matches())
{
System.out.println("存在");
}
输出结果是“存在”
在Visit方法if(SECONDURLREG_REQ.matcher(href).matches())
{
System.out.println("存在");
}
结构没输出 也就是没匹配上这是为什么 怎么解决
欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/)
黑马程序员IT技术论坛 X3.2