黑马程序员技术交流社区

标题: Java crawler 4j抓取过滤网址时候 [打印本页]

作者: yang_zhi_xiang    时间: 2015-1-15 21:16
标题: Java crawler 4j抓取过滤网址时候
shouldVisit方法 被访问的链接 visit中接收不到
具体是这样的 我创建一个正则 根据正则匹配url  private final static Pattern SECONDURLREG_REQ = Pattern.compile("(list\\.jd\\.com/list\\.html\\?cat=1319(,\\d*)*)");
在shouldVisit方法中if(SECONDURLREG_REQ.matcher(href).matches())
{
System.out.println("存在");

}
输出结果是“存在”
在Visit方法if(SECONDURLREG_REQ.matcher(href).matches())
{
System.out.println("存在");

}
结构没输出 也就是没匹配上这是为什么 怎么解决




欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2