shouldVisit方法 被访问的链接 visit中接收不到
具体是这样的 我创建一个正则 根据正则匹配url private final static Pattern SECONDURLREG_REQ = Pattern.compile("(list\\.jd\\.com/list\\.html\\?cat=1319(,\\d*)*)");
在shouldVisit方法中if(SECONDURLREG_REQ.matcher(href).matches())
{
System.out.println("存在");
}
输出结果是“存在”
在Visit方法if(SECONDURLREG_REQ.matcher(href).matches())
{
System.out.println("存在");
}
结构没输出 也就是没匹配上这是为什么 怎么解决 |
|