黑马程序员技术交流社区
标题:
网页抓取邮箱疑问
[打印本页]
作者:
zhkqy
时间:
2013-12-10 15:14
标题:
网页抓取邮箱疑问
本帖最后由 zhkqy 于 2013-12-13 09:23 编辑
import java.util.regex.*;
import java.io.*;
public class Test1 {
public static void main(String[] args) throws IOException {
BufferedReader br = new BufferedReader(new FileReader("F:\\share\\123456.html"));
String line = "";
while ((line = br.readLine()) != null) {
parse(line);
}
}
private static void parse(String line) {
Pattern p = Pattern.compile("\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");
Matcher m = p.matcher(line);
while (m.find()) {
System.out.println(m.group());
}
}
}
复制代码
代码如上,可是运行后不显示任何东西,为什么啊?
作者:
icyyaww
时间:
2013-12-12 23:47
把123456.html帖出来。在看你的代码。
作者:
Kyle
时间:
2013-12-13 00:26
这个问题我已经回答过一次了,今天论坛故障回答消失了。
错的地方是正则的定义上少了一个中括号。
import java.util.regex.*;
import java.io.*;
public class Test1 {
public static void main(String[] args) throws IOException {
BufferedReader br = new BufferedReader(new FileReader("F:\\share\\123456.html"));
String line = "";
while ((line = br.readLine()) != null) {
parse(line);
}
}
private static void parse(String line) {
Pattern p = Pattern.compile("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+");
Matcher m = p.matcher(line);
while (m.find()) {
System.out.println(m.group());
}
}
}
复制代码
欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/)
黑马程序员IT技术论坛 X3.2