黑马程序员技术交流社区

标题: 请各位帮忙看下我的爬虫小程序,求解答,谢谢 [打印本页]

作者: wyy666    时间: 2014-6-1 23:07
标题: 请各位帮忙看下我的爬虫小程序,求解答,谢谢


作者: pk49800    时间: 2014-6-2 00:29
这样写,可以写到TXT里面,你试试
  1. import java.io.BufferedReader;
  2. import java.io.File;
  3. import java.io.FileWriter;
  4. import java.io.InputStreamReader;
  5. import java.net.URL;
  6. import java.net.URLConnection;
  7. import java.util.regex.Matcher;
  8. import java.util.regex.Pattern;

  9. public class Carwler {

  10.         public static void main(String[] args) throws Exception {
  11.                 URL url = new URL("http://tieba.baidu.com/p/2711844440");
  12.                 URLConnection urlcon = url.openConnection();
  13.                 BufferedReader br = new BufferedReader(new InputStreamReader(
  14.                                 urlcon.getInputStream()));
  15.                 FileWriter fw = new FileWriter(new File("D:\\carwler.txt"));
  16.                 String regex = "\\w+@\\w+(\\.\\w+)+";
  17.                 Pattern p = Pattern.compile(regex);
  18.                 String line = null;
  19.                 while ((line = br.readLine()) != null) {
  20.                         Matcher mm = p.matcher(line);
  21.                         while (mm.find()) {
  22.                                 fw.write(mm.group()+"\r\n");
  23.                                 System.out.println(mm.group());
  24.                         }
  25.                 }
  26.                 fw.close();
  27.         }
  28. }
复制代码





欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2