A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

(一)校验Email
//校验email
public static void regEmail(){
        String email = "zhoujian@sina.com";
        boolean b = email.matches("\\w+@\\w+(\\.\\w+){1,3}");
        System.out.println(b);  //true
}
(二)网页爬虫
//网页爬虫
public static void inteCrawler() throws IOException{
        //网页爬虫:是在互联网上查找需要信息的程序,例如:爬邮箱
        //1. 读取的信息
        URL url = new URL("http://www.sina.com.cn");
        BufferedReader bfr = new BufferedReader(new InputStreamReader(url.openStream()));
        //2. 对读取的信息进行匹配,从中获取需要的信息
        String reg = "\\w+@\\w+(\\.\\w+)+";
        Pattern p = Pattern.compile(reg);
        //3. 将符合条件的信息集中存储
        List<String> list = new ArrayList<String>();
        String line = null;
        while((line = bfr.readLine())!=null){
                Matcher m = p.matcher(line);
                while(m.find()){
                        list.add(m.group());
                }
        }
        System.out.println(list);
}

4 个回复

倒序浏览
哇,感觉好厉害啊
回复 使用道具 举报
好厉害哦,每次看到你的代码都要想好久才明白
回复 使用道具 举报
基础班就会写爬虫了?
回复 使用道具 举报
新人报道,表示基础班的看不懂
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马