A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

【郑州校区】网络爬虫课程介绍及网络爬虫是什么

1.1.1知识概述
介绍网络爬虫的课时安排,以及简单介绍当前课程在大数据课程中的重要性。
1.1.2视频详情
1.1.3总结与补充
        无
1.1.4课堂提问与练习
        无
1.1.5习题答案
        无


1.1 网络爬虫是什么1.2.1知识概述
以上数据来源于 百度百科
爬虫又叫网络爬虫,网络蜘蛛,一种运行在互联网上用来获取数据的的自动程序。
l 互联网的数据,有很多,一般都是根据业务需求来的。
n 网页(文字、图片、视频)
n 商品数据
l 怎么获取数据?        
n HTTP协议
n 人的操是通过浏览器的,程序是利用网络请求的相关协议获取数据。
l 自动化,尽可能减少人工的干预。
n 爬虫开发的技术,没有限制的。
python做网络爬虫是非常流行的。
Java 编写爬虫框架。
思考题:某公司要获取京东的数据,也要获取淘宝的数据,又要获取豆瓣上的数据,请问开发一个爬虫程序好?还是多个程序好?
1.2.2视频详情
1.2.3总结与补充
        无
1.2.4课堂提问与练习
        网络爬虫的概念?
1.2.5习题答案
        网络爬虫:又称网络蜘蛛,就是按照一定的规则,运行在计算机上的一段自动化的脚本程序
传智播客·黑马程序员郑州校区地址
河南省郑州市 高新区长椿路11号大学科技园(西区)东门8号楼三层
联系电话 0371-56061160/61/62
来校路线  地铁一号线梧桐街站A口出

0 个回复

您需要登录后才可以回帖 登录 | 加入黑马