雪姐最近整理了一些学习资料和视频资源,有需要的同学自行回帖下载哦~雪姐提醒,两个网盘地址都有用~
python网络爬虫第一天
1网络爬虫是何物?
说到网络爬虫,然而它并不是一种爬虫~而是一种可以在网上任意搜索的一个脚本程序。
有人说一定要解释网络爬虫到底是干毛用的。尝试用了很多种解释,最终归纳为一句话:“你再也不必用鼠标一条一条从网页上拷贝信息!”
一个爬虫程序将会高效并且准确的从网上拿到你希望要到的所有信息,从而省去你的以下行为:
当然网络爬虫的真正意义不仅如此,由于它可以自动提取网页信息,使他成为了 搜索引擎 从万维网上下载网页的重要利器。
网络爬虫 (web Spider),Spider是蜘蛛的意思,实际上名字是很形象的,他们把 互联网 比喻成一个 蜘蛛网 ,那么所谓的这个spider就在网上爬来爬去。这个网络蜘蛛是通过网页的链接地址来寻找网页的。
蜘蛛的主要行径: 网页首页—>读取网页内容—>找到网页中其他的链接地址—>其他网页的首页—>……
这样的循环下去,直到将这个网站上所有的网页都吃光(网页上所有的信息全部用蜘蛛得到)。如果你敢把互联网比喻成一个网站,一定会有那么一个网络蜘蛛能够可以把 整个互联网 的资源全部吃光!!!
网盘链接:http://pan.baidu.com/s/1gfyttyr
|
|