黑马程序员技术交流社区

标题: 【上海校区】简单的Python网络爬虫程序 [打印本页]

作者: 不二晨    时间: 2018-12-7 09:56
标题: 【上海校区】简单的Python网络爬虫程序

<span style="font-size:18px;">import urllib
import httplib2
import urllib.request
import webbrowser

url='http://www.163.com'
content=urllib.request.urlopen(url).read()

open('163.com.html','wb').write(content)


webbrowser.open_new_tab('163.com.html')
webbrowser.open_new_tab('www.baidu.com')</span>
<span style="font-size:18px;">
</span>
<span style="font-size:18px;">上边的代码用来抓取网易首页上的内容,并将抓取到的内容保存在名为163.com.html的html文件中,然后再使用默认的浏览器显示该html文件,</span>
<span style="font-size:18px;">最后使用默认的浏览器打开百度网页。</span>
Python的版本为3.2,Python2中在引用库时只需使用

<span style="font-size:18px;">import urllib
import httplib2
import webbrowser</span>
而无需添加
<span style="font-size:18px;">import urllib.request</span>
并且
<span style="font-size:18px;">content=urllib.request.urlopen(url).read()</span>
应写为
content=urllib.urlopen(url).read()
open('163.com.html','wb').write(content)
应写为
open('163.com.html','w').write(content)

---------------------
【转载】仅作分享,侵删
作者:银霜覆秋枫
原文:https://blog.csdn.net/u011974126/article/details/50966117



作者: 不二晨    时间: 2018-12-11 15:12





欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2