黑马程序员技术交流社区

标题: 【上海校区】简单的Python网络爬虫程序 [打印本页]

作者: 不二晨 时间: 2018-12-7 09:56
标题: 【上海校区】简单的Python网络爬虫程序

import urllib
import httplib2
import urllib.request
import webbrowser

url='http://www.163.com'
content=urllib.request.urlopen(url).read()

open('163.com.html','wb').write(content)

webbrowser.open_new_tab('163.com.html')
webbrowser.open_new_tab('www.baidu.com')


上边的代码用来抓取网易首页上的内容，并将抓取到的内容保存在名为163.com.html的html文件中，然后再使用默认的浏览器显示该html文件，
最后使用默认的浏览器打开百度网页。
Python的版本为3.2，Python2中在引用库时只需使用

import urllib
import httplib2
import webbrowser
而无需添加
import urllib.request
并且
content=urllib.request.urlopen(url).read()
应写为
content=urllib.urlopen(url).read()
open('163.com.html','wb').write(content)
应写为
open('163.com.html','w').write(content)

---------------------
【转载】仅作分享，侵删
作者：银霜覆秋枫
原文：https://blog.csdn.net/u011974126/article/details/50966117

作者: 不二晨 时间: 2018-12-11 15:12

欢迎光临黑马程序员技术交流社区 (http://bbs.itheima.com/)

黑马程序员IT技术论坛 X3.2