黑马程序员技术交流社区

标题: 【郑州校区】python爬虫小程序 [打印本页]

作者: 我是色色    时间: 2018-1-17 14:05
标题: 【郑州校区】python爬虫小程序
本帖最后由 我是色色 于 2018-1-17 14:08 编辑

爬虫小程序,获取主网页的内容,并获取在该主网页内容下的连接
[AppleScript] 纯文本查看 复制代码
#coding:utf-8
import re
import requests
url='http://ai.51cto.com/'
con=requests.get(url)
file=open(r'D:\Python27\sevenot_test\curbug3\test.txt','wb')
file.write(con.content)
file.close()
href=re.findall('<a href="(http.*?)"',con.content,re.S)

a=0
for i in href:
    print str(a)+' '+i
    cc=requests.get(i)
    file_=open(r'D:\Python27\sevenot_test\curbug3\test' + str(a) + '.txt','wb')
    file_.write(cc.content)
    file_.close()
    a+=1


作者: 我是楠楠    时间: 2018-1-17 14:51

作者: Marboro    时间: 2018-3-9 15:38
比较入门的




欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2