黑马程序员技术交流社区

标题: 【郑州校区】 python爬虫笔记-day1 [打印本页]

作者: 谷粒姐姐    时间: 2018-11-23 16:23
标题: 【郑州校区】 python爬虫笔记-day1
本帖最后由 谷粒姐姐 于 2018-11-23 16:24 编辑

判断请求否是成功
[AppleScript] 纯文本查看 复制代码
assert response.status_code==200
url编码字符串格式化的另一种方式
[AppleScript] 纯文本查看 复制代码
"传{}智播客".format(1)

使用代理ip携带cookie请求使用requests提供的session类来请求登陆之后的网站的思路不发送post请求,使用cookie获取登录后的页面字典推导式,列表推到是
[AppleScript] 纯文本查看 复制代码
cookies="anonymid=j3jxk555-nrn0wh; _r01_=1; _ga=GA1.2.1274811859.1497951251; _de=BF09EE3A28DED52E6B65F6A4705D973F1383380866D39FF5; ln_uact=mr_mao_hacker@163.com; depovince=BJ; jebecookies=54f5d0fd-9299-4bb4-801c-eefa4fd3012b|||||; JSESSIONID=abcI6TfWH4N4t_aWJnvdw; ick_login=4be198ce-1f9c-4eab-971d-48abfda70a50; p=0cbee3304bce1ede82a56e901916d0949; first_login_flag=1; ln_hurl=http://hdn.xnimg.cn/photos/hdn421/20171230/1635/main_JQzq_ae7b0000a8791986.jpg; t=79bdd322e760beae79c0b511b8c92a6b9; societyguester=79bdd322e760beae79c0b511b8c92a6b9; id=327550029; xnsid=2ac9a5d8; loginfrom=syshome; ch_id=10016; wp_fold=0"
cookies = {i.split("=")[0]:i.split("=")[1] for i in cookies.split("; ")}

[AppleScript] 纯文本查看 复制代码
[self.url_temp.format(i * 50) for i in range(1000)]

获取登录后的页面的三种方式








欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2