黑马程序员技术交流社区
标题:
python爬取热门城市奶茶店铺信息
[打印本页]
作者:
laical123
时间:
2021-7-2 16:34
标题:
python爬取热门城市奶茶店铺信息
奈雪的茶被喝上市了,你们喜欢喝奈雪的茶吗?在新消费品类中,市场的极度追捧,让奈雪的茶迅速走向顶峰,但随着茶饮行业竞争加剧,新品牌层出不穷,还有喜茶等在环绕在侧,奈雪的茶会不会成为资本市场的泡沫呢?
在如今这个网红时代,很多奶茶品牌的口味差异并不大,如何更好地营销自己的奶茶品牌,让消费者能从众多奶茶中翻到自己的牌子,变得更加重要。例如奈雪的茶主打高端路线,奶茶均价在40元左右;喜茶主打品牌差异化,注重茶饮口感的同时营造店面排长龙的“时尚文化”。
那么今天我们就通过python来了解下在那些热门城市里面奶茶店铺情况,来看下在你的城市里面哪个品牌的奶茶店最多。
本文数据来源:https://meituan.com/
本文使用爬虫代理来源:https://www.16yun.cn/
数据的获取信息如下:
#! -*- encoding:utf-8 -*-
import requests
import random
# 要访问的目标页面
targetUrl = "https://meituan.com/"
# 要访问的目标HTTPS页面
# targetUrl = "https://meituan.com/"
# 代理服务器(产品官网 www.16yun.cn)
proxyHost = "t.16yun.cn"
proxyPort = "31111"
# 代理验证信息
proxyUser = "16UAMPXP"
proxyPass = "835564"
proxyMeta = "http://%(user)s:%(pass)s@%(host)s:%(port)s" % {
"host" : proxyHost,
"port" : proxyPort,
"user" : proxyUser,
"pass" : proxyPass,
}
# 设置 http和https访问都是用HTTP代理
proxies = {
"http" : proxyMeta,
"https" : proxyMeta,
}
# 设置IP切换头
tunnel = random.randint(1,10000)
headers = {"Proxy-Tunnel": str(tunnel)}
resp = requests.get(targetUrl, proxies=proxies, headers=headers)
print resp.status_code
print resp.text
复制代码
欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/)
黑马程序员IT技术论坛 X3.2