A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

# coding=utf-8
from selenium import webdriver
import time
import requests
from bs4 import BeautifulSoup as bs

driver = webdriver.Firefox()
url = "http://china.huanqiu.com/article/2016-07/9132061.html?from=bdwz"
driver.get(url)

response = bs(requests.get(url).content, 'html.parser')

# 获取页面内,h1标签的文章标题

print(u"这篇文章的标题是:", response.h1.string)

# 使用find方法,寻找页面内name=source的content的内容

print (u"这篇文章的类型是:", response.find(attrs={'name': 'source'})['content'])

# 从find_all返回的列表中,查找content字段

for content in response.find_all('meta', {'name': 'source'}):
    print(u"这篇文章的类型是:", content['content'])

---------------------
转载,仅作分享,侵删
作者:zhusongziye
原文:https://blog.csdn.net/zhusongziye/article/details/77872108


1 个回复

倒序浏览
奈斯,加油
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马