A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

一、完善球赛程序,测试球赛程序。
将代码末尾稍作改动即可,若代码正确,则运行,否则输出Error。
[size=1em][color=rgb(0, 0, 255) !important][size=1em]
[color=rgb(0, 0, 255) !important]+ View Code



结果如下:
则测试得代码无误。
二、用requests库的get()函数访问必应搜狗主页20次,打印返回状态,text内容,并且计算text()属性和content属性返回网页内容的长度。
关于requests库的内容可戳以下链接
[size=1em]
1

2

3

4

5

6

7

8

import requests
for i in range(20):
    r=requests.get("https://www.sogou.com",timeout=30)   #网页链接可换
    r.raise_for_status()
    r.encoding='utf-8'
    print('状态={}'.format(r.status_code))
    print(r.text)
    print('text属性长度{},content属性长度{}'.format(len(r.text),len(r.content)))



 结果如下(取20次中的其中一次,text属性内容太长所以不展示出来):

三、根据所给的html页面,保持为字符串,完成如下要求:
(1)打印head标签内容和你学号的后两位
(2)获取body标签的内容
(3)获取id的first的标签对象
(4)获取并打印html页面中的中文字符
[size=1em][color=rgb(0, 0, 255) !important][size=1em]
[color=rgb(0, 0, 255) !important]+ View Code



 代码如下:
[size=1em]
1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

from bs4 import BeautifulSoup
r = '''
<!DOCTYPE html>
<html>
<head>
<meta charset="utf-8">
<title>菜鸟教程(runoob.com)  23号的作业</title>
</head>
<body>

<h1>我的第一个标题</h1>
<p id="first">我的第一个段落。</p>

</body>
    <table border="1">
        <tr>
            <td>row 1, cell 1</td>
            <td>row 1, cell 2</td>
        </tr>
    </table>
</html>
'''
demo = BeautifulSoup(r,"html.parser")

print(demo.title)
print(demo.body)
print(demo.p)
print(demo.string)



效果如下:

四、爬取中国大学排名(年费2016),将数据存为csv文件。
[size=1em][color=rgb(0, 0, 255) !important][size=1em]
[color=rgb(0, 0, 255) !important]+ View Code



效果:

将爬取到的数据存为csv文件,只需将printUni()函数换掉。
改动后的代码如下:
[size=1em][color=rgb(0, 0, 255) !important][size=1em]
[color=rgb(0, 0, 255) !important]+ View Code



  效果:

以上内容转载自网络
更多讯息欢迎添加小优:DKA-2018

1 个回复

倒序浏览
您需要登录后才可以回帖 登录 | 加入黑马