一、select机制
1. 原理:select可以理解成一个监听器,可以监听多个文件描述符。当某个文件描述符的状态发生改变了(可读/可写),操作系统就会发送消息给应用程序,去处理数据。
2. 优点:几乎所有平台都支持,跨平台支持性较好。
3. 缺点:
(1). 当个进程/线程可监视的文件描述符数量有限制。
(2). 对文件描述符的扫描是线性的,采用轮询的方式,每次都是从头一直扫描到结尾,当文件描述符的列表变大时,会相当浪费时间和CPU
(3). 把包含大量文件描述符的数组从内核空间拷贝到用户空间,当数组小的时候可能还好,但是随着数组的增大会变得很浪费资源。
4. 水平触发:
当select()把状态发生变化的文件描述符报告给进程之后,如果进程没有进行任何处理,那么下次select()还会报告这些文件描述符。
二、epoll
epoll可以看成是select/poll(本质就是select)的加强版,打破了很多select的约束,以及添加了一些其他的功能!
1. 为什么epoll效率很高呢?
epoll最大的特点是只告诉服务器有哪些文件描述符(fd)发生了变化。如果服务器不去处理相应的fd,那么操作系统就会把这个fd丢弃,不再给服务器发送消息(边缘触发)!除此之外,epoll是采用事件监听的方式通知,这也是epoll的魅力所在!
2.原理:
(1). 注册在epoll中的文件描述符,操作系统的事件监听会去监听文件描述符集合(fd_set)
(2). 如果有fd发生了变化,那么事件监听会向操作系统报告发生变化的fd
(3). 操作系统会给服务器发送消息,通知它你关注的fd有变化,去处理吧
(4). 此时服务器就去共享内存中读取数据了!
3. 优点:
(1). 没有最大连接数的限制。
(2). 不采用轮询的方式去处理fd,而是采用事件监听的方式,即哪个fd有事件发生,OS通知服务器使用相应的回调函数来处理fd
(3). 内存拷贝:当有数据到来时,操作系统会给服务器发送通知去处理数据。通过采用共享内存的方式加快用户空间与内核空间消息的传递速度。
4. 误区:
并不是在任何情况下,epoll都要比select/poll高效,只有当很多连接请求到来时才会很高效!
三、epoll编程模型
(1). 创建1个epoll对象
(2). 告诉epoll对象,在指定的fd上监听指定的事件
(3). 询问epoll对象,自从上次查询后,哪些fd上发生了哪些事件
(4). 在这些fd上执行一些操作
(5). 告诉epoll对象,修改fd列表或注册事件,并监控
(6). 重复步骤3-5,直到完成
(7). 销毁epoll对象
四、代码实现
利用非阻塞和epoll来实现一个服务器
"""
import socket
import select
class WebServer:
"""定义一个web服务器"""
def __init__(self):
# 1.创建TCP 服务器
self.tcp_server = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
# 复用端口
self.tcp_server.setsockopt(socket.SOL_SOCKET, socket.SO_REUSEADDR, 1)
# 2.绑定端口
self.tcp_server.bind(('', 6767))
# 3.设为被动套接字
self.tcp_server.listen(128)
def run(self):
"""运行一个服务器"""
#1.把服务器设置为非阻塞模式
self.tcp_server.setblocking(False)
#2.创建一个epoll对象并为服务器注册一个可接受连接的事件
epoll = select.epoll()
epoll.register(self.tcp_server.fileno(), select.EPOLLIN)
client_dict = dict() # 让fd与client建立关联
#3.服务器接受客户端的请求
while True:
# 4.监听epoll中哪个fd发生了什么事件
epoll_list = epoll.poll()
for fd, event in epoll_list:
if fd == self.tcp_server.fileno():
# 有客户端来连接被动套接字服务器
client, addr = self.tcp_server.accept()
# print(addr)
# 把客户端注册到epoll中
epoll.register(client.fileno(), select.EPOLLIN)
# 把客户端和客户端对应的fd添加到client字典中去
client_dict[client.fileno()] = client
else:
# 有客户端发送数据过来,但是该如何去获得这个客户端呢?
data = client_dict[fd].recv(1024).decode('utf-8')
if data:
# 说明客户端发送数据过来了
print(data)
client_dict[fd].send('我已经收到你的数据了!\n'.encode('utf-8'))
else:
# 说明客户端已经关闭了
client_dict[fd].close()
client_dict.popitem()
# 需要把该客户端注册的事件取消掉
epoll.unregister(fd)
# 遍历client字典中每个客户端对应的fd
for item in client_dict.items():
print('fd:{}--->addr:{}'.format(item[0], item[1]))
print('-'*50)
# 关闭服务器
self.tcp_server.close()
def main():
#1.初始化一个TCP服务器
server = WebServer()
#2.运行一个服务器
server.run()
if __name__ == '__main__':
main()