【Redis】IO多路复用机制

IO多路复用的概念

IO多路复用其实一听感觉很高大上，但是如果细细的拆分以下，
IO：网络IO，操作系统层面指数据在内核态和用户态之间的读写操作。
多路：多个客户端连接(连接就是套接字描述符，即Soc k e t)
复用：用一个或多个连接处理
其实就是用一个服务端连接进行处理多客户端的请求。实际就是一个服务端进程处理多个套接字描述符，实现返回有select、p o ll、epoll。

那么什么是文件描述符呢？
说白了就是非负整数，当打开或者创建一个文件描述符时返回一个数值。

整个流程是什么样的？
当用户有请求进来之后，会将用户 socket 文件描述符注册进入 epoll，然后 epoll 监听哪些 socket有消息到达。可以避免Redi s 主线程来回进行切换或者被阻塞。通过一个主线程来控制请求数据量的转发。
在这里插入图片描述
为什么这样的方式吞吐量比较高呢，其实如果是来一个请求创建一个线程，那么太耗费资源，但是如果一个线程轮询处理，那么可能会被阻塞导致吞吐量较低。

通信 方式

同步：调用者需要等待下游系统的结果，线程一直会在等待中。比如订单系统调用支付系统，需要支付系统返回结果才可以进行后续的订单状态修改。处理时间比较快的系统推荐使用。
异步：调用者接受到被调用者的相应，就处理别的事情，一般需要被调用者通过回调函数或者异步MQ的返回方式将结果写回，这种方式对于处理比较耗时的系统来说，一般采用异步方式。
阻塞：调用方会被阻塞，一直什么不干。
非阻塞：调用方不会阻塞，先返回做别的事情。
同步异步：在于被调用方返回消息的通知方式上
阻塞非阻塞：在于调用方等待时候的行为

五种网络编程的IO模型
Block in g IO：阻塞IO
Non eBlock in g IO : 非阻塞IO
IO multiple xi n g : IO多路复用
 sin g al d ri v e n Io 信用驱动IO
say n chr on uns 异步IO

BIO

服务端Cod e

	 public static void main(String[] args) throws IOException {
        byte [] bytes = new byte[1024];
        ServerSocket serverSocket = new ServerSocket(6379);

        while (true) {
            System.out.println("1.建立连接");
            Socket accept = serverSocket.accept();
            System.out.println("2.连接成功");
            InputStream inputStream = accept.getInputStream();
            int length = -1;
            System.out.println("3.等待读取数据");

            while ((length =inputStream.read(bytes)) != -1) {
                System.out.println("4.读取到数据");
                System.out.println(new String(bytes));
            }
            System.out.println("5.数据读取结束");
            inputStream.close();
            accept.close();
            System.out.println("6.关闭资源结束");
        }
    }

客户端

	public static void main(String[] args) throws IOException {
        Socket socket = new Socket("127.0.0.1",6379);

        OutputStream outputStream = socket.getOutputStream();

        while (true) {
            Scanner scanner = new Scanner(System.in);
            String next = scanner.next();
            if (next.equalsIgnoreCase("quit")) {
                break;
            }
            outputStream.write(next.getBytes());
            System.out.println("写入数据成功");

            outputStream.close();
            socket.close();
        }
    }

可以发现如果服务端采用建立连接之后，客户端迟迟不写入数据，那么客户端就会一直阻塞在read()中。
那么这种问题如何解决呢，一般简单的就是使用创建多个线程的方式来解决 read阻塞问题。

	public static void main(String[] args) throws IOException {
        byte [] bytes = new byte[1024];
        ServerSocket serverSocket = new ServerSocket(6379);

        while (true) {
            System.out.println("1.建立连接");
            Socket accept = serverSocket.accept();
            System.out.println("2.连接成功");

            //多个线程处理read数据读取
            new Thread(()-> {
                InputStream inputStream = null;
                try {
                    inputStream = accept.getInputStream();
                    int length = -1;
                    System.out.println("3.等待读取数据");

                    while ((length =inputStream.read(bytes)) != -1) {
                        System.out.println("4.读取到数据");
                        System.out.println(new String(bytes));
                    }
                    System.out.println("5.数据读取结束");
                    inputStream.close();
                    accept.close();
                    System.out.println("6.关闭资源结束");
                } catch (IOException e) {
                    e.printStackTrace();
                }
            }).start();
        }
    }

但是如果细心的同学就会发现，其实如果大量的创建线程，会十分消耗系统资源，并且进程内创建线程是有一定的上限，所以解决办法要么使用线程池进行复用，要么使用非read阻塞模式，也就是NIO。
在这里插入图片描述

NIO

通过上面分析可以知道，其实BIO主要是在read 过程中读取数据会被阻塞，而NIO通过轮询的方式不断查询数据，但是这样其实也会频繁的空跑CPU。

	public static void main(String[] args) throws IOException {
        Socket socket = new Socket("127.0.0.1",6379);

        OutputStream outputStream = socket.getOutputStream();

        while (true) {
            Scanner scanner = new Scanner(System.in);
            String next = scanner.next();
            if (next.equalsIgnoreCase("quit")) {
                break;
            }
            outputStream.write(next.getBytes());
            System.out.println("写入数据成功");

            outputStream.close();
            socket.close();
        }
    }

在这里插入图片描述

Reactor 模式

在这里插入图片描述
Reactor模式其实就是将请求处理和分发进行职责划分，一个线程负责请求的转发，而具体的业务逻辑由不同的处理现场进行处理。

select

在这里插入图片描述
可以看到 select 监听的文件描述符包括三个read fds、write fds、except fds,将用户传入的数组拷贝到内核空间，select会被阻塞，直到描述符就绪，返回。

selcet核心执行流程
1.select是一个阻塞函数，当没有数据时，会一直阻塞在sel ect。
2.当有数据时，会将对应的rset 设置为1
3.sel ect函数返回，不在阻塞。遍历文件描述符判断那个fd置位，读取数据，然后处理。

优点：说白了sel ect的核心其实还是将用户态的轮询搬到了内核态，这样可以避免频繁的上下文切换，执行时间和效率上肯定更快。
缺点:
1.rset位不可重复用，每次socket有数据就会相应的位被置位。
2.bitmap 最大1024 一个进程最多处理1024个客户端。
3.文件描述符数组拷贝到了内核态，sel ect调用需要传入fd 数组，需要拷贝一份到内核，高并发场景下消耗的资源是惊人的。
4.sel ect 没有通知用户态哪一个socket有数据，需要O(N)遍历。

小结:sel ect方式，既做到了一个线程处理多个客户端连接（文件描述符），又减少了系统调用的开销（多个文件描述符只有一次 sel ect 的系统调用 + N次就绪状态的文件描述符的 read 系统调用

poll

执行流程

在这里插入图片描述
优点
1.使用数组来解决sel ect的bit map 1024限制。
2.有事件发生时，将对应的revents置位位为1，遍历的时候将对应的位置设置为0，可以实现重用。
缺点
1.poll f ds 数组拷贝到内核态，仍然有开销。
2.poll并没有通知用户态那个socket有数据，需要O(N)遍历

epoll

在这里插入图片描述
1.epoll _create : 创建一个epoll 句柄
2.epoll_ctl 向内核添加、修改或删除要监听的文件描述符
3.epoll_wait 类似发起select调用

在这里插入图片描述
总结：IO多路复用快的原因在于，本身是用户态到内核态的多次数据调用，进一步优化成一次用户态+内核层遍历文件描述符。

小结

本篇主要介绍了IO多路复用的机制，从IO模型，通信方式（同步、异步），调用方是否等待（阻塞、非阻塞) ，以及介绍了三种主要的IO模型(BIO、NIO、IO多路复用机制)
而IO多路复用机制是很多中间件核心原理，比如Ngin x、Redis等。具体就是三种不同的内置函数，select、poll、epoll，核心就是原来在用户态的while(true)多次调用，调整到内核态的一次系统调用+内核层遍历文件描述符。
在这里插入图片描述