【C语言】Linux实现高并发处理的过程

本文介绍: 一、实现高并发的几种策略C语言本身并没有内建的多线程支持（新版C语言支持，但用得不多），但是在多数操作系统中，可以使用库来实现多线程编程。例如，在POSIX兼容系统上，可以使用 pthreads 库来创建和管理线程。然而，传统的多线程存在着资源限制，比如每个线程都需要独立的堆栈空间，上下文切换开销大，线程数量多时还会导致竞争情况加剧。为了兼顾高并发和高性能，可以采取以下几种策略：1. 线程池(Thread Pools)：创建一个线程池来管理一定数量的线程，避免了频繁创建和销毁线程的开销，可以复用线程

C语言本身并没有内建的多线程支持（新版C语言支持，但用得不多），但是在多数操作系统中，可以使用库来实现多线程编程。例如，在POSIX兼容系统上，可以使用 pthreads 库来创建和管理线程。然而，传统的多线程存在着资源限制，比如每个线程都需要独立的堆栈空间，上下文切换开销大，线程数量多时还会导致竞争情况加剧。
为了兼顾高并发和高性能，可以采取以下几种策略：
1. 线程池(Thread Pools)：创建一个线程池来管理一定数量的线程，避免了频繁创建和销毁线程的开销，可以复用线程处理多个任务。
2. 事件驱动(Event-Driven)：使用事件驱动（如使用select/poll/epoll/kqueue等）的非阻塞IO模型可以减少线程数目和上下文切换的开销，同时能够处理大量并发连接。

3. 异步IO(Asynchronous I/O)：利用操作系统级别的异步IO接口，比如posix的aio系列函数，这样IO操作不会阻塞线程。
4. 协程(Coroutines)：协程是一种用户态的轻量级线程，协程库（如libco、libtask）可以在用户空间进行上下文切换，拥有极低的切换成本，并能够在单线程内实现高并发。
5. 使用其他并发模型：比如Go语言中的Goroutines，Erlang语言中的Actor模型，它们都是设计上为并发而生，能够实现高性能的并发处理。
6. 硬件加速：在某些应用场景中，使用专用硬件或者利用GPU并行计算能力也能大幅提高并发处理性能。
每种方法有各自的优缺点和适用的场景，实际选择时需要根据应用需求、系统特性和资源限制综合考虑。在需要处理大规模并发连接时，通常会使用事件驱动和异步IO结合的方式来实现高效的并发处理。

异步IO（Asynchronous I/O）是一种让程序启动一个IO操作以后不必等待其完成就能继续执行其他任务的技术。同步IO（Synchronous I/O），在执行IO操作时会阻塞当前线程，直到IO操作完成。

下面举例来说明两者之间的区别：

在同步IO模型中，应用程序执行一个IO操作，如从文件读取数据或写入数据到文件，然后等待操作的完成。在这个过程中，应用程序被阻塞，不能执行其他任何操作。只有当IO请求完成，并且数据被复制到应用程序的缓冲区之后，应用程序才可以继续执行。

FILE* file = fopen("example.txt", "r");
if (file) {
    char buffer[1024];
    size_t bytes_read = fread(buffer, sizeof(char), sizeof(buffer), file);
    if (bytes_read > 0) {
        // 处理读取到的数据
    }
    fclose(file);
}

在这个例子中，`fread` 函数将会阻塞直到指定数量的字节被读取到 buffer 中或遇到文件结尾。

void io_completion_callback(IOOperation *op) {
    // 处理异步操作完成的数据
}

void initiate_async_read(const char* file_path) {
    // 设置异步读取操作，指定完成后的回调函数
    IOOperation *op = setup_async_read(file_path, io_completion_callback);
    // 发起异步读取操作，立即返回
    start_async_io(op);
}

// 应用程序继续执行，而IO操作在后台进行

#include <pthread.h>
#include <stdio.h>
#include <stdlib.h>
#include <unistd.h>
#include <stdbool.h>
#include <sys/queue.h>

// 定义任务结构体
typedef struct task {
    void (*function)(void *arg);
    void *arg;
    TAILQ_ENTRY(task) entries; // 使用TAILQ宏定义队列元素
} task_t;

// 定义任务队列
typedef TAILQ_HEAD(taskhead, task) taskhead_t;

// 定义线程池结构体
typedef struct thread_pool {
    pthread_t *threads;
    int thread_count;
    taskhead_t task_queue;
    pthread_mutex_t lock;
    pthread_cond_t cond;
    bool stop;
} thread_pool_t;

// 线程池全局变量
thread_pool_t pool;

// 线程池工作线程
void *thread_pool_worker(void *arg) {
    while (1) {
        pthread_mutex_lock(&pool.lock);

        // 等待直到有任务到来或者销毁线程池
        while (TAILQ_EMPTY(&pool.task_queue) && !pool.stop) {
            pthread_cond_wait(&pool.cond, &pool.lock);
        }

        if (pool.stop) {
            break;
        }

        task_t *task = TAILQ_FIRST(&pool.task_queue);
        TAILQ_REMOVE(&pool.task_queue, task, entries);
        pthread_mutex_unlock(&pool.lock);

        // 执行任务
        task->function(task->arg);
        free(task);

        pthread_mutex_lock(&pool.lock);
    }

    pthread_mutex_unlock(&pool.lock);
    return NULL;
}

// 初始化线程池
void thread_pool_init(int num_threads) {
    pool.threads = malloc(sizeof(pthread_t) * num_threads);
    pool.thread_count = num_threads;
    TAILQ_INIT(&pool.task_queue);
    pthread_mutex_init(&pool.lock, NULL);
    pthread_cond_init(&pool.cond, NULL);
    pool.stop = false;

    for (int i = 0; i < num_threads; i++) {
        pthread_create(&pool.threads[i], NULL, thread_pool_worker, NULL);
    }
}

// 添加任务到线程池队列
void thread_pool_enqueue(void (*function)(void*), void *arg) {
    task_t *task = malloc(sizeof(*task));
    task->function = function;
    task->arg = arg;

    pthread_mutex_lock(&pool.lock);
    TAILQ_INSERT_TAIL(&pool.task_queue, task, entries);
    pthread_cond_signal(&pool.cond);
    pthread_mutex_unlock(&pool.lock);
}

// 销毁线程池
void thread_pool_destroy() {
    // 停止所有线程池工作线程
    pool.stop = true;
    pthread_cond_broadcast(&pool.cond);

    // 等待所有线程完成
    for (int i = 0; i < pool.thread_count; i++) {
        pthread_join(pool.threads[i], NULL);
    }

    // 清理资源
    pthread_mutex_destroy(&pool.lock);
    pthread_cond_destroy(&pool.cond);
    
    while (!TAILQ_EMPTY(&pool.task_queue)) {
        task_t *task = TAILQ_FIRST(&pool.task_queue);
        TAILQ_REMOVE(&pool.task_queue, task, entries);
        free(task);
    }

    free(pool.threads);
}

#include <sys/epoll.h>
#include <pthread.h>
#include <stdio.h>
#include <unistd.h>

// 假设这里已经实现了一个线程池，和线程池相关的函数
// 初始化线程池
void thread_pool_init(int num_threads);
// 将任务添加到线程池队列
void thread_pool_enqueue(void (*task_function)(void*), void* task_data);
// 销毁线程池
void thread_pool_destroy();

// 异步IO任务执行函数
void async_io_task(void* data) {
    int fd = *(int*)data;
    char buffer[1024];

    // 实际的IO操作，读取数据
    ssize_t bytes_read = read(fd, buffer, sizeof(buffer));

    // 进行业务处理（假设处理完毕，准备响应）

    // 发送响应（假设直接回写数据）
    write(fd, buffer, bytes_read);

    // 关闭文件描述符
    close(fd);
}

int main() {
    // 初始化epoll
    int epoll_fd = epoll_create1(0);
    struct epoll_event event, events[10]; // 假设我们监视最多10个事件

    // 初始化线程池
    thread_pool_init(4);

    // 添加监听的文件描述符到epoll
    event.events = EPOLLIN; // 监听读事件
    event.data.fd = /* 监听的文件描述符 */;
    epoll_ctl(epoll_fd, EPOLL_CTL_ADD, event.data.fd, &event);

    // 事件循环
    while (1) {
        // 等待事件发生，无需阻塞IO
        int n = epoll_wait(epoll_fd, events, 10, -1);

        for (int i = 0; i < n; i++) {
            if (events[i].events & EPOLLIN) {
                // 异步IO准备就绪，将任务提交到线程池
                thread_pool_enqueue(async_io_task, &(events[i].data.fd));
            }
        }
    }

    // 销毁线程池和关闭epoll文件描述符
    thread_pool_destroy();
    close(epoll_fd);

    return 0;
}

int listen_fd = socket(AF_INET, SOCK_STREAM, 0);

// 设置为非阻塞模式
int flags = fcntl(listen_fd, F_GETFL, 0);
fcntl(listen_fd, F_SETFL, flags | O_NONBLOCK);

// 绑定和监听
struct sockaddr_in addr;
memset(&addr, 0, sizeof(addr));
addr.sin_family = AF_INET;
addr.sin_addr.s_addr = INADDR_ANY;
addr.sin_port = htons(port);
bind(listen_fd, (struct sockaddr *)&addr, sizeof(addr));
listen(listen_fd, SOMAXCONN);

// 创建epoll实例
int epoll_fd = epoll_create1(0);

struct epoll_event ev;
ev.events = EPOLLIN;
ev.data.fd = listen_fd;
epoll_ctl(epoll_fd, EPOLL_CTL_ADD, listen_fd, &ev);

#define MAX_EVENTS 1024
struct epoll_event events[MAX_EVENTS];
while(1) {
    int nfds = epoll_wait(epoll_fd, events, MAX_EVENTS, -1);
    for(int i = 0; i < nfds; ++i) {
        if(events[i].data.fd == listen_fd) {
            // 处理新的连接
            struct sockaddr_in client_addr;
            socklen_t client_addr_len = sizeof(client_addr);
            int client_fd = accept(listen_fd, (struct sockaddr *)&client_addr, &client_addr_len);
            
            // 设置为非阻塞模式
            int flags = fcntl(client_fd, F_GETFL, 0);
            fcntl(client_fd, F_SETFL, flags | O_NONBLOCK);

            // 注册新的连接到epoll
            struct epoll_event client_ev;
            client_ev.events = EPOLLIN | EPOLLET;  // ET模式
            client_ev.data.fd = client_fd;
            epoll_ctl(epoll_fd, EPOLL_CTL_ADD, client_fd, &client_ev);
        } else {
            // 交给线程池处理即将读取的数据
            // 此处为了简化示例，我们假设使用了某个线程池enqueue的方法加入任务
            // 实际上应该使用像libuv之类的库或自定义线程池来处理任务
            thread_pool.enqueue([events, i]() {
                // 读取数据
                char buffer[1024];
                int n = read(events[i].data.fd, buffer, sizeof(buffer));
                // 处理数据
                // ...

                // 响应客户端
                // ...
            });
        }
    }
}