Redis中字符串表示是如何设计与实现的？

本文介绍: Redis 的字符串表示为 sds ，而不是 C 字符串(以结尾的 char*)。对比 C 字符串，sds 有以下特性:可以高效地执行长度计算(strlen);可以高效地执行追加操作(append);– 二进制安全;sds 会为追加操作进行优化:加快追加操作的速度，并降低内存分配的次数，代价是多占用了一些内存，而且这些内存不会被主动释放。

在redis中，其键值对中，值可以是数字、字符串或者集合等；但其键key却始终是 字符串 类型。
那么，redis中的字符串底层到底是如何设计的呢？为什么redis要这样设计呢？
本篇文章来详细介绍一下，带你一起了解和学习redis中字符串的设计与实现，不惧面试。

Sds (Simple Dynamic String，简单动态字符串)是 Redis 底层所使用的字符串表示，它被用在几乎所有的 Redis 模块中。
SDS是Redis中用于表示字符串值的数据结构，它是一种动态字符串实现。与C语言中的字符串相比，SDS具有更多的特性和功能。SDS的设计目标是在保持高性能的同时，提供较为灵活的字符串操作接口。

SDS的内部结构如下所示：

struct sdshdr {
    int len;        // 字符串当前长度
    int free;       // 字符串剩余空间
    char buf[];     // 字符串数据
};

SDS的实际存储空间大小为len + free + 1，其中len表示字符串的当前长度，free表示字符串的剩余空间，buf是一个字节数组，用于存储字符串数据。SDS的结构允许字符串长度的动态增长和缩减，且不需要进行内存的重新分配。

因为 char* 类型的功能单一，抽象层次低，并且不能高效地支持一些 Redis 常用的操作(比如追加操作和长度计算操作)，所以在 Redis 程序内部，绝大部分情况下都会使用 sds 而不是 char* 来表示字符串。
同时：在 Redis 中，客户端传入服务器的协议内容、aof 缓存、返回给客户端的回复，等等，这些重要的内容都是由都是由 sds 类型来保存的。

struct sdshdr { 
	len = 11; 
	free = 0;
	buf = "hello world"; // buf 的实际长度为 len + 1 
};

sds sdsMakeRoomFor(sds s, size_t addlen) {  
    struct sdshdr *sh;  
    size_t free = sdsavail(s);  
    size_t len = sdslen(s);  
    char *newptr;  
    size_t newlen = len + addlen;  
  
    if (free < addlen) {  
        newptr = zmalloc(newlen + free); // 预分配额外的空间  
        memcpy(newptr, s, len); // 将原有内容复制到新空间中  
        zfree(s); // 释放原有内存空间  
        sh = (struct sdshdr *) newptr;  
        sh->free = free; // 更新未使用空间大小  
    } else {  
        sh = sdshdr(s);  
    }  
    sh->len = newlen; // 更新字符串长度  
    return s; // 返回新的sds字符串指针  
}

sds sdsIncrLen(sds s, int len) {  
    struct sdshdr *sh = sdshdr(s);  
    if ((sh->free += len) < sdsavail(s)) { // 如果未使用空间足够容纳增加的空间  
        sh->len += len; // 更新字符串长度  
    } else { // 如果未使用空间不足，重新分配更大的内存空间  
        char *newptr;  
        size_t newlen = sh->len + len; // 计算新的字符串长度  
        newptr = zmalloc(newlen + sh->free); // 预分配额外的空间  
        memcpy(newptr, s, sh->len); // 将原有内容复制到新空间中  
        zfree(s); // 释放原有内存空间  
        sh = (struct sdshdr *) newptr;  
        sh->free = sh->free; // 更新未使用空间大小  
    }  
    return s; // 返回新的sds字符串指针  
}