Innodb-ruby深入探索Innodb存储结构

本文介绍: 这也正对了前面说到的最左原则特性。之前理论知识也说过了，目录页会记录最小索引列编号，来作为目录检索，比如查询34000，那就是在33819~34232区间，指向 page 6 号数据页里面，这个时候就会去6号page页检索。这里可以看到在查看了page为3（PRIMARY索引的root页）的页信息后，一共出来95个page 信息，对应了上述表述的95个leaf p a g e，同时默认按照主键ID从小到大排序。可以看出来在二级索引的leaf 节点中，是没有完整的数据信息的，处理索引列数据，还存储了主键 id 信息。

达在之前已经分享过Inno db 数据存储结构知识，但是都是基于理论原理知识理解，今天利用Inno d b 文件解析工具 ruby进行探索Inno d b真实的存储结构。

索引原理过程：【Mysql】 InnoDB引擎深入 – 数据页 | 聚集索引_innodb的聚集索引的数据插入_Survivor001的博客-CSDN博客

Inn od b _ruby 工具的安装过程也分享过，这里就不阐述了，具体的使用方法，可以查看官网 git上面的介绍：Home · jeremycole/innodb_ruby Wiki · GitHub

1、场景描述

这里我创建了简单的一些表：project 用来验证不同的理论原理知识：

project 表约2.3w笔数据：

主键索引：project_id

唯一索引：index（`t e nan ts id`, `code`）

简单说下innodb_space 语法：

innodb_space从命令行使用的基础知识。有两种方法可以开始innodb_space。

针对单个空间文件（i b data 或 .i bd）：

选项	参数	描述
-F	<文件名&g t;	加载表空间文件（系统或表）

针对将自动加载每个表文件的表空间文件的系统表空间：

选项	参数	描述
–s	<文件名>	加载系统表空间文件（例如 i b data1）
-T	<表名>	使用给定的表名称。
-I	<索引名称>	使用给定的索引名称

注：使用 innodb_space 查看空间数据需要进入到mysql 数据存储目录，我的目录：

/usr/local/mysql/data

2、通过Inn od b_space 查看系统表空间信息

innodb_space -s ibdata1 system-spaces;

pages：总数据页数量，这里project表，一共使用到了704个 p age页

index es：总索引个数，project表我这里就是聚簇索引和唯一索引，分别就是PRIMARY主键，index（`tenant si d`, `code`）索引。

3、指定表查看索引空间信息

innodb_space -s ibdata1 -T firestation/project space-indexes;

id ：索引ID，相同的ID表示是同一个索引

root：当前索引的根p age页编号，可以看出来

fseg：类型，p age的说明

used：索引使用到了多少 p age页，比如PRIMARY的叶子类型中为95，表明使用到了95个p age页来存储数据（因为聚簇索引叶子节点存储了数据信息）

alloc ated：分配了多少page

fill_factor：page使用占比：use d / allocated

这里表示：

PRIMARY 索引树使用使用了1个root 节点，该节点根page编号为3，leaf 节点数据为95个page，实际分配了96个数据页。这里可以看出来，PRIMARY索引树是一个2层的多叉树结构:

二级索引 index：1个ro ot节点，page编号为7，leaf 节点为42个page，实际分配了96个page，也是一个2层多叉树

1、查看节点page空间信息

已经知道了大致的索引结构了，现在可以详细查看一下指定page页信息

（1）查看主键PRIMARY ro ot页面空间信息

innodb_space -s ibdata1 -T firestation/project -p 3 page-records

这里可以看到在查看了page为3（PRIMARY索引的ro ot页）的页信息后，一共出来95个page信息，对应了上述表述的95个leaf page，同时默认按照主键ID从小到大排序。

之前理论知识也说过了，目录页会记录最小索引列编号，来作为目录检索，比如查询34000，那就是在33819~34232区间，指向page 6 号数据页里面，这个时候就会去6号page页检索。

所以理论上来说，page5 页中应该是存储了33649~33818之间的数据，下面来验证下

2、查看指定leaf-page空间信息

innodb_space -s ibdata1 -T firestation/project -p 5 page-records

这个打印出来内容比较多，因为所有数据都被展示了，这里我截取下前后id的信息：

这里可以看到首个数据是33649 ，结尾数据是33818，同时也发现了PRIMARY索引的leaf节点里面是有真实数据信息的。但是非叶子节点只有索引列信息,也就是主键ID。

（2）同样操作查看二级索引index空间信息

可以看出来二级索引page数量明显少于聚簇索引page，因为二级索引是不存储其他业务数据字段信息的，所以每个page能存储更多的索引列信息。

同时可以发现联合索引，在non–leaf节点中存储了联合索引列，tenant sid 和 c ode两个字段信息，且优先索引列顺序，同时优先对tenant sid进行排序，然后对c ode进行排序。这也正对了前面说到的最左原则特性。

然后看看，leaf节点信息：

可以看出来在二级索引的leaf节点中，是没有完整的数据信息的，处理索引列数据，还存储了主键id信息。这也验证了前面说到的，二级索引查询完成后会通过主键ID查询聚簇索引树。

到这里基本上已经完全了解了Innod b索引数据存储原理了

有个问题？

为什么前面查看系统空间发现 project总共使用了704个page，但是通过index空间查看使用到的page数量远小于这个数。

查看系统page使用和分布：

可以看出来，处理真实使用到索引数之外，还会有其他page存储数据，比如缓存、元空间信息等等，后续再详细分享。

原文地址:https://blog.csdn.net/qq_31142237/ar ti cle/de tails/134715296

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。

如若转载，请注明出处：http://www.7code.cn/show_32194.html

如若内容造成侵权/违法违规/事实不符，请联系代码007邮箱：suwngjj01@126.com进行投诉反馈，一经查实，立即删除！

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

相关文章

发表回复 取消回复

发表回复取消回复