hbase+hive分布式存储数据恢复环境:
16台某品牌R730XD服务器节点,每台物理服务器节点上有数台虚拟机,虚拟机上配置分布式,上层部署hbase数据库+hive数据仓库

hbase+hive分布式存储故障&初检:
数据库文件被误删除数据库无法使用
通过现场对该分布式环境的初步检测发现虚拟机还可以正常启动,虚拟机里面的数据库文件丢失。好在块文件丢失之后没有集群环境写入数据,底层数据损坏可能性比较小。


    
hbase+hive分布式存储数据恢复方案:
1、备份
A、从物理服务器底层备份,将设备断电、关机。将所有磁盘编号后从服务器/存储中取出。
B、从虚拟机层面备份,通过网络直接备份虚拟机底层磁盘文件
C、北亚企安数据恢复中心准备一台服务器只读方式挂载服务器硬盘,对所有磁盘进行扇区对扇区的全盘镜像备份
D、备份完成后提供详细报告,内容涉及所有磁盘健康状态和存在的坏道列表
E、将服务硬盘按照编号还原到原服务器/存储设备中,之后数据分析和数据恢复操作基于镜像文件进行,避免对原始磁盘数据造成二次破坏。

2、基于镜像文件分析块文件结构
A、分析每个虚拟机磁盘的块文件。
B、分析文件底层聚合方式
C、分析磁盘中数据分布情况。

3、分析Block文件key
A、定位数据库文件中的key信息
B、提取解析数据库文件中key信息
C、整合数据库文件key信息

4、拼接Block文件。
A、根据Block文件的key信息提取文件片段。
B、拼接Block文件的片段。
C、校验拼接后的Block文件的正确性。

5、导入Block文件。
A、校验提取出来的Block文件完整性和正确性。
B、把提取出来的Block文件导入到hbase和hive数据仓库中。

6、验证数据。
用户对数据进行详细验证。如果发现问题则重新检验上面的恢复流程

原文地址:https://blog.csdn.net/beiya123/article/details/134600101

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。

如若转载,请注明出处:http://www.7code.cn/show_8531.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注