本文介绍:

目录

1 HDFS 概述

1.1 HDFS 背景定义

随着数据量越来越大,在一个操作系统中存不下所有的数据,那么就分配到更多的操作系统管理磁盘中,但是这样不方便管理维护,迫切需要一种系统管理多台机器上的文件,这就是分布式文件管理系统HDFS只是分布式管理系统中的一种

HDFS(Hadoop Distributed File System),是一个文件系统用于存储文件通过目录树来定位文件;其次,其是分布式的,由很多服务器联合起来实现功能集群中的服务器有各自的角色

HDFS 的使用场景:适合一次写入多次读出场景,且支持文件修改(但可追加)。适合用来数据分析,并不适合用来网盘应用

1.2 HDFS 优缺点

(1)优点

(2)缺点

1.3 HDFS 组成架构

在这里插入图片描述
NameNode(nn)就是Master,它是一个主管、管理者

DataNode(dn)就是Slave,NameNode下达的命令,DataNode执行实际的操作

SecondaryNameNode:并非NameNode的热备,当NameNode挂掉的时候,它并不能马上替换NameNode并提供服务

Client客户端

1.4 HDFS 文件块大小

在这里插入图片描述

思考为什么块的大小不能设置太小,也不能设置太大?

HDFS块的大小设置主要取决于磁盘传输速率

2 HDFS的shell操作

hadoop fs 具体命令 OR hdfs dfs 具体命令

启动 Hadoop 集群

[huwei@hadoop101 ~]$ start-dfs.sh
[huwei@hadoop102 ~]$ start-yarn.sh

Web查看 HDFS 的 NameNode

2.1 上传

首先在HDFS根目录手动创建/sanguo/shuguo文件夹,如下图所示

在这里插入图片描述

(1)-moveFromLocal:从本地 剪切 粘贴到 HDFS

[huwei@hadoop101 ~]$ touch kongming.txt
[huwei@hadoop101 ~]$ hdfs dfs -moveFromLocal ./kongming.txt /sanguo/shuguo

(2) -copyFromLocal:从本地文件系统拷贝 文件到 HDFS 路径
-put:等同于 copyFromLocal

[huwei@hadoop101 ~]$ touch liubei.txt
[huwei@hadoop101 ~]$ hdfs dfs -copyFromLocal ./liubei.txt /sanguo/shuguo

(3) -appendToFile追加 一个本地文件到HDFS已经存在的文件末尾

[huwei@hadoop101 ~]$ vim liubei.txt
三顾茅庐
[huwei@hadoop101 ~]$ hdfs dfs -appendToFile liubei.txt /sanguo/shuguo/liubei.txt

2.2 下载

(1) -copyToLocal:从HDFS拷贝本地
-get:等同于copyToLocal,就是从HDFS下载文件到本地

[huwei@hadoop101 ~]$ hdfs dfs -copyToLocal /sanguo/shuguo/kongming.txt ./

(2) -getmerge合并下载多个文件(将HDFS中多个文件内容合并在一个文件中,并下载

[huwei@hadoop101 ~]$ hdfs dfs -getmerge /sanguo/shuguo/liubei.txt /sanguo/shuguo/kongming.txt ./kongliu.txt

可以这样写

[huwei@hadoop101 ~]$ hdfs dfs -getmerge /sanguo/shuguo/* ./kongliu.txt

查看合并文件内容

[huwei@hadoop101 ~]$ cat kongliu.txt
三顾茅庐

2.3 HDFS直接操作

(1) -ls: 显示目录信息

[huwei@hadoop101 ~]$ hdfs dfs -ls /sanguo/shuguo
Found 2 items
-rw-r--r--   3 huwei supergroup          0 2023-10-23 16:20 /sanguo/shuguo/kongming.txt
-rw-r--r--   3 huwei supergroup         13 2023-10-23 16:28 /sanguo/shuguo/liubei.txt

(2)-mkdir:在HDFS上创建目录

[huwei@hadoop101 ~]$ hdfs dfs -mkdir /sanguo/weiguo

注意上述命令没有参数-p不会报错,是因为sanguo文件夹已经存在了,但若父目录存在,一定需要加上参数-p

[huwei@hadoop101 ~]$ hdfs dfs -mkdir -p /xiyou/suwukong

(3) -cat显示文件内容

[huwei@hadoop101 ~]$ hdfs dfs -cat /sanguo/shuguo/liubei.txt
三顾茅庐

(4) -chgrp-chmod-chown:Linux文件系统中的用法一样,修改文件所属权限

[huwei@hadoop101 ~]$ hdfs dfs -chmod  666  /sanguo/shuguo/kongming.txt
[huwei@hadoop101 ~]$ hdfs dfs -ls /sanguo/shuguo

在这里插入图片描述

也可以在Web端界面手动修改

在这里插入图片描述

(5) -cp :从HDFS的一个路径拷贝到HDFS的另一个路径

[huwei@hadoop101 ~]$ hdfs dfs -cp /sanguo/shuguo/kongming.txt /xiyou

(6) -mv:在HDFS目录移动文件

[huwei@hadoop101 ~]$ hdfs dfs -mv /sanguo/shuguo/liubei.txt /xiyou

同样,mv也可以对文件重命名

[huwei@hadoop101 ~]$ hdfs dfs -mv /sanguo/shuguo/kongming.txt /sanguo/shuguo/guanyu.txt

(7) -tail显示一个文件的末尾 1kb 的数据

我们上传一个稍大点的文件 xiaoaojianghu.txt

[huwei@hadoop101 ~]$ hdfs dfs -tail /xiaoaojianghu.txt

查看前10行

[huwei@hadoop101 ~]$ hdfs dfs -head /xiaoaojianghu.txt

注意这里head支持指定 -n

(8) -rm删除文件或文件夹

[huwei@hadoop101 ~]$ hdfs dfs -rm /xiyou/kongming.txt
[huwei@hadoop101 ~]$ hdfs dfs -rm -r /xiyou

注意 HDFS 中删除文件夹-r -f 不能写成 -rf,要写必须单独写,而且也没必要写-f,因为也不会有删除确认

(9)-rmdir删除目录

[huwei@hadoop101 ~]$ hdfs dfs -rmdir /sanguo/weiguo

(10) -du统计文件夹大小信息

[huwei@hadoop101 ~]$ hdfs dfs -du /
0        0        /sanguo
3041059  9123177  /xiaoaojianghu.txt

两列文件大小是三倍的关系,因为副本数有三个

(11) -setrep设置HDFS中文件的副本数量

[huwei@hadoop101 ~]$ hdfs dfs -setrep 10 /sanguo
Replication 10 set: /sanguo/shuguo/guanyu.txt

在这里插入图片描述

这里设置的副本数只是记录在NameNode的元数据中,是否真的会有这么多副本,还得看DataNode的数量。因为目前只有3台设备,最多也就3个副本,只有节点数的增加到10台时,副本数才能达到10。

3 HDFS的客户端操作

3.1 Windows 环境准备

hadoop下载地址,将压缩包解压安装目录,注意安装目录的路径中不要有空格

(1) 配置 HADOOP_HOME 环境变量

在这里插入图片描述

(2) 配置Path环境变量

在这里插入图片描述

(3) cmd 终端输入hadoop version 测试

在这里插入图片描述

(4) 创建一个Maven工程,并导入相应的依赖坐标+日志添加

pom.xml文件中添加

<dependencies>
    <dependency>
        <groupId>junit</groupId>
        <artifactId>junit</artifactId>
        <version>4.12</version>
    </dependency>
    <dependency>
        <groupId>org.apache.logging.log4j</groupId>
        <artifactId>log4j-slf4j-impl</artifactId>
        <version>2.12.0</version>
    </dependency>
    <dependency>
        <groupId>org.apache.hadoop</groupId>
        <artifactId>hadoop-client</artifactId>
        <version>3.1.3</version>
    </dependency>
</dependencies>

项目src/main/resources目录下,新建一个文件,命名为log4j2.xml,在文件中填入

<?xml version="1.0" encoding="UTF-8"?>
<Configuration status="error" strict="true" name="XMLConfig">
    <Appenders>
        <!-- 类型名为Console,名称为必须属性 -->
        <Appender type="Console" name="STDOUT">
            <!-- 布局为PatternLayout方式输出样式为[INFO] [2018-01-22 17:34:01][org.test.Console]I'm here -->
            <Layout type="PatternLayout"
                    pattern="[%p] [%d{yyyy-MM-dd HH:mm:ss}][%c{10}]%m%n" />
        </Appender>

    </Appenders>

    <Loggers>
        <!-- 可加性为false -->
        <Logger name="test" level="info" additivity="false">
            <AppenderRef ref="STDOUT" />
        </Logger>

        <!-- root loggerConfig设置 -->
        <Root level="info">
            <AppenderRef ref="STDOUT" />
        </Root>
    </Loggers>
</Configuration>

(3)创建包名和类

在这里插入图片描述

3.2 获取 HDFS 的客户端连接对象

public class hdfsTest {

    private FileSystem fs;

    /**
     * 获取 hdfs的客户端连接对象
     */

    @Before
    public void init() throws URISyntaxException, IOException, InterruptedException {
        Configuration configuration = new Configuration();
        configuration.set("dfs.replication", "2");
        URI uri = new URI("hdfs://hadoop101:9820");
        String user = "huwei";
        fs = FileSystem.get(uri, configuration, user);
    }

    /**
     * 关闭资源
     */
    @After
    public void close() throws IOException {
        fs.close();
    }


/*    @Test
    public void testMkdirs() throws IOException, InterruptedException, URISyntaxException {

        // 获取文件系统对象
        Configuration configuration = new Configuration();
        configuration.set("dfs.replication", "2");
        URI uri = new URI("hdfs://hadoop101:9820");
        String user = "huwei";
        FileSystem fs = FileSystem.get(uri, configuration, user);
        // 在 Java 中,每个对象都有一个 getClass() 方法,它返回对象所属的类的 Class 对象。
        // 然后,可以调用 Class 对象的 getName() 方法来获取类的全限定名(包括包名类名)。
        System.out.println(fs.getClass().getName());
        // 关闭资源
        fs.close();
    }*/
}

ClassPath下的用户自定义配置文件

在这里插入图片描述

参数优先级排序:(1)客户端代码中设置的值 >(2)ClassPath下的用户定义配置文件 >(3)然后服务器的自定义配置(xxxsite.xml) >(4)服务器默认配置(xxxdefault.xml)

3.3 HDFS文件上传

/**
 * 上传文件
 */
@Test
public void testCopyToLocalFile() throws IOException {
    //参数1 是否删除原文
    //参数2 若HDFS中已存在同名文件,是否覆盖
    //参数3 本地原文路径
    //参数4 hdfs目标路径
    fs.copyFromLocalFile(false, true, new Path("E:\googleFile\image.png"),new Path("/"));
}

3.4 HDFS文件下载

/**
 * 下载文件
 */
@Test
public void testCopyToLocalFile() throws IOException {
    //参数1 是否删除原文
    //参数2 hdfs原文件路径
    //参数3 本地目标路径
    //参数4 是否开启文件校验false 同时下载校验文件,true下载原文件)
    fs.copyToLocalFile(false, new Path("/sanguo"), new Path("E:\googleFile"), false);
}

3.5 HDFS删除文件和目录

/**
 * 删除文件或目录
 */
@Test
public void testDelete() throws IOException {
    //参数1 要删除文件的路径
    //参数2 是否递归删除
//        fs.delete(new Path("/sanguo/hello.txt"), true);// 仅删除hello.txt这个文件
    fs.delete(new Path("/sanguo"), true);// 删除sanguo文件夹以及其下的文件
}

3.6 HDFS文件更名和移动

/**
 * 文件的更名或移动
 */
@Test
public void testRename() throws IOException {
    // 移动文件
//        fs.rename(new Path("/hello.txt"), new Path("/sanguo"));
    // 更改文件名
    fs.rename(new Path("/sanguo/hello.txt"), new Path("/sanguo/hi.txt"));

}

3.7 HDFS文件详情查看

/**
* 查看文件详情
*/
@Test
public void testListFiles() throws IOException {
   //参数1 文件的路径
   //参数2 是否递归查看
   RemoteIterator<LocatedFileStatus> listFiles = fs.listFiles(new Path("/"), true);
   while(listFiles.hasNext()){
       LocatedFileStatus fileStatus = listFiles.next();
       System.out.println("文件名:"+fileStatus.getPath().getName());
       System.out.println("块大小:"+fileStatus.getBlockSize());
       System.out.println("副本数:"+fileStatus.getReplication());
       System.out.println("权限信息:"+fileStatus.getPermission());
   }
}

3.8 HDFS文件和文件夹判断

/**
 * 判断是文件还是目录
 */
@Test
public void testListStatus() throws IOException {
    FileStatus[] listStatus = fs.listStatus(new Path("/"));
    for (FileStatus status : listStatus) {
        if (status.isDirectory()) {
            System.out.println("DIR:" + status.getPath().getName());
        } else {
            System.out.println("FILE:" + status.getPath().getName());
        }
    }
}

4 HDFS的数据流

4.1 HDFS写数据流

4.1.1 剖析文件写入流程

在这里插入图片描述

  1. 客户端通过 Distributed FileSystem 模块NameNode 请求上传文件,NameNode 检查目标文件是否已存在,操作用户是否有权限。
  2. NameNode返回是否可以上传。
  3. 客户端请求上传第一个 Block 并请求上传到哪几个 DataNode服务器上。
  4. NameNode 返回3个 DataNode 节点,分别为 dn1dn2dn3
  5. 客户通过 FSDataOutputStream 模块请求dn1上传数据,dn1收到请求会继续调用dn2,然后dn2调用dn3,将这个通信管道建立完成
  6. dn3dn2dn1逐级应答客户端。
  7. 客户端开始往dn1上传第一个Block(先从磁盘读取数据放到一个本地内存缓存),以Packet(64KB)为单位dn1收到一个Packet就会传给dn2dn2传给dn3dn1每传一个Packet放入一个应答队列等待应答。(每个packet又分为多个chunk
  8. 当一个Block传输完成之后,客户端再次请求 NameNode上传第二个Block。(重复执行 3-7 步)。

4.1.2 机架感知(副本存储节点选择

步骤 4 中,NameNode 根据请求返回 DataNode 节点的策略是什么

机架存放服务器的架子,也叫机柜。一般来说一个机房有很多机柜,每个机柜有很多服务器。

在这里插入图片描述

4.1.3 网络拓扑节点距离计算

步骤 5 中,客户为什么串行建立通信管道

步骤 5 中,客户端建立通信通道时候如何确定和哪一台 DataNode 先建立连接数据传输时候如何保证数据成功

在 HDFS 写数据的过程中,NameNode选择距离待上传数据最近距离DataNode 接收数据。那么这个最近距离怎么计算呢?

节点距离两个节点到达最近的共同祖先的距离总和

例如假设数据中心 d1 机架 r1 中的节点 n1 。该节点可以表示/d1/r1/n1利用这种标记这里给出四种距离描述

在这里插入图片描述

4.2 HDFS读数据流

在这里插入图片描述

5 NameNode、SecondaryNameNode

5.1 NN与2NN工作机制

在这里插入图片描述

  1. 第一阶段NameNode启动
    (1)第一次启动NameNode格式化后,创建FsimageEdits文件。如果不是第一次启动直接加载FsimageEdits文件到内存
    (2)客户端对元数据进行增删改的请求。
    (3)NameNode记录操作日志更新滚动日志。
    (4)NameNode内存中对元数据进行增删改。

  2. 二阶段:Secondary NameNode工作
    (1)Secondary NameNode询问NameNode是否需要CheckPoint直接带回NameNode是否检查结果
    (2)Secondary NameNode请求执行CheckPoint
    (3)NameNode滚动正在写的Edits日志。
    (4)将滚动前的FsimageEdits文件拷贝Secondary NameNode
    (5)Secondary NameNode加载FsimageEdits文件到内存,并合并。
    (6)生成新的镜像文件fsimage.chkpoint
    (7)拷贝fsimage.chkpointNameNode
    (8)NameNodefsimage.chkpoint重新命名fsimage

NN和2NN工作机制详解

5.2 Fsimage和Edits解析

FsimageNameNode内存中元数据序列化后形成的文件。
Edits:记录客户端更新元数据信息的每一步操作(可通过Edits运算出元数据)

NameNode 中的元数据是存储在哪里的?

首先,我们做个假设,如果存储在 NameNode 节点磁盘中,因为经常需要进行随机访问,还有响应客户请求,必然是效率过低。因此,元数据需要存放在内存中。但如果只存在内存中,一旦断电,元数据丢失,整个集群就无法工作了。最终的解决方案磁盘 + 内存。因此,产生磁盘备份元数据的 FsImage

内存中的元数据和磁盘中的元数据如何进行同步?(元数据的维护策略)

这样又会带来新的问题,当在内存中的元数据更新时,如果同时更新 FsImage,就会导致效率过低,但如果不更新,就会发生一致性问题,一旦NameNode节点断电,就会产生数据丢失。因此,引入Edits文件(只进行追加操作,效率很高)。每当元数据有更新或者添加元数据时,修改内存中的元数据并追加到Edits中。这样,一旦NameNode节点断电,可以通过FsImageEdits的合并,合成元数据。

负责FsImageEdits的合并?

SecondaryNamenode检测本地时间,每隔1个小时会主动对NameNodeFsImageEdits文件进行一次合并(定期进行FsImageEdits的合并)。合并的时候,首先会通知NameNode,这时候NameNode就会停止对正在使用Edits文件的追加,同时会新建一个新的Edits日志文件,保证NameNode的正常工作接下来SecondaryNamenode 会把NameNode本地的FsImageEdits文件拉取SecondaryNamenode的本地,在内存中对二者进行合并,最后产生最新FsImage文件。把最新FsImage文件再发送给NameNode的本地。注意还有一个情况,当NameNodeEdits文件中的操作次数累计达到100万次,即便还没到1小时,SecondaryNamenode(每隔60秒会检测一次NameNodeEdits文件的操作次数)也会进行合并。 SecondaryNamenode 也会自己最新FsImage文件备份一份。

找到NameNode元数据的存放位置

[huwei@hadoop101 ~]$ cd /opt/module/hadoop-3.1.3/data/dfs/name/current/
[huwei@hadoop101 current]$ ll

在这里插入图片描述

找到SecondaryNamenode 元数据的存放位置

[huwei@hadoop103 ~]$ cd /opt/module/hadoop-3.1.3/data/dfs/namesecondary/current/
[huwei@hadoop103 current]$ ll

在这里插入图片描述

可以发现NameNode元数据和SecondaryNamenode 元数据信息基本一致,但SecondaryNamenode没有正在使用编辑日志文件以及 seen_txid文件,所以当元数据丢失,通过SecondaryNamenode恢复,是不能保证万无一失的恢复过来的(尤其是当NameNode正在使用编辑日志文件已经记录了一些操作)

主要文件介绍

oiv 查看 Fsimage 文件

基本语法

hdfs oiv -p 文件类型 -i 镜像文件 -o 转换后文件输出路径

Fsimage 文件转为 xml 文件

[huwei@hadoop101 current]$ hdfs oiv -p XML -i fsimage_0000000000000000252 -o fsimage.xml

oev 查看Edits文件

基本语法

hdfs oev -p 文件类型 -i 编辑日志 -o 转换后文件输出路径
[huwei@hadoop101 current]$ hdfs oev -p XML -i edits_inprogress_0000000000000000269 -o edits.xml

5.3 CheckPonit时间设置

[hdfs-default.xml]文件中设置了 CheckPonit

(1) 通常情况下,SecondaryNameNode每隔一小时执行一次

<property>
  <name>dfs.namenode.checkpoint.period</name>
  <value>3600s</value>
</property>

(2) 一分钟检查一次操作次数,当操作次数达到1百万时,SecondaryNameNode执行一次

<property>
  <name>dfs.namenode.checkpoint.txns</name>
  <value>1000000</value>
<description>操作动作次数</description>
</property>

<property>
  <name>dfs.namenode.checkpoint.check.period</name>
  <value>60s</value>
<description> 1分钟检查一次操作次数</description>
</property >

5.4 NameNode故障处理

NameNode 故障后,可以采用如下方法恢复数据。

SecondaryNameNode中数据拷贝NameNode存储数据的目录

(1)杀死NameNode进程

kill -9  NameNode进程

(2)删除NameNode存储的数据(/opt/module/hadoop-3.1.3/data/dfs/name/current

[huwei@hadoop101 ~]$ rm -rf /opt/module/hadoop-3.1.3/data/dfs/name/current/*

(3)拷贝SecondaryNameNode中数据到原NameNode存储数据目录

[huwei@hadoop103 current]$ scp -r ./* huwei@hadoop101:/opt/module/hadoop-3.1.3/data/dfs/name/current

(4)重新启动NameNode

[huwei@hadoop101 ~]$ hdfs --daemon start namenode

5.5 集群安全模式

在这里插入图片描述

5.6 NameNode多目录配置

NameNode的本地目录可以配置成多个,且每个目录存放内容相同,增加了可靠性

(1) 在 hdfs-site.xml 文件中添加如下内容

[huwei@hadoop101 ~]$ cd /opt/module/hadoop-3.1.3/etc/hadoop
<property>
	<name>dfs.namenode.name.dir</name>
	<value>file://${hadoop.tmp.dir}/dfs/name1,file://${hadoop.tmp.dir}/dfs/name2</value>
</property>

(2) 停止集群,删除三台节点的data和logs中所有数据

[huwei@hadoop101 hadoop-3.1.3]$ rm -rf data/ logs/
[huwei@hadoop102 hadoop-3.1.3]$ rm -rf data/ logs/
[huwei@hadoop103 hadoop-3.1.3]$ rm -rf data/ logs/

(3) 格式化集群并启动

[huwei@hadoop101 hadoop-3.1.3]$ hdfs namenode –format
[huwei@hadoop101 hadoop-3.1.3]$ start-dfs.sh

(4) 查看结果

[huwei@hadoop101 dfs]$ ll
drwx------. 3 huwei huwei 4096 10月 25 19:28 data
drwxrwxr-x. 3 huwei huwei 4096 10月 25 19:28 name1
drwxrwxr-x. 3 huwei huwei 4096 10月 25 19:28 name2

6 DataNode

6.1 DataNode 工作机制

在这里插入图片描述

DataNode 工作机制:

6.2 数据完整

思考:如果电脑磁盘里面存储的数据是控制高铁信号灯的红灯信号(1)和绿灯信号(0),但是存储该数据的磁盘坏了,一直显示是绿灯,是否很危险?同理DataNode节点上的数据损坏了,却没有发现,是否也很危险,那么如何解决呢?

如下是DataNode节点保证数据完整性的方法。
(1)当DataNode读取Block的时候,它会计算CheckSum。
(2)如果计算后的CheckSum,与Block创建时值不一样,说明Block已经损坏。
(3)Client读取其他DataNode上的Block。
(4)常见校验算法 crc(32),md5(128),sha1(160)
(5)DataNode在其文件创建后周期验证CheckSum。

6.3 掉线时限参数设置

在这里插入图片描述

需要注意的是`hdfs-site.xml` 配置文件中的`heartbeat.recheck.interval`的单位为**毫秒**,`dfs.heartbeat.interval`的单位为**秒**。
<property>
    <name>dfs.namenode.heartbeat.recheck-interval</name>
    <value>300000</value>
</property>
<property>
    <name>dfs.heartbeat.interval</name>
    <value>3</value>
</property>

6.4 服役新数据节点

随着公司业务增长,数据量越来越大,原有的数据节点的容量已经不能满足存储数据的需求,需要在原有集群基础上动态添加新的数据节点。

环境准备

[huwei@hadoop104 hadoop-3.1.3]$ rm -rf data logs

在 hadoop104 上启动 datanode,此时要么重新配置 etc/hadoop/workers添加hadoop104要么在hadoop104单独启动 datanode,数据信息都是一样的,NameNode会认为二者同一个

[huwei@hadoop104 ~]$ hdfs --daemon start datanode

此时在HDFS的web界面可以看到4个datanode

在这里插入图片描述

6.5 退役旧数据节点

6.5.1 添加白名单黑名单

白名单黑名单hadoop 管理集群主机的一种机制。

添加到白名单主机节点,都允许访问 NameNode,不在白名单主机节点,都会被退出。添加到黑名单主机节点,不允许访问 NameNode,会在数据迁移退出
实际情况下,白名单用于确定允许访问 NameNode的 DataNode节点,内容配置一般与workers文件内容一致。 黑名单用于在集群运行过程中退役 DataNode节点。

配置白名单和黑名单的具体步骤如下

(1)在NameNode节点的/opt/module/hadoop-3.1.3/etc/hadoop目录下分别创建whitelist 和blacklist文件

[huwei@hadoop101 ~]$ cd /opt/module/hadoop-3.1.3/etc/hadoop
[huwei@hadoop101 hadoop]$ touch whitelist
[huwei@hadoop101 hadoop]$ touch blacklist

在whitelist中添加如下主机名称,假如集群正常工作的节点为 101 102 103 104

hadoop101
hadoop102
hadoop103
hadoop104

黑名单暂时为空

(2) 在当前目录下的 hdfs-site.xml 配置文件中增加 dfs.hosts和 dfs.hosts.exclude配置参数

<!-- 白名单 -->
<property>
<name>dfs.hosts</name>
<value>/opt/module/hadoop-3.1.3/etc/hadoop/whitelist</value>
</property>
<!-- 黑名单 -->
<property>
<name>dfs.hosts.exclude</name>
<value>/opt/module/hadoop-3.1.3/etc/hadoop/blacklist</value>
</property>

(3) 分发配置文件whitelist,blacklist,hdfs-site.xml (注意:104节点也要发一份)

[huwei@hadoop101 hadoop]$ xsync ./
[huwei@hadoop101 hadoop]$ rsync -av ./ huwei@hadoop104:/opt/module/hadoop-3.1.3/etc/hadoop/

(4) 重新启动集群(注意:104节点没有添加到workers,因此要单独起停)

[huwei@hadoop101 ~]$ stop-dfs.sh
[huwei@hadoop101 ~]$ start-dfs.sh
[huwei@hadoop104 ~]$ hdfs --daemon start datanode

(5) 在web浏览器查看目前正常工作的DN节点

在这里插入图片描述

6.5.2 黑名单退役

(1)编辑/opt/module/hadoop-3.1.3/etc/hadoop目录下的blacklist文件

[huwei@hadoop101 hadoop]$ vim blacklist

添加如下主机名称(要退役的节点)

hadoop104

(2) 分发blacklist到所有节点

[huwei@hadoop101 hadoop]$ xsync ./
[huwei@hadoop101 hadoop]$ rsync -av ./ huwei@hadoop104:/opt/module/hadoop-3.1.3/etc/hadoop/

(3) 刷新NameNode

[huwei@hadoop101 hadoop]$ hdfs dfsadmin -refreshNodes

(4) 检查Web浏览器,退役节点的状态为Decommissioning(退役中),说明数据节点正在复制块到其他节点

(5)等待退役节点状态为decommissioned(已退役,所有块已经复制完成),停止该节点及节点资源管理器。

注意:如果副本数是3,服役的节点小于等于3,是不能退役成功的,需要修改副本数后才能退役

在这里插入图片描述

注意:不允许白名单和黑名单中同时出现同一个主机名称,既然使用了黑名单blacklist成功退役了hadoop104节点,因此要将白名单whitelist里面的hadoop104去掉

6.6 DataNode多目录配置

DataNode可以配置成多个目录,每个目录存储的数据不一样。即:数据不是副本

(1) 在hdfs-site.xml文件中添加如下内容

<property>
        <name>dfs.datanode.data.dir</name>
        <value>file://${hadoop.tmp.dir}/dfs/data1,file://${hadoop.tmp.dir}/dfs/data2</value>
</property>

(2) 停止集群,删除三台节点的data和logs中所有数据。

[huwei@hadoop101 hadoop-3.1.3]$ rm -rf data/ logs/
[huwei@hadoop102 hadoop-3.1.3]$ rm -rf data/ logs/
[huwei@hadoop103 hadoop-3.1.3]$ rm -rf data/ logs/

(3) 格式化集群并启动

[huwei@hadoop101 hadoop-3.1.3]$ hdfs namenode –format
[huwei@hadoop101 hadoop-3.1.3]$ start-dfs.sh

(4)查看结果

[huwei@hadoop101 dfs]$ ll
drwx------. 3 huwei huwei 4096 10月 25 19:57 data1
drwx------. 3 huwei huwei 4096 10月 25 19:57 data2
drwxrwxr-x. 3 huwei huwei 4096 10月 25 19:28 name1
drwxrwxr-x. 3 huwei huwei 4096 10月 25 19:28 name2

原文地址:https://blog.csdn.net/hu_wei123/article/details/133975350

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_41686.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注