作者:禅与计算机程序设计艺术

Apache Hadoop (以下简称HDFS)是一个开源分布式文件系统用来存储大量的数据集并进行计算处理。它可以处理大数据集、实时数据分析日志聚类应用场景。HDFS被广泛应用于企业数据仓库电子商务网站搜索引擎、Hadoop生态系统中的大多数服务等。本文详细阐述HDFS是如何工作的,并分享一些使用案例

HDFS由两层结构组成:NameNode和DataNodes

  1. NameNode: 负责管理文件系统名字空间(namespace)和客户端文件访问,主要职责如下
  2. DataNodes: 分布在集群存储文件节点,主要职责如下

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注