作者:禅与计算机程序设计艺术

1.简介

Apache Hadoop (以下简称HDFS)是一个开源分布式文件系统用来存储大量的数据集并进行计算处理。它可以处理大数据集、实时数据分析日志聚类应用场景。HDFS被广泛应用于企业数据仓库电子商务网站搜索引擎、Hadoop生态系统中的大多数服务等。本文详细阐述HDFS是如何工作的,并分享一些使用案例

2. HDFS概览

HDFS由两层结构组成:NameNode和DataNodes

  1. NameNode: 负责管理文件系统名字空间(namespace)和客户端文件访问,主要职责如下
  2. DataNodes: 分布在集群存储文件节点,主要职责如下

原文地址:https://blog.csdn.net/universsky2015/article/details/132681567

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_36426.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注