本文介绍: Hadoop解决两件事情:海量数据存储使用HDFS)和海量数据计算使用MapReduce)。简介:1)Hadoop一个由Apachc基金会所开发分布式系统基础架构。2)主要解决海量数据存储和海量数据分析计算问题。3)广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。优势:1)高可靠性:Hadoop底层维护个数副本,所以即使Hadoop某个计算元素存储出现故障,也不会导致数据的丢失

1、Hadoop、HDFS、YARN介绍

Hadoop解决两件事情:海量数据的存储(使用HDFS)和海量数据的计算(使用MapReduce)。

(1)Hadoop简介与优势

简介
1)Hadoop一个由Apachc基金会所开发分布式系统基础架构
2)主要解决,海量数据的存储和海量数据的分析计算问题
3)广义上来说,Hadoop通常是指一个更广泛的概念——Hadoop生态圈。

优势:
1)高可靠性:Hadoop底层维护个数副本,所以即使Hadoop某个计算元素或存储出现故障,也不会导致数据的丢失
2)高扩展性:在集群分配任务数据,可方便的扩展数以千计的节点
3)高效性:在MapReduce思想下,Hadoop并行工作的,以加快任务处理速度
在这里插入图片描述
4)高容错性能够自动失败任务自动分配

(2)Hadoop组成

在这里插入图片描述

(3)HDFS概述

Hadoop Distributed File System,简称HDFS,是一个分布式文件系统。主要解决海量数据存储的问题。

在这里插入图片描述

(4)YARN概述

Yet Another Resource Negotiator简称YARN,另一种资源协调者,是Hadoop的资源管理器。

在这里插入图片描述

说明1:客户端可以多个
说明2∶集群上可以运行多个ApplicationMaster【相当于Hadoop的并行运算
说明3:每个NodeManager上可以有多个Container

那么到底可以运行多少个Container容器呢?

(5)MapReduce概述

MapReduce将计算过程分为两个阶段:Map和 Reduce。

2、安装

(1)Centos7.5软硬件安装

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
下载镜像centos镜像

在这里插入图片描述

(2)配置服务器IP地址

设置vmware

在这里插入图片描述

设置windows

在这里插入图片描述
在这里插入图片描述

设置虚拟机

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
主机名映射
配置Linux克隆主机名映射hosts文件,打开/etc/hosts在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

(3)Xshell远程访问

在这里插入图片描述
修改windows主机映射文件:
在这里插入图片描述
下载Xftp
在这里插入图片描述

(4)安装epelrelease

在这里插入图片描述

(5)关闭防火墙关闭防火墙开机自启

在这里插入图片描述
在这里插入图片描述

(6)卸载自带JDK

在这里插入图片描述

rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps

3、克隆三台虚拟机

(1)克隆虚拟机

注意克隆之前先关机
在这里插入图片描述
克隆之后需要修改三台虚拟机主机名称以及IP地址

(2)在hadoop102上安装JDK

在这里插入图片描述
在这里插入图片描述
当时遇到一个错误,查阅这篇博客之后解决:xftp传输文件状态错误解决办法

在这里插入图片描述
linux退出当前目录使用:cd
linux查看当前目录所在路径pwd
在这里插入图片描述
在这里插入图片描述

(3)配置JDK环境变量

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

(4)在hadoop102按照hadoop

在这里插入图片描述
注意安装路径

(5)配置hadoop环境变量

在这里插入图片描述

在这里插入图片描述
系统文件加入下面的环境变量

在这里插入图片描述

在这里插入图片描述
hadoop目录下有哪些内容

在这里插入图片描述

原文地址:https://blog.csdn.net/wxfighting/article/details/134794003

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_50062.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注