本文介绍: Kettle的7.1版本的太旧了,容易出现闪退,右击就死机等bug,9.x太新了也会有bug下载8.2版本安装包。Kettle把Hive当作一个数据库支持连接Hive Server和Hive Server 2,数据库连接类型名字分别为Hadoop Hive 和 Hadoop Hive 2。完成了Kettle安装之后,我们需要通过配置,使得Kettle可以与Hadoop 协同工作。在Kettle工作区左侧的“主对象树”标签中,选择“DB 连接” → 右键新建”,对话框输入如图所示属性值。

Kettle 安装配置

Kettle 安装

在安装Kettle之前,需要确定已经安装Java运行环境。Kettle需要Java的支持才能运行,JDK的版本最好是8.x的太新的也会出现bug。Kettle的7.1版本的太旧了,容易出现闪退,右击就死机等bug,9.x太新了也会有bug下载8.2版本的安装包如图所示:Kettle官方网站下载地址如下Pentaho from Hitachi Vantara – Browse Files at SourceForge.net

在这里插入图片描述

在Windows系统上,可以直接双击spoon.bat文件启动Kettle。在Linux或Mac OS系统上,可以命令行输入“./spoon.sh命令启动Kettle。

在这里插入图片描述

Kettle 配置

完成了Kettle的安装之后,我们需要通过配置,使得Kettle可以与Hadoop 协同工作通过提交适当的参数,Kettl可以连接Hadoop的HDFS、MapReduce、Zookeeper、Oozie、Sqoop 和Spark服务。在数据库连接类型中支持Hive和Impala

配置连接前,要确认Hadoop和Hive虚拟机中已经正确安装并启动使用FTP工具,连接虚拟机,找到Hadoop和Hive中的配置文件core-site.xmlhdfs-site.xmlyarn-site.xmlmapred-site.xmlhive-site.xml合计5个,下载到Kettle根目录下的pluginspentaho-big-data-pluginhadoop-configurationscdh514目录下,覆盖原来Kettle自带的这些文件

​在本机配置IP地址映射修改C:WindowsSystem32driversetchosts文件加入主机名与IP对应关系,填自己的IP和主机名

192.168.88.102 hadoop102
192.168.88.103 hadoop103
192.168.88.104 hadoop104

在Spoon界面中,选择菜单工具”→“Hadoop Distribution…”,从弹出窗口可以看到五种Shim选择“Cloudera CDH 514”,点击OK 按钮确定重启Spoon.


接下来我们新建一个作业测试一下Kettle与Hadoop的连接。在工作区左侧的树的“主对象树”标签中,右击“作业点击新建”。选择 Hadoop clusters右键 New Cluster。

在这里插入图片描述
选择对话框输入如图所示的属性值

在这里插入图片描述

​ Hadoop集群配置窗口中的选项定义说明如下

然后点击“测试按钮测试结果如图2-6所示。此时Oozi和Zookeeper 因为没有进行安装,所以必定会有连接失败警告。“User Home Directory Access”这条报错则是由于当前 Kettle 是安装在宿主机的Windows系统中,Windows

运行的 Kettle 在连接 Hadoop 集群时,始终用本机用户连接 Hadoop 集群,因此User Home Directory Access报错。将Kettle 安装到 Hadoop 所在的虚拟机中可以解决问题。此处不影响后续的操作

在这里插入图片描述

连接 Hive

接下来我们尝试使用Kettle连接Hive。Kettle把Hive当作一个数据库,支持连接Hive Server和Hive Server 2,数据库连接类型名字分别为Hadoop Hive 和 Hadoop Hive 2。这里在Kettle中建立一个Hadoop Hive 2类型数据库连接。

远程连接虚拟机进入 Hive 目录然后启动 HiveServer2 服务,命令hiveserver2”,


在Kettle工作区左侧的“主对象树”标签中,选择“DB 连接” → 右键新建”,对话框输入如图所示的属性值

在这里插入图片描述
上图的数据库连接配置窗口中的选项定义说明如下

点击“测试”,应该弹出成功连接窗口

为了让其它转换作业能够使用此数据库连接对象,需要将它设置为共享。选择 “DB连接”→ hive右键共享”,然后保存作业

原文地址:https://blog.csdn.net/qq_61828116/article/details/134772259

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任

如若转载,请注明出处:http://www.7code.cn/show_36116.html

如若内容造成侵权/违法违规/事实不符,请联系代码007邮箱suwngjj01@126.com进行投诉反馈,一经查实,立即删除

发表回复

您的电子邮箱地址不会被公开。 必填项已用 * 标注