Hive07_多表查询_代码007(未授权)

本文介绍: 【代码】Hive07_多表查询。

Hive 支持通常的 SQL JOIN 语句。

1）案例实操
（1）根据员工表和部门表中的部门编号相等，查询员工编号、员工名称和部门名称；

hive (default)> select e.empno, e.ename, d.deptno, d.dname from emp e join dept d on e.deptno = d.deptno;

1）好处
（1）使用别名可以简化查询。
（2）使用表名前缀可以提高执行效率。

2）案例实操
合并员工表和部门表

hive (default)> select e.empno, e.ename, d.deptno from emp e join dept d on e.deptno = d.deptno;

内连接：只有进行连接的两个表中都存在与连接条件相匹配的数据才会被保留下来。

hive (default)> select e.empno, e.ename, d.deptno from emp e join dept d on e.deptno = d.deptno;

左外连接：JOIN 操作符左边表中符合 WHERE 子句的所有记录将会被返回。

hive (default)> select e.empno, e.ename, d.deptno from emp e left join dept d on e.deptno = d.deptno;

hive (default)> select e.empno, e.ename, d.deptno from emp e right join dept d on e.deptno = d.deptno;

hive (default)> select e.empno, e.ename, d.deptno from emp e full join dept d on e.deptno = d.deptno;

create table if not exists location(
loc int,
loc_name string
)
row format delimited fields terminated by 't';

hive (default)> load data local inpath '/usr/soft/datas/location.txt' 
into table location;

hive (default)>SELECT e.ename, d.dname, l.loc_name
FROM emp e 
JOIN dept d
ON d.deptno = e.deptno 
JOIN location l
ON d.loc = l.loc;

hive (default)> select empno, dname from emp, dept;

hive (default)> select * from emp order by sal;

hive (default)> select * from emp order by sal desc;

hive (default)> select ename, sal*2 twosal from emp order by twosal;

hive (default)> select ename, deptno, sal from emp order by deptno, sal;

hive (default)> set mapreduce.job.reduces=3;

hive (default)> set mapreduce.job.reduces;

hive (default)> select * from emp sort by deptno desc;

hive (default)> insert overwrite local directory 
'/usr/soft/data/sortby-result'
select * from emp sort by deptno desc;

hive (default)> set mapreduce.job.reduces=3;
hive (default)> insert overwrite local directory 
'/usr/soft/data/distribute-result' select * from emp distribute by 
deptno sort by empno desc;

hive (default)> select * from emp cluster by deptno;
hive (default)> select * from emp distribute by deptno sort by deptno;

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

HIVE多表查询

1 Join 语句

1) 等值 Join

2) 表的别名

3) 内连接

4) 左外连接

5) 右外连接

6) 满外连接

7) 多表连接

8) 笛卡尔积

2 排序

1) 全局排序（Order By）

2) 按照别名排序

3) 多个列排序

4) 每个 Reduce 内部排序（Sort By）

5) 分区（Distribute By）

6) Cluster By

发表回复取消回复