面试篇spark（spark core，spark sql，spark 优化）

互联网 1 年前 0 4

本文介绍: 相比较 map–reduce 框架，spark的框架执行效率更加高效。m ap reduce的执行框架示意图。spark执行框架示意图spark的执行中间结果是存储在内存当中的，而hdfs的执行中间结果是存储在hdfs中的。所以在运算的时候，spark的执行效率是reduce的3-5倍。

相比较 m ap–reduce 框架，spark的框架执行效率更加高效。
m ap reduce的执行框架示意图。
在这里插入图片描述
sp a rk执行框架示意图

sp a rk的执行中间结果是存储在内存当中的，而hdfs的执行中间结果是存储在hdfs中的。所以在运算的时候，sp a rk的执行效率是reduce的3-5倍。

spark是一个执行引擎。

spark RDD五大特性。

每个 rdd中，part i t ion的个数和由hdfs中的m ap的个数决定的。和map的个数保持一致。

RDD的宽窄依赖。
一对一的就是窄依赖。
一对多的就是宽依赖。
在计算进行切割的时候，会将所有的窄依赖放在一起，成为一个 stage。放在一个TaskSched uler中进行计算。
在这里插入图片描述

sh uffle
Has hSh uffle
在这里插入图片描述

显示所有内容

声明：本站所有文章，如无特殊说明或标注，均为本站原创发布。任何个人或组织，在未征得本站同意时，禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益，可联系我们进行处理。

spark 执行框架

相关文章

【Java EE】—-Spring框架创建和使用

【Java EE】—-Spring框架创建和使用

java 1 年前 5

JVM Java虚拟机入门指南

JVM Java虚拟机入门指南

java 1 年前 2

PySpark（四）PySpark SQL、Catalyst优化器、Spark SQL的执行流程、Spark新特性

PySpark（四）PySpark SQL、Catalyst优化器、Spark SQL的执行流程、Spark新特性

互联网 1 年前 4

SpringBoot+Slf4j+Logback日志记录方案

SpringBoot+Slf4j+Logback日志记录方案

spring 1 年前 2

常见的Web前端开发框架推荐

互联网 1 年前 6

PHP框架详解 – symfony框架

PHP框架详解 – symfony框架

互联网 1 年前 8

JVM之GC垃圾回收

互联网 1 年前 3

行为型设计模式—中介者模式

互联网 1 年前 4

发表回复取消回复