Spark—SparkCore（一）_代码007(未授权)

本文介绍: 1、Master(standalone):资源管理的主节点（进程）2、Cluster Manager:在集群上获取资源的外部服务(例如：standalone,Mesos,Yarn)3、Worker Node(standalone):资源管理的从节点(进程)或者说管理本机资源的进程4、Driver Prog ram:用于连接工作进程(Worker)的程序。

1、Master(standalone):资源管理的主节点（进程）

2、Cluster Manager:在集群上获取资源的外部服务(例如：standalone,Mesos,Yarn)

3、Worker Node(standalone):资源管理的从节点(进程)或者说管理本机资源的进程

4、Driver Prog ram:用于连接工作进程(Worker)的程序

5、Executor:是一个worker进程所管理的节点上为某Application启动的一个进程，该进程负责运行任务，并且负责将数据存在内存或者磁盘上。每个应用都有各自独立的executors

6、Task：被送到某个executor上的工作单元

1.val conf = new SparkConf()
2.conf.setMaster("local").setAppName("pipeline");
3.val sc = new SparkContext(conf)
4.val rdd = sc.parallelize(Array(1,2,3,4))
5.val rdd1 = rdd.map { x => {
6.  println("map--------"+x)
7.  x
8.}}
9.val rdd2 = rdd1.filter { x => {
10.  println("fliter********"+x)
11.  true
12.} }
13.rdd2.collect()
14.sc.stop()