当前位置：首页 > 建站教程 >

实时计算框架：Spark集群搭建与入门案例

GG网络技术分享 2025-03-18 16:09 46

一、Spark概述

1、Spark简介

Spark是专为大规模数据处理而设计的，基于内存快速通用,可扩展的集群计算引擎，实现了高效的DAG执行引擎,可以通过基于内存来高效处理数据流，运算速度相比于MapReduce得到了显著的提高。

2、运行结构

Driver

运行Spark的Applicaion中main()函数，会创建SparkContext，SparkContext负责和Cluster-Manager进行通信，并负责申请资源、任务分配和监控等。

ClusterManager

负责申请和管理在WorkerNode上运行应用所需的资源，可以高效地在一个计算节点到数千个计算节点之间伸缩计算，目前包括Spark原生的ClusterManager、ApacheMesos和HadoopYARN。

Executor

Application运行在WorkerNode上的一个进程，作为工作节点负责运行Task任务，并且负责将数据存在内存或者磁盘上，每个 Application都有各自独立的一批Executor，任务间相互独立。

二、环境部署

1、Scala环境

安装包管理

[root@hop01


                    
                        
                            标签：   
                        
                    

                    
                    
                        
                            
                                 上一篇： 
                                「Spark从入门到精通」11.使用Spark管理、部署和扩展机器学习  
                            
                            
                                 下一篇： 
                                大数据学习：SparkRDD操作入门


                
                    为您推荐
                    
                    
                        
                             
                            
                                「Spark从入门到精通」11.使用Spark管理、部署和扩展机器学习
                            
                            
                            
                                Spark—15分钟教程
                            
                            
                            
                                从零开始学Spark（一）
                            
                            
                            
                                ApacheSpark简单入门教程
                            
                            
                            
                                SPARK官方教程系列快速入门
                            
                            
                            
                                大数据学习：SparkRDD操作入门
                            
                            
                            
                                从零开始学Spark（二）——了解Spark
                            
                            
                            
                                「Spark从入门到精通系列」2.Spark入门介绍与基础案例
                            
                            
                            
                                Pandas最详细教程来了
                            
                            
                            
                                这是我见过最全面的pandas用法！太详细了！

建站教程

实时计算框架：Spark集群搭建与入门案例

一、Spark概述

1、Spark简介

2、运行结构

二、环境部署

1、Scala环境

为您推荐

提交需求或反馈

产品中心

H5单页免费源码

免费源码

联系我们

QQ在线客服

关注微信