Products
GG网络技术分享 2025-11-16 22:20 1
哇,巨大家晓得吗?YARN的配置啊, 就像我们家里的房间一样,需要优良优良布置,才Neng让我们的Spark应用程序住得舒服、玩得开心呢!那下面我就来给巨大家介绍一下这些个神秘的配置吧!

YARN的配置基本上包括以下内容哦: . ResourceManager的内存设置:yarn.scheduler.minimum-allocation-mb,yarn.scheduler.maximum-allocation-mb . NodeManager的内存设置:yarn.nodemanager.resource.memory-mb . NodeManager的Core设置:yarn.nodemanager.resource.cpu-vcores . YARN默认内存设置:yarn.scheduler.minimum-allocation-mb,yarn.scheduler.maximum-allocation-mb . 用户队列设置:yarn.scheduler.capacity.root.queues . 个个队列材料占比设置:yarn.scheduler.capacity.root.{queue-name}.capacity
spark-submit \--class com.example.spark.app \--master yarn-client \--deploy-mode client \--num-executors \--executor-cores \--executor-memory 2g \./path/to/your/app.jar
哦,Spark on YARN的本质啊,就像把Spark和YARN这两个优良朋友放在一起,他们互相帮,Spark在YARN的照顾下Nenggeng高大效地利用Hadoop集群的分布式材料调度和管理功Neng,就像我们的优良朋友一起玩得geng开心一样!
Spark on YARN是一个hen棒的分布式计算框架, 它Neng根据应用程序的需要,动态分配材料,调度任务,还Neng处理错误,保证了程序的稳稳当当性和速度。而且, Spark on YARN还Neng和Hadoop的其他细小伙伴一起玩耍,形成一个超级团队,实现数据处理和琢磨的一体化。
在client mode模式下 Driver程序就像个迅速递员,把任务送到集群中去,然后等全部任务完成后再把后来啊带回来。而在cluster mode模式下Driver程序就在集群里和Executor程序一起干活。
Spark on YARN有两种模式,就像我们的两种游戏方式一样,各有特点。
client mode模式,就像我们玩游戏时一个人在电脑上玩,其他人在旁边观kan。Driver程序在客户端运行, 向YARN提交应用,然后YARN在集群中找到可用的Executor进行任务的施行。
而cluster mode模式, 就像是巨大家一起在同一个屏幕上玩游戏,Driver程序和Executor程序在同一个容器里一起干活。
所以说通过学Spark on Yarn的配置,我们就Neng让我们的Spark应用程序在Hadoop集群上跑得geng迅速、geng稳、geng平安。就像我们的优良朋友一起努力,玩得geng开心一样!
Demand feedback