博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
yarn模式运行spark作业所有属性详解
阅读量:6708 次
发布时间:2019-06-25

本文共 1791 字,大约阅读时间需要 5 分钟。

摘要:Spark 参数调优,可以大大提高工作中程序的运行效率。

下面简单介绍一下这些常用的调优参数

属性名称 默认值 含义

spark.yarn.am.memory 512m client模式下,YARN Application Master使用的内存总量

spark.yarn.am.cores 1 client模式下,Application Master使用的cpu数量

spark.driver.cores 1 cluster模式下,driver使用的cpu core数量,driver与Application Master运行在一个进程中,所以也控制了Application Master的cpu数量

spark.yarn.am.waitTime 100s cluster模式下,Application Master要等待SparkContext初始化的时长; client模式下,application master等待driver来连接它的时长

spark.yarn.submit.file.replication hdfs副本数 作业写到hdfs上的文件的副本数量,比如工程jar,依赖jar,配置文件等,最小一定是1

spark.yarn.preserve.staging.files false 如果设置为true,那么在作业运行完之后,会避免工程jar等文件被删除掉

spark.yarn.scheduler.heartbeat.interval-ms 3000 application master向resourcemanager发送心跳的间隔,单位ms

spark.yarn.scheduler.initial-allocation.interval 200ms application master在有pending住的container分配需求时,立即向resourcemanager发送心跳的间隔

spark.yarn.max.executor.failures executor数量*2,最小3 整个作业判定为失败之前,executor最大的失败次数

spark.yarn.historyServer.address spark history server的地址

spark.yarn.dist.archives 每个executor都要获取并放入工作目录的archive

spark.yarn.dist.files 每个executor都要放入的工作目录的文件

spark.executor.instances 2 默认的executor数量

spark.yarn.executor.memoryOverhead executor内存10% 每个executor的堆外内存大小,用来存放诸如常量字符串等东西

spark.yarn.driver.memoryOverhead driver内存7% 同上

spark.yarn.am.memoryOverhead AM内存7% 同上

spark.yarn.am.port 随机 application master端口

spark.yarn.jar spark jar文件的位置

spark.yarn.access.namenodes spark作业能访问的hdfs namenode地址

spark.yarn.containerLauncherMaxThreads 25 application master能用来启动executor container的最大线程数量

spark.yarn.am.extraJavaOptions application master的jvm参数

spark.yarn.am.extraLibraryPath application master的额外库路径

spark.yarn.maxAppAttempts 提交spark作业最大的尝试次数

spark.yarn.submit.waitAppCompletion true cluster模式下,client是否等到作业运行完再退出

本文转自  ChinaUnicom110  51CTO博客,原文链接:http://blog.51cto.com/xingyue2011/1952570

转载地址:http://qjslo.baihongyu.com/

你可能感兴趣的文章
[20/N]得趣论
查看>>
g++: command not found
查看>>
[注释代码块] iOS生成标准的注释工具——VVDocumenter
查看>>
win7下安装多个MySQL
查看>>
编写和测试自定义类加载器
查看>>
mysql数据库各存储引擎之间的区别
查看>>
深度学习相关资料
查看>>
SpringBoot 集成 Elasticsearch
查看>>
[转]前端看Cookie
查看>>
×_7_15_2013 I: 小强的Linux
查看>>
quartz CronTrigger表达式整理
查看>>
用户定位 User Location
查看>>
图文混排 文字垂直居中对齐
查看>>
Oracle 导出表,提示表不存在。
查看>>
Qt Socket简单通信
查看>>
mysql驱动使用的zeroDateTimeBehavior=convertToNull与or...
查看>>
我的友情链接
查看>>
puppet自动化运维之函数
查看>>
如何优雅地过滤敏感词
查看>>
我的Python成长之路—04
查看>>