從源碼幫你剖析: Spark 新舊內(nèi)存管理方案(上篇)
牛肉圓粉不加蔥 | 2016-07-28 11:34
【數(shù)據(jù)猿導(dǎo)讀】 Spark 作為一個以擅長內(nèi)存計(jì)算為優(yōu)勢的計(jì)算引擎,內(nèi)存管理方案是其非常重要的模塊。作為使用者的我們,搞清楚 Spark 是如何管理內(nèi)存的,對我們編碼、調(diào)試及優(yōu)化過程會有很大幫助

Spark 作為一個以擅長內(nèi)存計(jì)算為優(yōu)勢的計(jì)算引擎,內(nèi)存管理方案是其非常重要的模塊。作為使用者的我們,搞清楚 Spark 是如何管理內(nèi)存的,對我們編碼、調(diào)試及優(yōu)化過程會有很大幫助。本文之所以取名為 “Spark 新舊內(nèi)存管理方案剖析” 是因?yàn)樵?Spark 1.6 中引入了新的內(nèi)存管理方案,加之當(dāng)前很多公司還在使用 1.6 以前的版本,所以本文會對這兩種方案進(jìn)行剖析。
剛剛提到自 1.6 版本引入了新的內(nèi)存管理方案,但并不是說在 1.6 版本中不能使用舊的方案,而是默認(rèn)使用新方案。我們可以通過設(shè)置 spark.memory.userLegacyMode 值來選擇,該值為 false 表示使用新方案,true 表示使用舊方案,默認(rèn)為 false。該值是如何發(fā)揮作用的呢?看了下面的代碼就明白了:
根據(jù) spark.memory.useLegacyMode 值的不同,會創(chuàng)建 MemoryManager 不同子類的實(shí)例:
值為 false:創(chuàng)建 UnifiedMemoryManager 類實(shí)例,該類為新的內(nèi)存管理模塊的實(shí)現(xiàn)
值為 true:創(chuàng)建 StaticMemoryManager類實(shí)例,該類為舊的內(nèi)存管理模塊的實(shí)現(xiàn)
MemoryManager 是用于管理內(nèi)存的虛基類,聲明了一些方法來管理用于 execution 、 storage 的內(nèi)存和其他內(nèi)存:
execution 內(nèi)存:用于 shuffles,如joins、sorts 和 aggregations,避免頻繁的 IO 而需要內(nèi)存 buffer
storage 內(nèi)存:用于 caching RDD,緩存 broadcast 數(shù)據(jù)及緩存 task results
其他內(nèi)存:在下文中說明
先來看看 MemoryManager 重要的成員和方法:
接下來,來看看 MemoryManager 的兩種實(shí)現(xiàn)
StaticMemoryManager
當(dāng) spark.memory.userLegacyMode 為 false 時,在 SparkEnv 中是這樣實(shí)例化 StaticMemoryManager:
調(diào)用的是 StaticMemoryManager 輔助構(gòu)造函數(shù),如下:
繼而調(diào)用主構(gòu)造函數(shù),如下:
這樣我們就可以推導(dǎo)出,對于 StaticMemoryManager,其用于 storage 的內(nèi)存大小等于 StaticMemoryManager.getMaxStorageMemory(conf);用于 execution 的內(nèi)存大小等于 StaticMemoryManager.getMaxExecutionMemory(conf),下面進(jìn)一步看看這兩個方法的實(shí)現(xiàn)
StaticMemoryManager.getMaxExecutionMemory(conf)
實(shí)現(xiàn)如下:
若設(shè)置了 spark.testing.memory 則以該配置的值作為 systemMaxMemory,否則使用 JVM 最大內(nèi)存作為 systemMaxMemory。spark.testing.memory 僅用于測試,一般不設(shè)置,所以這里我們認(rèn)為 systemMaxMemory 的值就是 executor 的最大可用內(nèi)存。
spark.shuffle.memoryFraction:shuffle 期間用于 aggregation 和 cogroups 的內(nèi)存占 executor 運(yùn)行時內(nèi)存的百分比,用小數(shù)表示。在任何時候,用于 shuffle 的內(nèi)存總 size 不得超過這個限制,超出部分會 spill 到磁盤。如果經(jīng)常 spill,考慮調(diào)大 spark.storage.memoryFraction
spark.shuffle.safetyFraction:為防止 OOM,不能把 systemMaxMemory * spark.shuffle.memoryFraction 全用了,需要有個安全百分比
所以最終用于 execution 的內(nèi)存量為:executor 最大可用內(nèi)存 spark.shuffle.memoryFractionspark.shuffle.safetyFraction,默認(rèn)為 executor 最大可用內(nèi)存 * 0.16
需要特別注意的是,即使用于 execution 的內(nèi)存不夠用了,但同時 executor 還有其他空余內(nèi)存,也不能給 execution 用
StaticMemoryManager.getMaxStorageMemory(conf)
實(shí)現(xiàn)如下:
分析過程與 getMaxExecutionMemory 一致,我們得出這樣的結(jié)論,用于storage 的內(nèi)存量為: executor 最大可用內(nèi)存 spark.storage.memoryFraction spark.storage.safetyFraction,默認(rèn)為 executor 最大可用內(nèi)存 * 0.54
spark.storage.memoryFraction:用于做 memory cache 的內(nèi)存占 executor 最大可用內(nèi)存的百分比,該值不應(yīng)大于老生代
spark.storage.safetyFraction:防止 OOM 的安全比例,由 spark.storage.safetyFraction控制,默認(rèn)為0.9。在 storage 中,有一部分內(nèi)存是給 unroll 使用的,unroll 即反序列化 block,該部分占比由 spark.storage.unrollFraction 控制,默認(rèn)為0.2
others
從上面的分析我們可以看到,storage 和 execution 總共使用了 80% 的內(nèi)存,那剩余 20% 去哪了?這部分內(nèi)存被系統(tǒng)保留了,用來存儲運(yùn)行中產(chǎn)生的對象
所以,各部分內(nèi)存占比可由下圖表示:
經(jīng)過上面的描述,我們搞明白了舊的內(nèi)存管理方案是如何劃分內(nèi)存的,也就可以根據(jù)我們實(shí)際的 app 來調(diào)整各個部分的比例。同時,我們可以明顯的看到這種內(nèi)存管理方式的缺陷,即 execution 和 storage 兩部分內(nèi)存固定死,不能共享,即使在一方內(nèi)存不夠用而另一方內(nèi)存空閑的情況下。這樣的方式經(jīng)常會造成內(nèi)存浪費(fèi),所以有必要引入支持共享,能更好利用內(nèi)存的方案,UnifiedMemoryManager 就應(yīng)運(yùn)而生了。
來源:簡書
刷新相關(guān)文章
我要評論
活動推薦more >
- 2018 上海國際大數(shù)據(jù)產(chǎn)業(yè)高2018-12-03
- 2018上海國際計(jì)算機(jī)網(wǎng)絡(luò)及信2018-12-03
- 中國國際信息通信展覽會將于2018-09-26
- 第五屆FEA消費(fèi)金融國際峰會62018-06-21
- 第五屆FEA消費(fèi)金融國際峰會2018-06-21
- “無界區(qū)塊鏈技術(shù)峰會2018”2018-06-14
不容錯過的資訊
-
1#后疫情時代的新思考#疫情之下,關(guān)于醫(yī)
-
2眾盟科技獲ADMIC 2020金粲獎“年度汽車
-
3數(shù)據(jù)智能 無限未來—2020世界人工智能大
-
4#2020非凡大賞:數(shù)字化風(fēng)起云涌時,共尋
-
5#榜樣的力量#天璣數(shù)據(jù)大腦疫情風(fēng)險感知
-
6#榜樣的力量#內(nèi)蒙古自治區(qū)互聯(lián)網(wǎng)醫(yī)療服
-
7#榜樣的力量#實(shí)時新型肺炎疫情數(shù)據(jù)小程
-
8#榜樣的力量#華佗疫情防控平臺丨數(shù)據(jù)猿
-
9#后疫情時代的新思考#構(gòu)建工業(yè)互聯(lián)網(wǎng)新
-
102020可信云大會丨《云MSP發(fā)展白皮書》重