Java虛擬機的Heap監獄

在Java虛擬機中,我是一個位高權重的大管家,他們都很怕我,尤其是那些Java 對象,我把他們圈到一個叫做Heap的“監獄”裡,嚴格管理,生殺大權盡在掌握。

中國人把Stack翻譯成“棧”,把Heap翻譯成“堆”, 還有人會把Stack翻譯成“堆棧”,唉,真不知道他們是怎麼想的, 不過這麼多年都過來了,你們明白就好。

碰巧我會對Heap中的Java 對象做垃圾回收,這個“堆”總是讓我聯想到垃圾堆。

說起垃圾回收,這實在是一個大負擔,原因很簡單,那些寫Java程序的人類只管把對象給new出來,扔到Heap 中, 但是從來不管把他delete 掉, 刪掉這些對象的責任就落到了我的頭上,我不嚴格管理怎麼行?

有時候我挺羨慕C和C++, 必須得手動地分配和釋放內存,出了錯都是程序員來背鍋。

在我這裡,如果任由這些對象對象肆意妄為,我那容量不高的,Java虛擬機啟動後就無法更改的Heap“監獄”很快就會被填滿, 所以我必須得派出我的得力助手,專門找到並且清理那些不用的Java 對象, 把他們佔據的空間給釋放掉。

為了找到這些搗亂分子,我發明了一個叫做“可達性分析”的算法,這個算法估計大部分人已經知道了,我就不再囉嗦了,下面這張圖說明了背後的思想,聰明的你一眼就能看出來, 橙色的對象都是不可達對象,可以回收。

Java虛擬機的Heap監獄

Heap監獄

好吧,現在詳細說一下我管理的Heap“監獄”。

你可以把它想象成一大片空間,為了方便管理, 我把Heap“監獄”劃分成多個區域,然後把那些Java對象在其中搬來搬去。

Java虛擬機的Heap監獄

Java虛擬機的Heap監獄

我定的規矩就是: 新來的傢伙們都要進入新生代待著,新生代住不下了,我就派出清理者進行垃圾回收(Minor GC),回收以後還住不下,那就把年齡大的老傢伙們趕到養老院(老年代)去。

每個在Heap中的Java對象我都會設置一個年齡計數器,每次Java對象熬過一次GC,就把年齡加1, 如果老到一定程度,對不起,請進入養老院(老年代)。 實際上我還會做動態的年齡判斷,這裡按下不表。

你可能會覺得奇怪,為什麼在新生代裡分出了Eden, Survivor1, Survivor2這樣奇怪的區域?

那是因為我想在這裡實現一個所謂的“複製”算法。

最早的時候, 我是把一個內存的區域劃分成大小相當的兩個區域,每次只用其中的一個。

Java虛擬機的Heap監獄

區域1用完了,我就做垃圾回收,把存活的都搬到另外一個區域。

注意:搬過去以後,他們都會緊緊地挨在一起居住,這樣以來,被清理掉的那些紅色碎片就會重新平整成一大塊空間,方便後續使用,尤其是針對大塊頭對象來了以後。

這麼來回顛倒著使用兩個區域,雖然效率高,沒有碎片,但是浪費的空間很巨大:每次只能用一半。

後來人類發現,大部分在新生代的對象都活不了多長時間,基本上一次垃圾回收就刪除得差不多了。

所以就改進了這個只用一半的複製算法, 把新生代分成三個部分:Eden , Survivor1, Survivor2 , 他們的比例是8:1:1。

每次只使用Eden 和其中一個Survivor , 當垃圾回收時,把這兩塊區域中還活著的對象複製到另外一個Survivor, 如果Survivor放不下,請進養老院(老年代)吧。

如果很不幸, 連養老院都住滿了,那隻好搞一次Full GC了,這是個很慢的操作,你們最好祈禱它不要頻繁發生。

“監獄”之外,大有可為

雖然我可以在Heap監獄內作威作福,有時候我也得接觸下監獄之外的世界。

有一次要通過Socket向外發送數據,我明明把數據準備好了,就在我的Heap中,可是JVM老大竟然把數據複製了一份到Heap之外的內存中去,然後才能通過Socket發送。

我問他這到底是怎麼回事,為什麼要多此一舉,難道是對我這個Heap監獄的大管家不放心?

JVM老大說確實是不放心,人家底層的Socket都是C語言寫的, 關注的是物理內存的地址, 你垃圾回收的時候把Java對象在什麼Eden, Survivor, 老年代之間挪來挪去,對象的地址也會變來變去, 我怎麼告訴人家到底發哪個地址的數據啊?

想想也是這個理兒,有得必有失,你程序員不用管理內存,但是底層還得和內存打交道,並且還額外多了一道工序:Copy 。

老大還說:“可能你還不知道,除了你的Heap監獄,其實我在Java進程中還有一塊兒叫做“Off-Heap內存’的地方,數據就會複製到這裡。 為了和你區分開,我把它叫做堆外內存。”

Java虛擬機的Heap監獄

Java虛擬機的Heap監獄

沒想到這裡還有一塊我都管不著的“飛地”!

不過它和我也沒有什麼競爭關係,由它去吧。

可是沒過幾天,JVM老大再次給我帶來了“驚喜”。

他說:“複製數據太麻煩了,我想了個辦法,可以在Java代碼中直接分配一塊屬於Off-Heap的內存。”

我覺得頭皮發矇:“直接在堆外內存分配?到底怎麼分配?”

老大給了我一段代碼:“看看,這不就分配了128M的堆外存嗎? 對這個buffer的讀寫操作會直接寫入堆外內存, 不用再經過你來複制了。”

ByteBuffer buffer = ByteBuffer.allocateDirect(1024*1024*128);

該死的面向接口編程,這個ByteBuffer分配出來的堆外內存,就像一個普通的Java對象在使用,絲毫看不出它在堆內還是在堆外。

完了,這塊內存我是徹底管不了了。

老大看出我情緒不對,安慰道: “這個buffer也是個Java對象啊, 就在你的Heap中存著,只不過它保存了那128M內存的信息而已。”

Java虛擬機的Heap監獄

Java虛擬機的Heap監獄

這還差不多 ! 既然它是個Java對象,那就得放到我的Heap監獄中,被我控制!

可以想象,這個對象被垃圾回收的時候, 它指向的直接內存才會被釋放。

我突然有了一個邪惡的想法:如果這樣的對象越來越多,並且一直不被垃圾回收,那對應的直接內存豈不也是不能釋放,然後Out of Memory ?

老大似乎看穿了我的思想:“對於這些對象,得特別小心,一定得確保能釋放。”

直接分配堆外內存的功能正式推出了,我發現分配起堆外內存要比堆內內存要慢一點,心想估計沒有多少人使用吧。 可沒想到的是它特別適合那些分配次數少,讀寫操作很頻繁的場景。於是就受到了Netty這些通信類系統的熱烈歡迎。

為了減少創建堆外內存的開銷,Netty 還引入了對象池的技術,就像數據庫連接池一樣,先分配一些堆外內存, 然後不斷地複用他們。

我沒想到堆外內存能玩出這麼多的花樣,但是一想到他們還是Java程序,還得用Java對象包裝,無論如何都跳不出我的手掌去,也就釋然了。


分享到:


相關文章: