一次超詭異的FGC，你之前肯定沒碰到過的場景，快Get起來_技术 _ 頭條網

正擼著代碼，內部聊天工具彈出一條信息：“我這個機器總是頻繁FGC...快幫我看看

”

我打開對話框，機智的回覆一個表情：

繼續默默擼碼，代碼是我的命，一日不擼，就藍瘦。隨後，小夥伴砸了一段GC日誌過來：

<code>2019-09-17T20:33:57.889+0800: 4753520.554: [Full GC (Metadata GC Threshold) 4753520.554: [CMS[YG occupancy: 723220 K (1887488 K)]4753520.988: [weak refs process ing, 0.0042134 secs]4753520.992: [classunloading, 0.0987343 secs]4753521.091: [scrub symbol table, 0.0237609 secs]4753521.115: [scrubstringtable, 0.0025983 s ecs]: 145423K->141376K(3354624K), 0.6260023 secs] 868644K->864597K(5242112K), [Metaspace: 128179K->128179K(1234944K)], 0.6264315 secs] [Times: user=1.24 sys=0.0 0, real=0.63 secs]/<code>

<code>4159962 Heap after GC invocations=8029 (full 50):/<code>

<code>4159963 par newgeneration total 1887488K, used 723220K [0x0000000673400000, 0x00000006f3400000, 0x00000006f3400000)/<code>

<code>4159964 eden space 1677824K, 42% used [0x0000000673400000, 0x000000069ed59090, 0x00000006d9a80000)/<code>

<code>4159965 fromspace 209664K, 4% used [0x00000006d9a80000, 0x00000006da36c210, 0x00000006e6740000)/<code>

<code>4159966 to space 209664K, 0% used [0x00000006e6740000, 0x00000006e6740000, 0x00000006f3400000)/<code>

<code>4159967 concurrent mark-sweep generation total 3354624K, used 141376K [0x00000006f3400000, 0x00000007c0000000, 0x00000007c0000000)/<code>

<code>4159968 Metaspace used 128145K, capacity 136860K, committed 262144K, reserved 1234944K/<code>

<code>4159969 classspace used 14443K, capacity 16168K, committed 77312K, reserved 1048576K/<code>

<code>4159971 {Heap before GC invocations=8029 (full 50):/<code>

<code>4159972 par newgeneration total 1887488K, used 723220K [0x0000000673400000, 0x00000006f3400000, 0x00000006f3400000)/<code>

<code>4159973 eden space 1677824K, 42% used [0x0000000673400000, 0x000000069ed59090, 0x00000006d9a80000)/<code>

<code>4159974 fromspace 209664K, 4% used [0x00000006d9a80000, 0x00000006da36c210, 0x00000006e6740000)/<code>

<code>4159975 to space 209664K, 0% used [0x00000006e6740000, 0x00000006e6740000, 0x00000006f3400000)/<code>

<code>4159976 concurrent mark-sweep generation total 3354624K, used 141376K [0x00000006f3400000, 0x00000007c0000000, 0x00000007c0000000)/<code>

<code>4159977 Metaspace used 128145K, capacity 136860K, committed 262144K, reserved 1234944K/<code>

<code>4159978 classspace used 14443K, capacity 16168K, committed 77312K, reserved 1048576K/<code>

我這慧眼一瞧，看到了幾個關鍵單詞 <code>FullGC/<code>、<code>MetadataGCThreshold/<code>，然後很隨意的回覆了

“是不是metaspace沒有設置，或者設置太小，導致的FGC ”

然後，又砸過來一段JVM參數配置

<code>CATALINA_OPTS="$CATALINA_OPTS -server -Djava.awt.headless=true -Xms5324m -Xmx5324m -Xss512k -XX:PermSize=350m -XX:MaxPermSize=350m -XX:MetaspaceSize=256m -XX:MaxMet aspaceSize=256m -XX:NewSize=2048m -XX:MaxNewSize=2048m -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=9 -XX:+UseConcMarkSweepGC -XX:+UseCMSInitiatingOccupancyOnly -XX :+CMSScavengeBeforeRemark -XX:+ScavengeBeforeFullGC -XX:+UseCMSCompactAtFullCollection -XX:+CMSParallelRemarkEnabled -XX:CMSFullGCsBeforeCompaction=9 -XX:CMSInitiat ingOccupancyFraction=80 -XX:+CMSClassUnloadingEnabled -XX:SoftRefLRUPolicyMSPerMB=0 -XX:-ReduceInitialCardMarks -XX:+CMSPermGenSweepingEnabled -XX:CMSInitiatingPerm OccupancyFraction=80 -XX:+ExplicitGCInvokesConcurrent -Djava.nio.channels.spi.SelectorProvider=[sun.nio.ch](http://sun.nio.ch/).EPollSelectorProvider -Djava.util.logging.manager=org.apac he.juli.ClassLoaderLogManager -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintGCApplicationConcurrentTime -XX:+PrintGCApplicationStoppedTime -XX:+PrintHeapAtGC -Xloggc:/data/applogs/heap_trace.txt -XX:+IgnoreUnrecognizedVMOptions -XX:-HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/data/applogs/HeapDumpOnOutOfMemoryError"/<code>

“應該不是，我們配置了

-XX:MaxMetaspaceSize=256m

-XX:MetaspaceSize=256m”

看到配置之後，有點懵逼，好像超出了我的認知範圍，一下子沒回復，又扔過來一堆數據。

“看cat監控數據，Metaspace使用率在50%的時候就FGC了，GC 日誌上的顯示也只用了142M，可是我們明明設置了初始值是256M，最大值250M，這還沒達到閾值 ”

機智如我，趕緊回覆 “等等，我空的時候再看看 ”

等空閒下來，又想起了這個問題，決定好好研究下。

既然是Metadata GC Threshold引起的FGC，那麼只可能是MetadataSpace使用完了，我又反覆的看了下GC日誌片段，盯著看了會

<code>4159977 Metaspace used 128145K, capacity 136860K, committed 262144K, reserved 1234944K/<code>

發生FGC之前，Metaspace的committed確實達到了256M，但是used卻只有125M，難道某一次的類初始化需要大於256 - 125 = 131M？

這顯然不合理，排除掉這種情況，那麼只有一種解釋了，Metaspace包含了太多了內存碎片，導致這256M中沒有足夠大的連續內存。

之前聽過老年代因為CMS的標記清理會產生內存碎片導致FGC，為什麼Metaspace也會有這樣的問題？

讓同事對有問題的機器dump了下，用mat打開之後，發現了新大陸，裡面包含了大量的類加載器。

難道這個碎片問題是大量類加載器引起的？

本地驗證

有了這個疑問，那就簡單了，看看能不能在本地復現。

1、先定義一個自定義的類加載器，破壞雙親委派

<code>publicclassMyClassLoaderextendsClassLoader {/<code>

<code>@Override/<code>

<code>protectedClass> findClass(String name)throwsClassNotFoundException {/<code>

<code>String filePath = "/Users/zhanjun/Desktop/" + name.replace('.', File.separatorChar) + ".class";/<code>

<code>//指定讀取磁盤上的某個文件夾下的.class文件：/<code>

<code>File file = newFile(filePath);/<code>

<code>FileInputStream fis = newFileInputStream(file);/<code>

<code>byte bytes =newbyte[fis.available()];/<code>

<code>fis.read(bytes);/<code>

<code>//調用defineClass方法，將字節數組轉換成Class對象/<code>

<code>Class> clazz = this.defineClass(name, bytes, 0, bytes.length);/<code>

<code>fis.close;/<code>

<code>returnclazz;/<code>

<code>}catch

(FileNotFoundException e){/<code>

<code>e.printStackTrace;/<code>

<code>} catch(IOException e) {/<code>

<code>e.printStackTrace;/<code>

<code>} finally{/<code>

<code>returnsuper.findClass(name);/<code>

2、然後在while循環中，不斷的 load 已經編譯好的class文件

<code>publicstaticvoidmain(String[] args)throwsException {/<code>

<code>while(true) {/<code>

<code>Class clazz0 = newMyClassLoader.loadClass("com.sankuai.discover.memory.OOM");/<code>

3、最後，配置一下jvm啟動參數

<code>-Xmx2688M -Xms2688M -Xmn960M -XX:MetaspaceSize=50M -XX:MaxMetaspaceSize=100M -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintHeapAtGC -XX:+UseConcMarkSweepGC/<code>

啟動之後，不一會兒在控制檯果然出現了日誌

<code>{Heap before GC invocations=0 (full 0):/<code>

<code>par newgeneration total 884736K, used 330302K [0x0000000752400000, 0x000000078e400000, 0x000000078e400000)/<code>

<code>eden space 786432K, 42% used [0x0000000752400000, 0x000000076668fae0, 0x0000000782400000)/<code>

<code>fromspace 98304K, 0% used [0x0000000782400000, 0x0000000782400000, 0x0000000788400000)/<code>

<code>to space 98304K, 0% used [0x0000000788400000, 0x0000000788400000, 0x000000078e400000)/<code>

<code>concurrent mark-sweep generation total 1769472K, used 0K [0x000000078e400000, 0x00000007fa400000, 0x00000007fa400000)/<code>

<code>Metaspace used 22636K, capacity 102360K, committed 102400K, reserved 1118208K/<code>

<code>classspace used 8829K, capacity 33008K, committed 33008K, reserved 1048576K/<code>

<code>2019-09-21T16:09:28.562-0800: [Full GC (Metadata GC Threshold) 2019-09-21T16:09:28.562-0800: [CMS: 0K->5029K(1769472K), 0.0987115 secs] 330302K->5029K(2654208K), [Metaspace: 22636K->22636K(1118208K)], 0.1340367 secs] [Times: user=0.11 sys=0.03, real=0.13 secs] /<code>

<code>Heap after GC invocations=1 (full 1):/<code>

<code>par newgeneration total 884736K, used 0K [0x0000000752400000, 0x000000078e400000, 0x000000078e400000)/<code>

<code>eden space 786432K, 0% used [0x0000000752400000, 0x0000000752400000, 0x0000000782400000)/<code>

<code>from

space 98304K, 0% used [0x0000000782400000, 0x0000000782400000, 0x0000000788400000)/<code>

<code>to space 98304K, 0% used [0x0000000788400000, 0x0000000788400000, 0x000000078e400000)/<code>

<code>concurrent mark-sweep generation total 1769472K, used 5029K [0x000000078e400000, 0x00000007fa400000, 0x00000007fa400000)/<code>

<code>Metaspace used 2885K, capacity 4500K, committed 43008K, reserved 1058816K/<code>

<code>classspace used 291K, capacity 388K, committed 33008K, reserved 1048576K/<code>

從日誌可以看出來，發生FGC之前，used大概22M，committed已經達到100M，這時再加載class的時候，需要申請內存，就不夠了，只能通過FGC對Metaspace的內存進行整理壓縮。

到現在，我們已經驗證了過多的類加載器確實可以引起FGC。

碎片是怎麼產生的？

其實，JVM內部為了實現高效分配，在類加載器第一次加載類的時候，會在Metaspace分配一個獨立的內存塊，隨後該類加載加載的類信息都保存在該內存塊。但如果這個類加載器只加載了一個類或者少數類，那這塊內存就被浪費了，如果類加載器又特別多，那內存碎片就產生了。

本地驗證

碎片是怎麼產生的？

相關文章:

Fedora 32 正式發佈！

用三面字節經歷帶你學習：網絡+IO+redis+JVM+GC+紅黑樹+數據結構

字節跳動三面拿offer：網絡+IO+redis+JVM+GC+紅黑樹+數據結構

2020年近期最全Java面試題：數據結構+算法+JVM+線程+finalize+GC

c語言自學教程（一）

JAVA系列-GC

吃驚，大神級別的黑客教你pwn二進制安全環境搭建！

看過無數 Java GC 文章，這 5 個問題你也未必知道

【c++知識系列】c++這門語言能做些什麼？

JVM深入解析：運行時數據區+HotSpot+JMM+堆+GC+JVM優化+類加載

Go：內存管理與內存清理

Java核心知識 JVM GC 分代收集算法 VS 分區收集算法（六）

2020年全網最全Java面試題：數據結構+算法+JVM+線程+finalize+GC

Full GC 和 Minor GC，傻傻分不清楚

「每日一庫」一個零 GC 的緩存庫：freecache

03.06 軟件特攻隊｜Qt開發者將可使用VS開發Linux項目

02.28 Qt編寫的項目作品3-輸入法V2018

2020年後臺開發程序員應該學習的8大技術

02.27 2020年後臺開發程序員應該學習的8大技術

ParNew & CMS GC

02.11 2020年史上最全Java面試題：數據結構+算法+JVM+線程+finalize+GC

2020年史上最全Java面試題：數據結構+算法+JVM+線程+finalize+GC

面試官問我：談談對 Java GC 的瞭解？回答完讓我回家等消息....

01.07 小米java社招面試記錄：MySQL+架構設計+GC+二叉樹，帶備戰思路

都在這裡！Java(GC)垃圾收集器和收集算法

頻繁 full gc 處理方式

關於ThreadLocal內存洩露

今日頭條Java三面：GC+堆排+Tomcat+算法題

aws 基本環境安裝

面試官：如何減少長時間的 GC 停頓？

apache-spark-2.4.0-bin-hadoop2.7集群安裝

高吞吐、低延遲 Java 應用的 GC 優化實踐

java分代收集：Minor GC、Major GC和Full GC之間的區別

JVM-GC-串行回收器-SerialGC實戰

JVM 如何 GC

JVM G1 GC 算法原理

關於Java 9 中的 GC 調優

04.29 查看 Linux 發行版名稱和版本號的 8 種方法

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

學Java編程還有前景嗎 如何才能拿到高薪

Python網絡爬蟲之配置篇（一）

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

Python的運行效率太低？幾行代碼快速提升！

python的優點是什麼？最新Python400集視頻（附教程）

MySQL中OOM故障應如何下手-愛可生

像專家一樣使用 panic

30種不同的編程語言怎麼寫“Hello, World”

percona QAN 介紹

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

網絡工程師職業生涯中，哪兩點是最重要的？

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

Hive分桶表

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

第一章 Spring Framework概述

opencv人工智能深度學習這樣實現人臉的年齡檢測

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪