8月19日,Oracle發布了JDK 8u20,JDK 8u20包含許多新特性,例如Java編譯器更新、支援在運行時透過API來修改MinHeapFreeRatio和MaxHeapFreeRatio參數、新的GC調優指南文件。不過在眾多新特性中,最令人期待的還屬字串去重(String Deduplication )。如何減少記憶體佔用一直是一個永恆的話題,而在Java應用程式中,經常會看到String物件會佔用應用30%的內存,它是Java中最常用的物件之一。新的字串去重特性可以幫助減少應用程式中String物件的記憶體佔用,目前此特性只適用於G1垃圾收集器,且預設不會開啟。
Fabian Lange解釋了字串去重特性的實作方式:
複製代碼代碼如下:
垃圾收集器會在存取String物件時對其字元陣列進行標記,並將String的雜湊值以及弱引用儲存到一個陣列中。當垃圾收集器發現另一個具有相同雜湊值的String物件時,它就會逐字元比對這兩個物件。如果他們完全匹配,那麼其中一個String就會被修改指向到另一個String的字元陣列。由於第一個字元數組已經不再被引用,所以它也就可以被回收了。垃圾收集器會盡量減少整個操作的開銷,例如某個String物件掃描未發現有重複,那麼接下來的一段時間它就不會再被檢查。
緊接著,Fabian Lange透過程式碼的方式解釋了字串去重特性的神奇效果。首先使用Java 8 Update 20透過參數-Xmx256m -XX:+UseG1GC執行以下程式碼:
複製代碼代碼如下:
public class LotsOfStrings {
private static final LinkedList<String> LOTS_OF_STRINGS = new LinkedList<>();
public static void main(String[] args) throws Exception {
int iteration = 0;
while (true) {
for (int i = 0; i < 100; i++) {
for (int j = 0; j < 1000; j++) {
LOTS_OF_STRINGS.add(new String("String " + j));
}
}
iteration++;
System.out.println("Survived Iteration: " + iteration);
Thread.sleep(100);
}
}
}
程式碼會在30次循環之後因OutOfMemoryError異常而結束運行。使用參數-XX:+UseStringDeduplication -XX:+PrintStringDeduplicationStatistics開啟字串去重特性後,程式可以多執行一段時間。透過JVM的日誌也可以詳細了解整個去重過程的詳細資訊。請讀者自行測試。
最後,Fabian Lange也解釋了字串去重與字串駐留的區別,它們很相似,除了字串駐留重用了整個的String實例,而字串去重只是針對String的字元陣列。
(全文完)