02.28 Java集合詳解

2020-02-28 10:41:15 SoftCloud

雖然經常用java集合，在工作中經常開發單位信息管理系統影響不大，但在一些特殊開發場景還是要

詳細瞭解不同的特性的。

Java的集合主要有List , Set, Map

List , Set繼承至Collection接口，Map為獨立接口

List下有ArrayList，LinkedList，Vector

Set下有HashSet，LinkedHashSet，TreeSetMap下有HashMap，LinkedHashMap， TreeMap，Hashtable

總結:Connection接口:

1.List 有序,可重複

ArrayList:優點: 底層數據結構是數組，查詢快，增刪慢。缺點: 線程不安全，效率高

LinkedList:優點: 底層數據結構是鏈表，查詢慢，增刪快。缺點: 線程不安全，效率高

Vector:優點: 底層數據結構是數組，查詢快，增刪慢。缺點: 線程安全，效率低

2.Set 無序,唯一

（1）HashSet：底層數據結構是哈希表。(無序,唯一)如何來保證元素唯一性?1.依賴兩個方法：hashCode()和equals()

HashSet底層數據結構採用哈希表實現，元素無序且唯一，線程不安全，效率高，可以存儲null元素，元素的唯一性是靠所存儲元素類型是否重寫hashCode()和equals()方法來保證的，如果沒有重寫這兩個方法，則無法保證元素的唯一性。

具體實現唯一性的比較過程:

<code>1.存儲元素時首先會使用hash()算法函數生成一個int類型hashCode散列值，然後已經的所存儲的元素的hashCode值比較，如果hashCode不相等，肯定是不同的對象。2.hashCode值相同，再比較equals方法。3.equals相同，對象相同。（則無需儲存）/<code>

（2）LinkedHashSet：底層數據結構是鏈表和哈希表。(FIFO插入有序,唯一)1.由鏈表保證元素有序2.由哈希表保證元素唯一

LinkedHashSet底層數據結構採用鏈表和哈希表共同實現，鏈表保證了元素的順序與存儲順序一致，哈希表保證了元素的唯一性。線程不安全，效率高。

（3）TreeSet：底層數據結構是紅黑樹。(唯一，有序)1. 如何保證元素排序的呢?自然排序比較器排序2.如何保證元素唯一性的呢?根據比較的返回值是否是0來決定

TreeSet底層數據結構採用紅黑樹來實現，元素唯一且已經排好序；唯一性同樣需要重寫hashCode和equals()方法，二叉樹結構保證了元素的有序性。根據構造方法不同，分為自然排序（無參構造）和比較器排序（有參構造），自然排序要求元素必須實現Compareable接口，並重寫裡面的compareTo()方法，元素通過比較返回的int值來判斷排序序列，返回0說明兩個對象相同，不需要存儲；比較器排需要在TreeSet初始化是時候傳入一個實現Comparator接口的比較器對象，或者採用匿名內部類的方式new一個Comparator對象，重寫裡面的compare()方法；

紅黑樹：

在學習紅黑樹之前，咱們需要先來理解下二叉查找樹（BST）。

二叉查找樹

要想了解二叉查找樹，我們首先看下二叉查找樹有哪些特性呢？

1，左子樹上所有的節點的值均小於或等於他的根節點的值

2，右子數上所有的節點的值均大於或等於他的根節點的值

3，左右子樹也一定分別為二叉排序樹

我們來看下圖的這棵樹，他就是典型的二叉查找樹

紅黑樹

紅黑樹就是一種平衡的二叉查找樹，說他平衡的意思是他不會變成“瘸子”，左腿特別長或者右腿特別長。除了符合二叉查找樹的特性之外，還具體下列的特性：

1. 節點是紅色或者黑色

2. 根節點是黑色

3. 每個葉子的節點都是黑色的空節點（NULL）

4. 每個紅色節點的兩個子節點都是黑色的。

5. 從任意節點到其每個葉子的所有路徑都包含相同的黑色節點。

看下圖就是一個典型的紅黑樹：

TreeSet的兩種排序方式比較

1.基本數據類型默認按升序排序

2.自定義排序

（1）自然排序：重寫Comparable接口中的Compareto方法

（2）比較器排序：重寫Comparator接口中的Compare方法

<code>compare(T o1,T o2)      比較用來排序的兩個參數。/<code>

<code>o1：代表當前添加的數據o2：代表集合中已經存在的數據0： 表示 o1 == o2-1(逆序輸出)： o1 < o2 1(正序輸出): o1 > o2 /<code>

1：o1 - o2（升序排列）-1：o2 - o1 (降序排列)

例子1：

<code> 1 import java.util.Comparator; 2 import java.util.Set; 3 import java.util.TreeSet; 4  5 public class Test { 6     public static void main(String[] args) { 7  8         /** 9          * 自定義規則的TreeSet10          * 客戶端排序：自己寫一個比較器，轉給TreeSet11          *12          * 比較規則13          * 當TreeSet集合添加數據的時候就會觸發比較器的compare()方法14          */15         Comparator<integer> comp = new Comparator<integer>() {16             /**17              * o1 當前添加的數據18              * o2 集合中已經存在的數據19              * 0： 表示 o1 == o220              * -1 ： o1 < o221              * 1 : o1 > o222              */23             @Override24             public int compare(Integer o1, Integer o2) {25                 System.out.println(o1+"--"+o2);26                 return o2 -o1; //輸出53 33 10，降序排序27               //  return  0;  //只輸出一個元素：3328               //   return -1; //輸出53 10 33，倒序輸出29               //  return 1;  //輸出33 10 5530             }31         };32 33         Set<integer> s2 = new TreeSet<>(comp);34         s2.add(33);35         s2.add(10);36         s2.add(55);37 38         System.out.println(s2); //輸入53 33 10，降序排序39 40     }41 }/<integer>/<integer>/<integer>/<code>

例2：

<code> 1 import java.util.Comparator; 2 import java.util.Iterator; 3 import java.util.Set; 4 import java.util.TreeSet; 5  6 /** 7  * 使用TreeSet和Comparator（使用匿名類），寫Test.java 8  * 要求：對TreeSet中的元素 9  *     1，2，3，4，5，6，7，8，9，10進行排列，10  * 排序邏輯為奇數在前偶數在後，11  * 奇數按照升序排列，偶數按照降序排列12  * 輸出結果：1 3 5 7 9 10 8 6 4 213  */14 public class Test {15     public static void main(String[] args) {16         Set<integer> s = new TreeSet<>(new Comparator<integer>() {17             //重寫compare方法18             @Override19             public int compare(Integer o1, Integer o2) {20                 System.out.println("o1="+o1+" o2="+o2);21                 if(o2%2==0){22                     if (o1%2==0){23                             return o2 -o1;24                     }else{25                         return -1;26                     }27                 }else {28                     if (o1%2==0){29                         return 1;30                     }else{31                         return o1 -o2;32                     }33                 }34 35 36             }37         });38 39         s.add(2);40         s.add(6);41         s.add(4);42         s.add(1);43         s.add(3);44         s.add(5);45         s.add(8);46         s.add(10);47         s.add(9);48         s.add(7);49 50         Iterator iterator = s.iterator();51 52         while(iterator.hasNext()){53             System.out.print(iterator.next()+" ");54         }55 56     }57 }/<integer>/<integer>/<code>

輸出結果：

3.Map接口:

Map用於保存具有映射關係的數據，Map裡保存著兩組數據：key和value，它們都可以使任何引用類型的數據，但key不能重複。所以通過指定的key就可以取出對應的value。

Map接口有四個比較重要的實現類，分別是HashMap、LinkedHashMap、TreeMap和HashTable。

TreeMap是有序的，HashMap和HashTable是無序的。

Hashtable的方法是同步的，HashMap的方法不是同步的。這是兩者最主要的區別。

HashMap

Map 主要用於存儲鍵(key)值(value)對，根據鍵得到值，因此鍵不允許重複,但允許值重複。HashMap 是一個最常用的Map,它根據鍵的HashCode 值存儲數據,根據鍵可以直接獲取它的值，具有很快的訪問速度。HashMap最多隻允許一條記錄的鍵為Null;允許多條記錄的值為 Null;HashMap不支持線程的同步，即任一時刻可以有多個線程同時寫HashMap;可能會導致數據的不一致。如果需要同步，可以用 Collections的synchronizedMap方法使HashMap具有同步的能力，或者使用ConcurrentHashMap。HashMap基於哈希表結構實現的，當一個對象被當作鍵時，必須重寫hasCode和equals方法。

LinkedHashMap

LinkedHashMap繼承自HashMap，它主要是用鏈表實現來擴展HashMap類，HashMap中條目是沒有順序的，但是在LinkedHashMap中元素既可以按照它們插入圖的順序排序，也可以按它們最後一次被訪問的順序排序。

TreeMap

TreeMap基於紅黑樹數據結構的實現，鍵值可以使用Comparable或Comparator接口來排序。TreeMap繼承自AbstractMap，同時實現了接口NavigableMap，而接口NavigableMap則繼承自SortedMap。SortedMap是Map的子接口，使用它可以確保圖中的條目是排好序的。

在實際使用中，如果更新圖時不需要保持圖中元素的順序，就使用HashMap，如果需要保持圖中元素的插入順序或者訪問順序，就使用LinkedHashMap，如果需要使圖按照鍵值排序，就使用TreeMap。

Hashtable

Hashtable和前面介紹的HashMap很類似，它也是一個散列表，存儲的內容是鍵值對映射，不同之處在於，Hashtable是繼承自Dictionary的，Hashtable中的函數都是同步的，這意味著它也是線程安全的，另外，Hashtable中key和value都不可以為null。

適用場景分析:HashSet是基於Hash算法實現的，其性能通常都優於TreeSet。為快速查找而設計的Set，我們通常都應該使用HashSet，在我們需要排序的功能時，我們才使用TreeSet。

怎麼選擇：

遍歷map實例

<code> 1 import java.util.HashMap;   2 import java.util.Iterator;   3 import java.util.Map;   4    5 public class Test {      6      7     public static void main(String[] args) {      8         Map<string> map = new HashMap<string>();      9         map.put("first", "linlin");     10         map.put("second", "好好學java");     11         map.put("third", "sihai");    12         map.put("first", "sihai2");   13     14     15         // 第一種：通過Map.keySet遍歷key和value     16         System.out.println("===================通過Map.keySet遍歷key和value:===================");     17         for (String key : map.keySet()) {     18             System.out.println("key= " + key + "  and  value= " + map.get(key));     19         }     20              21         // 第二種：通過Map.entrySet使用iterator遍歷key和value     22         System.out.println("===================通過Map.entrySet使用iterator遍歷key和value:===================");     23         Iterator<map.entry>> it = map.entrySet().iterator();     24         while (it.hasNext()) {     25             Map.Entry<string> entry = it.next();     26             System.out.println("key= " + entry.getKey() + "  and  value= "    27                     + entry.getValue());     28         }     29     30         // 第三種：通過Map.entrySet遍歷key和value     31         System.out.println("===================通過Map.entrySet遍歷key和value:===================");     32         for (Map.Entry<string> entry : map.entrySet()) {     33             System.out.println("key= " + entry.getKey() + "  and  value= "    34                     + entry.getValue());     35         }     36     37         // 第四種：通過Map.values()遍歷所有的value，但是不能遍歷鍵key     38         System.out.println("===================通過Map.values()遍歷所有的value:===================");     39         for (String v : map.values()) {     40             System.out.println("value= " + v);     41         }     42     }     43     44 }    /<string>/<string>/<map.entry>/<string>/<string>/<code>

重點問題重點分析:

（一）說說List,Set,Map三者的區別？

List(對付順序的好幫手)： List接口存儲一組不唯一（可以有多個元素引用相同的對象），有序的對象
Set(注重獨一無二的性質): 不允許重複的集合。不會有多個元素引用相同的對象。
Map(用Key來搜索的專家): 使用鍵值對存儲。Map會維護與Key有關聯的值。兩個Key可以引用相同的對象，但Key不能重複，典型的Key是String類型，但也可以是任何對象。

（二）Arraylist 與 LinkedList 區別?

1. 是否保證線程安全： ArrayList 和 LinkedList 都是不同步的，也就是不保證線程安全；
2. 底層數據結構： Arraylist 底層使用的是 Object 數組；LinkedList 底層使用的是雙向鏈表數據結構（JDK1.6之前為循環鏈表，JDK1.7取消了循環。注意雙向鏈表和雙向循環鏈表的區別，下面有介紹到！）
3. 插入和刪除是否受元素位置的影響： ① ArrayList 採用數組存儲，所以插入和刪除元素的時間複雜度受元素位置的影響。比如：執行add(E e) 方法的時候， ArrayList 會默認在將指定的元素追加到此列表的末尾，這種情況時間複雜度就是O(1)。但是如果要在指定位置 i 插入和刪除元素的話（add(int index, E element) ）時間複雜度就為 O(n-i)。因為在進行上述操作的時候集合中第 i 和第 i 個元素之後的(n-i)個元素都要執行向後位/向前移一位的操作。 ② LinkedList 採用鏈表存儲，所以插入，刪除元素時間複雜度不受元素位置的影響，都是近似 O（1）而數組為近似 O（n）。
4. 是否支持快速隨機訪問： LinkedList 不支持高效的隨機元素訪問，而 ArrayList 支持。快速隨機訪問就是通過元素的序號快速獲取元素對象(對應於get(int index) 方法)。
5. 內存空間佔用： ArrayList的空間浪費主要體現在在list列表的結尾會預留一定的容量空間，而LinkedList的空間花費則體現在它的每一個元素都需要消耗比ArrayList更多的空間（因為要存放直接後繼和直接前驅以及數據）。

1.ArrayList是實現了基於動態數組的數據結構，LinkedList基於鏈表的數據結構。　　

2.對於隨機訪問get和set，ArrayList覺得優於LinkedList，因為LinkedList要移動指針。　　

3.對於新增和刪除操作add和remove，LinedList比較佔優勢，因為ArrayList要移動數據。儘量避免同時遍歷和刪除集合。因為這會改變集合的大小；

（三）ArrayList 與 Vector 區別呢?為什麼要用Arraylist取代Vector呢？

Vector類的所有方法都是同步的。可以由兩個線程安全地訪問一個Vector對象、但是一個線程訪問Vector的話代碼要在同步操作上耗費大量的時間。

Arraylist不是同步的，所以在不需要保證線程安全時建議使用Arraylist。

（四）說一說 ArrayList 的擴容機制吧

https://github.com/Snailclimb/JavaGuide/blob/master/docs/java/collection/ArrayList-Grow.md

（五）HashSet與TreeSet與LinkedHashSet對比

HashSet不能保證元素的排列順序，順序有可能發生變化，不是同步的，集合元素可以是null,但只能放入一個nullTreeSet是SortedSet接口的唯一實現類，TreeSet可以確保集合元素處於排序狀態。TreeSet支持兩種排序方式，自然排序和定製排序，其中自然排序為默認的排序方式。向 TreeSet中加入的應該是同一個類的對象。TreeSet判斷兩個對象不相等的方式是兩個對象通過equals方法返回false，或者通過CompareTo方法比較沒有返回0自然排序自然排序使用要排序元素的CompareTo（Object obj）方法來比較元素之間大小關係，然後將元素按照升序排列。定製排序自然排序是根據集合元素的大小，以升序排列，如果要定製排序，應該使用Comparator接口，實現 int compare(To1,To2)方法LinkedHashSet集合同樣是根據元素的hashCode值來決定元素的存儲位置，但是它同時使用鏈表維護元素的次序。這樣使得元素看起來像是以插入順序保存的，也就是說，當遍歷該集合時候，LinkedHashSet將會以元素的添加順序訪問集合的元素。

LinkedHashSet在迭代訪問Set中的全部元素時，性能比HashSet好，但是插入時性能稍微遜色於HashSet。

（六）LinkedHashMap和HashMap，TreeMap對比

Hashtable與 HashMap類似,它繼承自Dictionary類，不同的是:它不允許記錄的鍵或者值為空;它支持線程的同步，即任一時刻只有一個線程能寫Hashtable,因此也導致了 Hashtable在寫入時會比較慢。Hashmap 是一個最常用的Map,它根據鍵的HashCode 值存儲數據,根據鍵可以直接獲取它的值，具有很快的訪問速度，遍歷時，取得數據的順序是完全隨機的。LinkedHashMap保存了記錄的插入順序，在用Iterator遍歷LinkedHashMap時，先得到的記錄肯定是先插入的.也可以在構造時用帶參數，按照應用次數排序。在遍歷的時候會比HashMap慢，不過有種情況例外，當HashMap容量很大，實際數據較少時，遍歷起來可能會比LinkedHashMap慢，因為LinkedHashMap的遍歷速度只和實際數據有關，和容量無關，而HashMap的遍歷速度和他的容量有關。TreeMap實現SortMap接口，能夠把它保存的記錄根據鍵排序,默認是按鍵值的升序排序，也可以指定排序的比較器，當用Iterator 遍歷TreeMap時，得到的記錄是排過序的。我們用的最多的是HashMap,HashMap裡面存入的鍵值對在取出的時候是隨機的,在Map 中插入、刪除和定位元素，HashMap 是最好的選擇。TreeMap取出來的是排序後的鍵值對。但如果您要按

自然順序或自定義順序遍歷鍵，那麼TreeMap會更好。LinkedHashMap 是HashMap的一個子類，如果需要輸出的順序和輸入的相同,那麼用LinkedHashMap可以實現,它還可以按讀取順序來排列，像連接池中可以應用。

（七）HashMap 和 Hashtable 的區別

線程是否安全： HashMap 是非線程安全的，HashTable 是線程安全的；HashTable 內部的方法基本都經過synchronized 修飾。（如果你要保證線程安全的話就使用 ConcurrentHashMap 吧！）；
效率：因為線程安全的問題，HashMap 要比 HashTable 效率高一點。另外，HashTable 基本被淘汰，不要在代碼中使用它；
對Null key 和Null value的支持： HashMap 中，null 可以作為鍵，這樣的鍵只有一個，可以有一個或多個鍵所對應的值為 null。。但是在 HashTable 中 put 進的鍵值只要有一個 null，直接拋出 NullPointerException。
初始容量大小和每次擴充容量大小的不同 ： ①創建時如果不指定容量初始值，Hashtable 默認的初始大小為11，之後每次擴充，容量變為原來的2n+1。HashMap 默認的初始化大小為16。之後每次擴充，容量變為原來的2倍。②創建時如果給定了容量初始值，那麼 Hashtable 會直接使用你給定的大小，而 HashMap 會將其擴充為2的冪次方大小（HashMap 中的tableSizeFor()方法保證，下面給出了源代碼）。也就是說 HashMap 總是使用2的冪作為哈希表的大小,後面會介紹到為什麼是2的冪次方。
底層數據結構： JDK1.8 以後的 HashMap 在解決哈希衝突時有了較大的變化，當鏈表長度大於閾值（默認為8）時，將鏈表轉化為紅黑樹，以減少搜索時間。Hashtable 沒有這樣的機制。

（八）HashMap 和 HashSet區別

如果你看過 HashSet 源碼的話就應該知道：HashSet 底層就是基於 HashMap 實現的。（HashSet 的源碼非常非常少，因為除了 clone() 、writeObject()、readObject()是 HashSet 自己不得不實現之外，其他方法都是直接調用 HashMap 中的方法。

（九）HashSet如何檢查重複

當你把對象加入HashSet時，HashSet會先計算對象的hashcode值來判斷對象加入的位置，同時也會與其他加入的對象的hashcode值作比較，如果沒有相符的hashcode，HashSet會假設對象沒有重複出現。但是如果發現有相同hashcode值的對象，這時會調用equals（）方法來檢查hashcode相等的對象是否真的相同。如果兩者相同，HashSet就不會讓加入操作成功。（摘自我的Java啟蒙書《Head fist java》第二版）

hashCode（）與equals（）的相關規定：

如果兩個對象相等，則hashcode一定也是相同的
兩個對象相等,對兩個equals方法返回true
兩個對象有相同的hashcode值，它們也不一定是相等的
綜上，equals方法被覆蓋過，則hashCode方法也必須被覆蓋
hashCode()的默認行為是對堆上的對象產生獨特值。如果沒有重寫hashCode()，則該class的兩個對象無論如何都不會相等（即使這兩個對象指向相同的數據）。

（十）HashMap的底層實現

JDK1.8之前

JDK1.8 之前 HashMap 底層是數組和鏈表結合在一起使用也就是鏈表散列。HashMap 通過 key 的 hashCode 經過擾動函數處理過後得到 hash 值，然後通過 (n - 1) & hash 判斷當前元素存放的位置（這裡的 n 指的是數組的長度），如果當前位置存在元素的話，就判斷該元素與要存入的元素的 hash 值以及 key 是否相同，如果相同的話，直接覆蓋，不相同就通過拉鍊法解決衝突。

所謂擾動函數指的就是 HashMap 的 hash 方法。使用 hash 方法也就是擾動函數是為了防止一些實現比較差的 hashCode() 方法換句話說使用擾動函數之後可以減少碰撞。

HashMap實現原理（比較好的描述）：HashMap以鍵值對（key-value）的形式來儲存元素，但調用put方法時，HashMap會通過hash函數來計算key的hash值，然後通過hash值&(HashMap.length-1)判斷當前元素的存儲位置，如果當前位置存在元素的話，就要判斷當前元素與要存入的key是否相同，如果相同則覆蓋，如果不同則通過拉鍊表來解決。JDk1.8時，當鏈表長度大於8時，將鏈表轉為紅黑樹。

JDK 1.8 HashMap 的 hash 方法源碼:

JDK 1.8 的 hash方法相比於 JDK 1.7 hash 方法更加簡化，但是原理不變。

<code>1     static final int hash(Object key) {2       int h;3       // key.hashCode()：返回散列值也就是hashcode4       // ^ ：按位異或5       // >>>:無符號右移，忽略符號位，空位都以0補齊6       return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);7   }/<code>

對比一下 JDK1.7的 HashMap 的 hash 方法源碼.

<code>1 static int hash(int h) {2     // This function ensures that hashCodes that differ only by3     // constant multiples at each bit position have a bounded4     // number of collisions (approximately 8 at default load factor).5 6     h ^= (h >>> 20) ^ (h >>> 12);7     return h ^ (h >>> 7) ^ (h >>> 4);8 }/<code>

相比於 JDK1.8 的 hash 方法，JDK 1.7 的 hash 方法的性能會稍差一點點，因為畢竟擾動了 4 次。

所謂 “拉鍊法” 就是：將鏈表和數組相結合。也就是說創建一個鏈表數組，數組中每一格就是一個鏈表。若遇到哈希衝突，則將衝突的值加到鏈表中即可。

JDK1.8之後

相比於之前的版本， JDK1.8之後在解決哈希衝突時有了較大的變化，當鏈表長度大於閾值（默認為8）時，將鏈表轉化為紅黑樹，以減少搜索時間。

TreeMap、TreeSet以及JDK1.8之後的HashMap底層都用到了紅黑樹。紅黑樹就是為了解決二叉查找樹的缺陷，因為二叉查找樹在某些情況下會退化成一個線性結構。

（十一）HashMap 的長度為什麼是2的冪次方

為了能讓 HashMap 存取高效，儘量較少碰撞，也就是要儘量把數據分配均勻。我們上面也講到了過了，Hash 值的範圍值-2147483648到2147483647，前後加起來大概40億的映射空間，只要哈希函數映射得比較均勻鬆散，一般應用是很難出現碰撞的。但問題是一個40億長度的數組，內存是放不下的。所以這個散列值是不能直接拿來用的。用之前還要先做對數組的長度取模運算，得到的餘數才能用來要存放的位置也就是對應的數組下標。這個數組下標的計算方法是“ (n - 1) & hash”。（n代表數組長度）。這也就解釋了 HashMap 的長度為什麼是2的冪次方。

這個算法應該如何設計呢？

我們首先可能會想到採用%取餘的操作來實現。但是，重點來了：“取餘(%)操作中如果除數是2的冪次則等價於與其除數減一的與(&)操作（也就是說 hash%length==hash&(length-1)的前提是 length 是2的 n 次方；）。” 並且採用二進制位操作 &，相對於%能夠提高運算效率，這就解釋了 HashMap 的長度為什麼是2的冪次方。

（十二）HashMap 多線程操作導致死循環問題

主要原因在於併發下的Rehash 會造成元素之間會形成一個循環鏈表。不過，jdk 1.8 後解決了這個問題，但是還是不建議在多線程下使用 HashMap,因為多線程下使用 HashMap 還是會存在其他問題比如數據丟失。併發環境下推薦使用 ConcurrentHashMap 。

Rehash：一般來說，Hash表這個容器當有數據要插入時，都會檢查容量有沒有超過設定的thredhold，如果超過，需要增大Hash表的尺寸，但是這樣一來，整個Hash表裡的無素都需要被重算一遍。這叫rehash，這個成本相當的大。

（十三）ConcurrentHashMap 和 Hashtable 的區別

ConcurrentHashMap 和 Hashtable 的區別主要體現在實現線程安全的方式上不同。

底層數據結構： JDK1.7的 ConcurrentHashMap 底層採用 分段的數組+鏈表 實現，JDK1.8 採用的數據結構跟HashMap1.8的結構一樣，數組+鏈表/紅黑二叉樹。Hashtable 和 JDK1.8 之前的 HashMap 的底層數據結構類似都是採用 數組+鏈表 的形式，數組是 HashMap 的主體，鏈表則是主要為了解決哈希衝突而存在的；
實現線程安全的方式（重要）： ① 在JDK1.7的時候，ConcurrentHashMap（分段鎖） 對整個桶數組進行了分割分段(Segment)，每一把鎖只鎖容器其中一部分數據，多線程訪問容器裡不同數據段的數據，就不會存在鎖競爭，提高併發訪問率。 到了 JDK1.8 的時候已經摒棄了Segment的概念，而是直接用 Node 數組+鏈表+紅黑樹的數據結構來實現，併發控制使用 synchronized 和 CAS 來操作。（JDK1.6以後對 synchronized鎖做了很多優化）整個看起來就像是優化過且線程安全的 HashMap，雖然在JDK1.8中還能看到 Segment 的數據結構，但是已經簡化了屬性，只是為了兼容舊版本；② Hashtable(同一把鎖) :使用 synchronized 來保證線程安全，get/put所有相關操作都是synchronized的，這相當於給整個哈希表加了一把大鎖,效率非常低下。當一個線程訪問同步方法時，其他線程也訪問同步方法，可能會進入阻塞或輪詢狀態，如使用 put 添加元素，另一個線程不能使用 put 添加元素，也不能使用 get，競爭會越來越激烈效率越低。

兩者的對比圖：

HashTable:

JDK1.7的ConcurrentHashMap：

（十四）ConcurrentHashMap線程安全的具體實現方式/底層具體實現

JDK1.7（上面有示意圖）

首先將數據分為一段一段的存儲，然後給每一段數據配一把鎖，當一個線程佔用鎖訪問其中一個段數據時，其他段的數據也能被其他線程訪問。

ConcurrentHashMap 是由 Segment 數組結構和 HashEntry 數組結構組成。

Segment 實現了 ReentrantLock,所以 Segment 是一種可重入鎖，扮演鎖的角色。HashEntry 用於存儲鍵值對數據。

<code>static class Segment extends ReentrantLock implements Serializable {}/<code>

一個 ConcurrentHashMap 裡包含一個 Segment 數組。Segment 的結構和HashMap類似，是一種數組和鏈表結構，一個 Segment 包含一個 HashEntry 數組，每個 HashEntry 是一個鏈表結構的元素，每個 Segment 守護著一個HashEntry數組裡的元素，當對 HashEntry 數組的數據進行修改時，必須首先獲得對應的 Segment的鎖。

JDK1.8 （上面有示意圖）

ConcurrentHashMap取消了Segment分段鎖，採用CAS和synchronized來保證併發安全。數據結構跟HashMap1.8的結構類似，數組+鏈表/紅黑二叉樹。Java 8在鏈表長度超過一定閾值（8）時將鏈表（尋址時間複雜度為O(N)）轉換為紅黑樹（尋址時間複雜度為O(log(N))）

synchronized只鎖定當前鏈表或紅黑二叉樹的首節點，這樣只要hash不衝突，就不會產生併發，效率又提升N倍。

（十五）comparable 和 Comparator的區別

comparable接口實際上是出自java.lang包它有一個 compareTo(Object obj)方法用來排序
comparator接口實際上是出自 java.util 包它有一個compare(Object obj1, Object obj2)方法用來排序

一般我們需要對一個集合使用自定義排序時，我們就要重寫compareTo()方法或compare()方法，當我們需要對某一個集合實現兩種排序方式，比如一個song對象中的歌名和歌手名分別採用一種排序方法的話，我們可以重寫compareTo()方法和使用自制的Comparator方法或者以兩個Comparator來實現歌名排序和歌星名排序，第二種代表我們只能使用兩個參數版的 Collections.sort().

分享到:

閱讀更多 SoftCloud 的文章

關鍵字: 算法數據結構信息管理系統

ArrayList哪種循環效率更好你真的清楚嗎

JAVA List 集合深複製與潛複製

Java 源碼分析-Byte類分析

java 動態調用類的方法

Java 實現線程的方式有幾種方式？帶有返回值的線程怎麼實現？

Java—發送GET、POST請求工具

JAVA 轉換樹結構數據

java static關鍵字深入理解

Java HashMap源碼學習

Java 循環隊列原理與用法詳解

Java-字符串

Java 程序中不使用第三個變量交換兩個字符串

Java 隨機生成中文名字

Java 內部類詳解

03.08 Java 遍歷List 集合的四種方法

Java HashMap遍歷的四種方式

03.08 Java HashMap遍歷的四種方式

Java 如何優雅的統計代碼塊耗時

Java：Serializable反序列化過程

03.02 Java HashMap 常用方法詳解

Java 動態代理的簡單使用和理解

一遍記住 Java 常用的八種排序算法與代碼實現

01.30 Java Serializable：明明就一個空的接口嘛

java 線程池的原理及使用

多個角度全方位帶你看透 Java 線程池（附學習參考思路）

「Java基礎」Java 反射的幾種方式

09.27 java 獲取當前時間的三種方法

JAVA:什麼情況下需要判空對象？

java 遠程接口調用RIC 矩陣計算實現

Java 集合系列： Map架構，看完才知道邏輯思維的重要性

java 一步一步教你手寫ReentrantLock(二）

Java 基礎之詳解 Java IO

Java 字段反射

Java NIO：NIO概述

Java 併發小結

Java NIO Buffer 分散和歸集

Java NIO Buffer 實踐與概念

java transient 關鍵字

java File類

Java NIO Demo

Java Web之HttpClient請求連接池連接池

08.16 Java 併發編程必看，為你解讀 Java 讀寫鎖實現原理

Java 內功修煉第一講之談談對 Java 平台的理解

Java 學習——Java 多線程三大核心點

05.31 Java高級編程——Java IO的flush

02.03 java getDeclaredXXX和getXXX方法，你是如何用，如何選擇的？

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"