前言
上一篇文章說了CAS 原理,其中說到了Atomic* 類,他們實現原子操作的機制就依靠了volatile 的內存可見性特性。如果還不了解CAS 和Atomic*,建議看一下我們說的CAS 自旋鎖是什麼
並發的三個特性
首先說我們如果要使用volatile 了,那肯定是在多線程並發的環境下。我們常說的並發場景下有三個重要特性:原子性、可見性、有序性。只有在滿足了這三個特性,才能保證並發程序正確執行,否則就會出現各種各樣的問題。
原子性,上篇文章說到的CAS 和Atomic* 類,可以保證簡單操作的原子性,對於一些負責的操作,可以使用synchronized 或各種鎖來實現。
可見性,指當多個線程訪問同一個變量時,一個線程修改了這個變量的值,其他線程能夠立即看得到修改的值。
有序性,程序執行的順序按照代碼的先後順序執行,禁止進行指令重排序。看似理所當然的事情,其實並不是這樣,指令重排序是JVM為了優化指令,提高程序運行效率,在不影響單線程程序執行結果的前提下,盡可能地提高並行度。但是在多線程環境下,有些代碼的順序改變,有可能引發邏輯上的不正確。
而volatile 做實現了兩個特性,可見性和有序性。所以說在多線程環境中,需要保證這兩個特性的功能,可以使用volatile 關鍵字。
volatile 是如何保證可見性的
說到可見性,就要了解一下計算機的處理器和主存了。因為多線程,不管有多少個線程,最後還是要在計算機處理器中進行的,現在的計算機基本都是多核的,甚至有的機器是多處理器的。我們看一下多處理器的結構圖:
這是兩個處理器,四核的CPU。一個處理器對應一個物理插槽,多處理器間通過QPI總線相連。一個處理器包含多個核,一個處理器間的多核共享L3 Cache。一個核包含寄存器、L1 Cache、L2 Cache。
在程序執行的過程中,一定要涉及到數據的讀和寫。而我們都知道,雖然內存的訪問速度已經很快了,但是比起CPU執行指令的速度來,還是差的很遠的,因此,在內核中,增加了L1、L2、L3 三級緩存,這樣一來,當程序運行的時候,先將所需要的數據從主存複製一份到所在核的緩存中,運算完成後,再寫入主存中。下圖是CPU 訪問數據的示意圖,由寄存器到高速緩存再到主存甚至硬盤的速度是越來越慢的。
了解了CPU 結構之後,我們來看一下程序執行的具體過程,拿一個簡單的自增操作舉例。
i=i+1;
執行這條語句的時候,在某個核上運行的某線程將i 的值拷貝一個副本到此核所在的緩存中,當運算執行完成後,再回寫到主存中去。如果是多線程環境下,每一個線程都會在所運行的核上的高速緩存區有一個對應的工作內存,也就是每一個線程都有自己的私有工作緩存區,用來存放運算需要的副本數據。那麼,我們再來看這個i+1 的問題,假設i 的初始值為0,有兩個線程同時執行這條語句,每個線程執行都需要三個步驟:
1、從主存讀取i 值到線程工作內存,也就是對應的內核高速緩存區;
2、計算i+1 的值;
3、將結果值寫回主存中;
建設兩個線程各執行10,000 次後,我們預期的值應該是20,000 才對,可惜很遺憾,i 的值總是小於20,000 的。導致這個問題的其中一個原因就是緩存一致性問題,對於這個例子來說,一旦某個線程的緩存副本做了修改,其他線程的緩存副本應該立即失效才對。
而使用了volatile 關鍵字後,會有如下效果:
1、每次對變量的修改,都會引起處理器緩存(工作內存)寫回到主存;
2、一個工作內存回寫到主存會導致其他線程的處理器緩存(工作內存)無效。
因為volatile 保證內存可見性,其實是用到了CPU 保證緩存一致性的MESI 協議。 MESI 協議內容較多,這裡就不做說明,請各位同學自己去查詢一下吧。總之用了volatile 關鍵字,當某線程對volatile 變量的修改會立即回寫到主存中,並且導致其他線程的緩存行失效,強制其他線程再使用變量時,需要從主存中讀取。
那麼我們把上面的i 變量用volatile 修飾後,再次執行,每個線程執行10,000 次。很遺憾,還是小於20,000 的。這是為什麼呢?
volatile 利用CPU 的MESI 協議確實保證了可見性。但是,注意了,volatile 並沒有保證操作的原子性,因為這個自增操作是分三步的,假設線程1 從主存中讀取了i 值,假設是10 ,並且此時發生了阻塞,但是還沒有對i進行修改,此時線程2 也從主存中讀取了i 值,這時這兩個線程讀取的i 值是一樣的,都是10 ,然後線程2 對i 進行了加1 操作,並立即寫回主存中。此時,根據MESI 協議,線程1 的工作內存對應的緩存行會被置為無效狀態,沒錯。但是,請注意,線程1 早已經將i 值從主存中拷貝過了,現在只要執行加1 操作和寫回主存的操作了。而這兩個線程都是在10 的基礎上加1 ,然後又寫回主存中,所以最後主存的值只是11 ,而不是預期的12 。
所以說,使用volatile 可以保證內存可見性,但無法保證原子性,如果還需要原子性,可以參考,之前的這篇文章。
volatile 是如何保證有序性的
Java 內存模型具備一些先天的“有序性”,即不需要通過任何手段就能夠得到保證的有序性,這個通常也稱為happens-before 原則。如果兩個操作的執行次序無法從happens-before 原則推導出來,那麼它們就不能保證它們的有序性,虛擬機可以隨意地對它們進行重排序。
如下是happens-before 的8條原則,摘自《深入理解Java虛擬機》。
這裡主要說一下volatile 關鍵字的規則,舉一個著名的單例模式中的雙重檢查的例子:
class Singleton{ private volatile static Singleton instance = null; private Singleton() { } public static Singleton getInstance() { if(instance==null) { // step 1 synchronized (Singleton.class) { if(instance==null) // step 2 instance = new Singleton(); //step 3 } } return instance; } }如果instance 不用volatile 修飾,可能產生什麼結果呢,假設有兩個線程在調用getInstance() 方法,線程1 執行步驟step1 ,發現instance 為null ,然後同步鎖住Singleton 類,接著再次判斷instance 是否為null ,發現仍然是null,然後執行step 3 ,開始實例化Singleton 。而在實例化的過程中,線程2 走到step 1,有可能發現instance 不為空,但是此時instance 有可能還沒有完全初始化。
什麼意思呢,對像在初始化的時候分三個步驟,用下面的偽代碼表示:
memory = allocate(); //1. 分配對象的內存空間ctorInstance(memory); //2. 初始化對象instance = memory; //3. 設置instance 指向對象的內存空間
因為步驟2 和步驟3 需要依賴步驟1,而步驟2 和步驟3 並沒有依賴關係,所以這兩條語句有可能會發生指令重排,也就是或有可能步驟3 在步驟2 的之前執行。在這種情況下,步驟3 執行了,但是步驟2 還沒有執行,也就是說instance 實例還沒有初始化完畢,正好,在此刻,線程2 判斷instance 不為null,所以就直接返回了instance 實例,但是,這個時候instance 其實是一個不完全的對象,所以,在使用的時候就會出現問題。
而使用volatile 關鍵字,也就是使用了“對一個volatile修飾的變量的寫,happens-before於任意後續對該變量的讀” 這一原則,對應到上面的初始化過程,步驟2 和3 都是對instance 的寫,所以一定發生於後面對instance 的讀,也就是不會出現返回不完全初始化的instance 這種可能。
JVM 底層是通過一個叫做“內存屏障”的東西來完成。內存屏障,也叫做內存柵欄,是一組處理器指令,用於實現對內存操作的順序限制。
最後
通過volatile 關鍵字,我們了解了一下並發編程中的可見性和有序性,當然只是簡單的了解。更深入的了解,還得靠各位同學自己去鑽研。
相關文章
我們說的CAS 自旋鎖是什麼
總結
以上就是這篇文章的全部內容了,希望本文的內容對大家的學習或者工作具有一定的參考學習價值,如果有疑問大家可以留言交流,謝謝大家對武林網的支持。