Java線程的概念<br />和其他多數計算機語言不同,Java內置支持多線程編程(multithreaded programming)。
多線程程序包含兩條或兩條以上並發運行的部分。程序中每個這樣的部分都叫一個線程(thread),每個線程都有獨立的執行路徑。因此,多線程是多任務處理的一種特殊形式。
你一定知道多任務處理,因為它實際上被所有的現代操作系統所支持。然而,多任務處理有兩種截然不同的類型:基於進程的和基於線程的。認識兩者的不同是十分重要的。
對很多讀者,基於進程的多任務處理是更熟悉的形式。進程(process)本質上是一個執行的程序。因此,基於進程(process-based) 的多任務處理的特點是允許你的計算機同時運行兩個或更多的程序。舉例來說,基於進程的多任務處理使你在運用文本編輯器的時候可以同時運行Java編譯器。在基於進程的多任務處理中,程序是調度程序所分派的最小代碼單位。
在基於線程(thread-based) 的多任務處理環境中,線程是最小的執行單位。這意味著一個程序可以同時執行兩個或者多個任務的功能。例如,一個文本編輯器可以在打印的同時格式化文本。所以,多進程程序處理“大圖片”,而多線程程序處理細節問題。
多線程程序比多進程程序需要更少的管理費用。進程是重量級的任務,需要分配它們自己獨立的地址空間。進程間通信是昂貴和受限的。進程間的轉換也是很需要花費的。另一方面,線程是輕量級的選手。它們共享相同的地址空間並且共同分享同一個進程。線程間通信是便宜的,線程間的轉換也是低成本的。當Java程序使用多進程任務處理環境時,多進程程序不受Java的控制,而多線程則受Java控制。
多線程幫助你寫出CPU最大利用率的高效程序,因為空閒時間保持最低。這對Java運行的交互式的網絡互連環境是至關重要的,因為空閒時間是公共的。舉個例子來說,網絡的數據傳輸速率遠低於計算機處理能力,本地文件系統資源的讀寫速度遠低於CPU的處理能力,當然,用戶輸入也比計算機慢很多。在傳統的單線程環境中,你的程序必須等待每一個這樣的任務完成以後才能執行下一步――儘管CPU有很多空閒時間。多線程使你能夠獲得併充分利用這些空閒時間。
Java線程模型
Java運行系統在很多方面依賴於線程,所有的類庫設計都考慮到多線程。實際上,Java使用線程來使整個環境異步。這有利於通過防止CPU循環的浪費來減少無效部分。
為更好的理解多線程環境的優勢可以將它與它的對照物相比較。單線程系統的處理途徑是使用一種叫作輪詢的事件循環方法。在該模型中,單線程控制在一無限循環中運行,輪詢一個事件序列來決定下一步做什麼。一旦輪詢裝置返回信號表明,已準備好讀取網絡文件,事件循環調度控制管理到適當的事件處理程序。直到事件處理程序返回,系統中沒有其他事件發生。這就浪費了CPU時間。這導致了程序的一部分獨占了系統,阻止了其他事件的執行。總的來說,單線程環境,當一個線程因為等待資源時阻塞(block,掛起執行),整個程序停止運行。
Java多線程的優點在於取消了主循環/輪詢機制。一個線程可以暫停而不影響程序的其他部分。例如,當一個線程從網絡讀取數據或等待用戶輸入時產生的空閒時間可以被利用到其他地方。多線程允許活的循環在每一幀間隙中沉睡一秒而不暫停整個系統。在Java程序中出現線程阻塞,僅有一個線程暫停,其他線程繼續運行。
線程存在於好幾種狀態。線程可以正在運行(running)。只要獲得CPU時間它就可以運行。運行的線程可以被掛起(suspend),並臨時中斷它的執行。一個掛起的線程可以被恢復(resume,允許它從停止的地方繼續運行。一個線程可以在等待資源時被阻塞(block)。
在任何時候,線程可以終止(terminate),這立即中斷了它的運行。一旦終止,線程不能被恢復。
線程優先級
Java給每個線程安排優先級以決定與其他線程比較時該如何對待該線程。線程優先級是詳細說明線程間優先關係的整數。作為絕對值,優先級是毫無意義的;當只有一個線程時,優先級高的線程並不比優先權低的線程運行的快。相反,線程的優先級是用來決定何時從一個運行的線程切換到另一個。這叫“上下文轉換”(context switch)。決定上下文轉換發生的規則很簡單:
線程可以自動放棄控制。在I/O未決定的情況下,睡眠或阻塞由明確的讓步來完成。在這種假定下,所有其他的線程被檢測,準備運行的最高優先級線程被授予CPU。
線程可以被高優先級的線程搶占。在這種情況下,低優先級線程不主動放棄,處理器只是被先佔――無論它正在幹什麼――處理器被高優先級的線程佔據。基本上,一旦高優先級線程要運行,它就執行。這叫做有優先權的多任務處理。
當兩個相同優先級的線程競爭CPU週期時,情形有一點複雜。對於Windows98這樣的操作系統,等優先級的線程是在循環模式下自動劃分時間的。對於其他操作系統,例如Solaris 2.x,等優先級線程相對於它們的對等體自動放棄。如果不這樣,其他的線程就不會運行。
警告:不同的操作系統下等優先級線程的上下文轉換可能會產生錯誤。
同步性
因為多線程在你的程序中引入了一個異步行為,所以在你需要的時候必須有加強同步性的方法。舉例來說,如果你希望兩個線程相互通信並共享一個複雜的數據結構,例如鍊表序列,你需要某些方法來確保它們沒有相互衝突。也就是說,你必須防止一個線程寫入數據而另一個線程正在讀取鍊錶中的數據。為此目的,Java在進程間同步性的老模式基礎上實行了另一種方法:管程(monitor)。管程是一種由CARHoare首先定義的控制機制。
你可以把管程想像成一個僅控制一個線程的小盒子。一旦線程進入管程,所有線程必須等待直到該線程退出了管程。用這種方法,管程可以用來防止共享的資源被多個線程操縱。
很多多線程系統把管程作為程序必須明確的引用和操作的對象。 Java提供一個清晰的解決方案。沒有“Monitor”類;相反,每個對像都擁有自己的隱式管程,當對象的同步方法被調用時管程自動載入。一旦一個線程包含在一個同步方法中,沒有其他線程可以調用相同對象的同步方法。這就使你可以編寫非常清晰和簡潔的多線程代碼,因為同步支持是語言內置的。
消息傳遞
在你把程序分成若干線程後,你就要定義各線程之間的聯繫。用大多數其他語言規劃時,你必須依賴於操作系統來確立線程間通信。這樣當然增加花費。然而,Java提供了多線程間談話清潔的、低成本的途徑――通過調用所有對像都有的預先確定的方法。 Java的消息傳遞系統允許一個線程進入一個對象的一個同步方法,然後在那裡等待,直到其他線程明確通知它出來。
Thread 類和Runnable 接口
Java的多線程系統建立於Thread類,它的方法,它的共伴接口Runnable基礎上。 Thread類封裝了線程的執行。既然你不能直接引用運行著的線程的狀態,你要通過它的代理處理它,於是Thread 實例產生了。為創建一個新的線程,你的程序必須擴展Thread 或實現Runnable接口。
Thread類定義了好幾種方法來幫助管理線程。本章用到的方法如表所示: