二階段提交

維基百科,自由的百科全書
跳至導覽 跳至搜尋

二階段提交英語:Two-phase Commit)是指在計算機網絡以及數據庫領域內,為了使基於分佈式系統架構下的所有節點在進行事務提交時保持一致性而設計的一種演算法。通常,二階段提交也被稱為是一種協議(Protocol)。在分佈式系統中,每個節點雖然可以知曉自己的操作時成功或者失敗,卻無法知道其他節點的操作的成功或失敗。當一個事務跨越多個節點時,為了保持事務的ACID特性,需要引入一個作為協調者的組件來統一掌控所有節點(稱作參與者)的操作結果並最終指示這些節點是否要把操作結果進行真正的提交(比如將更新後的數據寫入磁盤等等)。因此,二階段提交的算法思路可以概括為: 參與者將操作成敗通知協調者,再由協調者根據所有參與者的反饋情報決定各參與者是否要提交操作還是中止操作。

需要注意的是,二階段提交英語:2PC)不應該與並發控制中的二階段鎖英語:2PL)混淆。

前提[編輯]

二階段提交算法的成立基於以下假設:

  1. 該分佈式系統中,存在一個節點作為協調者(Coordinator),其他節點作為參與者(Cohorts)。且節點之間可以進行網絡通信。
  2. 所有節點都採用預寫式日誌,且日誌被寫入後即被保持在可靠的存儲設備上,即使節點損壞不會導致日誌數據的消失。
  3. 所有節點不會永久性損壞,即使損壞後仍然可以恢復。

基本算法[編輯]

以下對二階段提交算法分階段進行說明。

第一階段(提交請求階段)[編輯]

  1. 協調者節點向所有參與者節點詢問是否可以執行提交操作,並開始等待各參與者節點的響應。
  2. 參與者節點執行詢問發起為止的所有事務操作,並將Undo信息Redo信息英語redo log寫入日誌。
  3. 各參與者節點響應協調者節點發起的詢問。如果參與者節點的事務操作實際執行成功,則它返回一個"同意"消息;如果參與者節點的事務操作實際執行失敗,則它返回一個"中止"消息。

有時候,第一階段也被稱作投票階段,即各參與者投票是否要繼續接下來的提交操作。

第二階段(提交執行階段)[編輯]

成功[編輯]

當協調者節點從所有參與者節點獲得的相應消息都為"同意"時:

  1. 協調者節點向所有參與者節點發出"正式提交"的請求。
  2. 參與者節點正式完成操作,並釋放在整個事務期間內佔用的資源。
  3. 參與者節點向協調者節點發送"完成"消息。
  4. 協調者節點收到所有參與者節點反饋的"完成"消息後,完成事務。

失敗[編輯]

如果任一參與者節點在第一階段返回的響應消息為"終止",或者 協調者節點在第一階段的詢問超時之前無法獲取所有參與者節點的響應消息時:

  1. 協調者節點向所有參與者節點發出"回滾操作"的請求。
  2. 參與者節點利用之前寫入的Undo信息執行回滾,並釋放在整個事務期間內佔用的資源。
  3. 參與者節點向協調者節點發送"回滾完成"消息。
  4. 協調者節點收到所有參與者節點反饋的"回滾完成"消息後,取消事務。

有時候,第二階段也被稱作完成階段,因為無論結果怎樣,協調者都必須在此階段結束當前事務。

算法示意[編輯]

下述流程圖簡單示意了二階段提交算法中協調者和參與者之間的通信流程

    协调者                                              参与者
                              QUERY TO COMMIT
                -------------------------------->
                              VOTE YES/NO           prepare*/abort*
                <-------------------------------
commit*/abort*                COMMIT/ROLLBACK
                -------------------------------->
                              ACKNOWLEDGMENT        commit*/abort*
                <--------------------------------  
end

"*" 所標記的操作意味着此類操作必須記錄在穩固存儲英語Stable storage上.[1]

缺點[編輯]

二階段提交算法的最大缺點就在於 它的執行過程中間,節點都處於阻塞狀態。即節點之間在等待對方的相應消息時,它將什麼也做不了。特別是,當一個節點在已經佔有了某項資源的情況下,為了等待其他節點的響應消息而陷入阻塞狀態時,當第三個節點嘗試訪問該節點佔有的資源時,這個節點也將連帶陷入阻塞狀態。

另外,協調者節點指示參與者節點進行提交等操作時,如有參與者節點出現了崩潰等情況而導致協調者始終無法獲取所有參與者的響應信息,這時協調者將只能依賴協調者自身的超時機制來生效。但往往超時機制生效時,協調者都會指示參與者進行回滾操作。這樣的策略顯得比較保守。

二階段協議的實現[編輯]

.

關聯條目[編輯]

參照[編輯]

  1. ^ C. Mohan, Bruce Lindsay and R. Obermarck (1986): "Transaction management in the R* distributed database management system",ACM Transactions on Database Systems (TODS), Volume 11 Issue 4, Dec. 1986, Pages 378 - 396