一文讀懂分布式系統究竟是什么,掌握討論區塊鏈的正確姿勢。
撰文:李畫致謝:GenaroCTO吳為龍
區塊鏈是一種分布式系統。不了解分布式系統的工作原理,很難真正理解區塊鏈。
而不理解區塊鏈的麻煩,在于會陷入到對「去中心化」、「無需許可」等等概念以及「TPS」、「安全」等等問題失去語境的討論中去。這不僅無助于我們去準確地分析和判斷一個區塊鏈項目,也讓我們無法認清區塊鏈在技術上的可能的發展路線。
更直白來講,我們需要掌握分布式系統的一些基礎知識。因為這樣,我們就能看到區塊鏈本身的局限性,我們就知道任何一個真正有價值的區塊鏈項目都應該:為了解決特定的問題,在特定的環境中,做出特定的解決方案。
單純的指標比較并不客觀,更好的判斷標準是:這種方案是否適合于解決這個問題。
了解分布式系統的工作原理對區塊鏈世界非常重要。那么現在,就讓我們開啟分布式系統的探索之旅吧。
計算機的作用是處理信息,我們輸入條件A給它,它輸出結果B給我們。如果處理信息的工作是由一臺計算機完成的,這是一種中心化的結構;如果處理信息的工作是由多臺獨立的計算機合作完成的,我們可以稱其為「分布式的系統」。
分布式系統有多種不同的架構,用以實現不同的處理信息的方法。假設系統中有十臺計算機,一種架構是:我們把一個計算任務分成十份,讓每臺計算機獨立處理一份任務,最后匯總它們的計算結果,作為輸出。
還有另一種架構,就是讓這十臺計算機都去處理這一個計算任務,如果所有的計算機都正常工作,它們的計算結果應該是一樣的,那么就把這個一致的計算結果作為輸出。區塊鏈就是這樣的一種分布式系統。
很容易就能發現,這是一個「自找苦吃」的系統,它相當于把同樣的工作做了十次,而且還需要額外增加不同計算機之間的溝通工作。
那為什么還需要這種系統?因為它可以讓我們免除對中心化的那一臺計算機,以及那臺計算機背后的中心化的公司或組織的依賴。這樣一來,既能避免單點故障或作惡,也能減少權力的集中及濫用。
一、分布式系統的理想目標
區塊鏈所屬的分布式系統也被稱為「復制狀態機模型」,它的目標很簡單:系統內全部的計算機都同意某一個輸出值,也就是指:系統內所有的節點/計算機都有相同的初始狀態,在執行完一個事務后,所有的節點都有相同的最終狀態。
Tether CTO:Tether比特幣礦場位于拉丁美洲,計劃幾周內運營:8月26日消息,兩天前,Tether首席技術官Paolo Ardoino發布了一張帶有“Tether energy”字樣的圖片,并配文稱“Tether能源生產及比特幣礦場進展順利”。社區質疑Paolo發布圖片的真實性,稱其疑似軟件合成。
Paolo Ardoino今日發文回應稱,圖片中所展示的比特幣礦場是真實的,位于拉丁美洲,但為防止受到打擾,不方便透露具體位置;該站點進展順利,團隊成員正在夜以繼日地工作,以便在接下來的幾周內開始運營。
他補充稱,幾個月前Tether已經啟動了“Tether Energy”計劃,正與世界各地公司建立合作伙伴關系,提供資金、基礎設施、開發和一般專業知識等支持,以建設可再生能源生產和比特幣礦場。Tether認為比特幣挖礦必須在地理上盡可能分散,目標是減少當前在特定國家的高度集中。[2023/8/27 12:58:57]
如果計算機都運行良好,它們之間的通信也完全同步,實現這個目標并不困難。但現實不是如此,主要有以下兩類問題:
某臺/某些計算機出現故障,它可能無法計算出結果,也可能連接不上系統。
如果不同計算機收到事件的順序不同,對事件的處理順序就會不同,導致輸出結果也不同。比如×c與a就是兩種不同的計算順序,會帶來不同的計算結果。
這些問題是常見且不可避免的,而一旦出現問題,就無法實現全部的計算機都同意某一個輸出結果。著名的分布式系統「FLP不可能原理」是這樣描述的:在網絡可靠,但允許節點失效的最小化異步模型系統中,不存在一個可以解決一致性問題的確定性共識算法。通俗而言就是:只要系統中有一臺計算機出問題,該系統就無法在輸出值上達成共識。
FLP不可能原理告訴我們:不要浪費時間去為分布式系統設計面向所有場景的共識算法,那是不可能實現的。
二、分布式系統的共識算法
雖然FLP不可能原理很殘酷,但分布式系統能夠帶來的好處是值得我們迎難而上的。既然不存在面向所有場景的共識算法,那么也許可以找到一些在特定場景中有效的共識算法。共識算法,是指讓分布式系統達成共識的方法。
讓我們看看科學家們是如何一步一步限定場景,并實現該場景下的共識算法的。
蘇富比在1小時內以120萬美元的價格售出500件生成藝術品:金色財經報道,著名拍賣行蘇富比在不到一小時內以120萬美元的價格售出 500 件生成藝術品。
蘇富比在一份聲明中表示,每件數字藝術品均由藝術家Vera Molnár創作,被命名為“主題與變奏”,在購買后立即被鑄造,其中最高拍賣價格為20ETH(37,600美元)。拍賣完成后,二級市場上該類別的交易量在幾個小時內總計達到400ETH(約合 754,000美元)。[2023/7/27 16:01:13]
首先,如果系統中的每一臺計算機都可以提出自己的結果,場面無疑是復雜的,因為我們連就哪一個結果去達成共識都無法知曉。所以解決共識問題的第一步是確定共識的到底是什么,最簡單的方法就是某一臺計算機說了算,它提出一個結果,其他的計算機來表態是否同意這個結果。
說了算的那臺計算機被稱為提案者或者領導者。雖然通過領導者來實現共識并不是唯一解決問題的方法,但絕大多數協議都是在此基礎上實現的,包括區塊鏈系統中使用的共識算法。
所以你看,并沒有絕對的去中心化,實現共識的第一步就是要確定一個中心。
題外話:當我們知道這一點后,就能建立起關于去中心化的更有效的討論,比如在此處就可以不泛泛而談去中心化,而是:選出這個領導者的方法是否去中心化。
回到主題。需要領導者的共識算法的工作步驟大致是這樣的:
選出一個領導者;
領導者提出一個結果;
追隨者確定是否同意這個結果;
如果大家就結果達成了共識,系統輸出最終結果;如果大家未達成共識,回到步驟1重新開始。
這種思路提供了一種可以達成共識的方法,但它離真正實現共識還很遙遠。因為如果一臺計算機連接不上系統,它就無法表決自己是否同意領導者的結果;如果出現問題的計算機恰好是領導者,情況就會更糟糕,整個系統會進入停滯狀態。
三、同步性假設共識算法
如何解決上述宕機的問題?方法說起來很簡單:如果一臺計算機連不上系統,就忽略它,不要它參與這一輪的共識。
那么新的問題來了,我們怎么知道它是連接不上系統,還是它正在參與共識只不過速度比別的機器慢?
因此,科學家們發展出了解決共識問題的最重要的一個假設:同步性假設。同步性假設引入「超時」概念,也就是說事先設定一個時間范圍,如果領導者無法在該時間范圍內發出提案,就淘汰它,選出一個新的領導者。這樣一來就可以容忍領導者節點出現問題。
AI社交資訊流媒體Techub.NEWS產品正式上線:據官方消息,AI社交資訊流媒體平臺Techub.NEWS今日在香港數碼港舉辦首屆新聞發布會,標志著產品的正式上線。據悉,Techub.NEWS先前已獲得一些知名投資人的關注,種子輪融資由VCB、Ausvic Capital和MetaTdex Ventures(馬蹄創投)參與。Techub.NEWS負責人Alma Li指出,Techub.NEWS通過RLHF算法來優化AI熱點推薦,并采用IPFS存儲技術實現數據的去中心化和高度可靠性,精品內容的NFT化出售則為用戶提供更多收益機會。[2023/4/17 14:07:11]
Paxos算法和Raft算法都是基于同步性假設提出來的。但這兩個算法還需要對系統做另一種假設,即認為系統內所有的計算機都是「好人」,它們要么正確地響應領導者的提案,要么因為故障無法響應。
然后再制定一條規則:只要系統內過半數的計算機接受了領導者的提案,就把該提案作為系統的最終結果。這樣一來,就不用等待所有的計算機都做出響應,從而可以容忍追隨者節點出現問題。
于是,我們終于擁有了一個可以實現共識的分布式系統,雖然對它有嚴格的條件限定。
Paxos共識算法是由萊斯利·蘭伯特在1990年提出的一種基于消息傳遞且具有高度容錯特性的一致性算法,它在分布式系統應用領域有著重要的地位,包括Google在內的許多公司的大型分布式系統采用的都是該算法。而我們第一階段的探索也可以在此處結束,接下來是第二階段。
四、解決掉系統中的「壞人」
Paxos雖然能實現共識,但它的算法是建立在所有計算機都是「好人」的基礎上的,這些計算機要么沉默,要么發出正確的聲音,因此整個系統中只有一種聲音,大家就這個聲音達成共識即可。而如果計算機中有「壞人」,系統里就會出現壞人的聲音和好人的聲音,Paxos算法無法處理這一情況。
我們需要在有壞人的情況下也可以實現共識的算法,有沒有可能?萊斯利·蘭伯特建立了一個模型來討論這種可能性,該模型被稱作拜占庭將軍問題,其中的拜占庭節點就是壞人節點,它們會傳遞干擾信息阻礙整個系統達成共識。
在論文《TheByzantineGeneralsProblem》中,蘭伯特提出了幾種解決方案,其中一種可以在拜占庭節點不到1/3時實現系統的共識。也就是說,如果系統中壞人的數量少于1/3,就可以通過算法實現共識。
《財富》雜志發布首個“Crypto 40”榜單,包括NFT、DeFi等8個類別:4月11日消息,《財富》雜志近日發布首個“Fortune Crypto 40”榜單,以對“最重要的加密公司”進行排名。Crypto 40由八個類別組成,即TradFi、CeFi、NFT、風險投資(VC)、數據、基礎設施、協議和DeFi,每個類別都有五家公司,其中:
- 入圍TradFi類別的公司有PayPal、Robinhood、JPMorgan Chase(摩根大通)、Fidelity(富達)和Visa;
- 入圍CeFi類別的公司有Coinbase、幣安、Kraken、Galaxy Digital和Circle;
- 入圍VC類別的公司有Polychain Capital、Animoca Brand、Andreessen Horowitz(a16z)、Pantera Capital和Blockchain Capital;
- 入圍NFT類別的公司有OpenSea、Yuga Labs、Sky Mavis、Art Blocks和RTFKT(Nike);
- 入圍Data類別的公司有Chainalysis、Coin Metrics、The Graph、Dune和Messari;
- 入圍基礎設施類別的公司有Ledger、Genesis Digital Assets、Bitmain、Alchemy和Moonpay;
- 入圍DeFi類別的公司有Uniswap Labs、Lido、MakerDAO、Aave和Curve;
- 入圍協議類別的項目有Ethereum Foundation、Bitcoin、Polygon Labs、Solana Foundation、Offchain Labs(Arbitrum)。[2023/4/11 13:56:18]
這之后出現的DLS算法、PBFT算法都是在此基礎上發展出來的。
PBFT是具有代表性的一種拜占庭容錯算法,其實現過程大致如下。不理解該過程也沒關系,知道通過這種溝通方式能夠達成共識就可以。
pre-prepare階段:領導者發送結果給所有追隨者。領導者在本圖中是0號節點,它把結果發給追隨者1、2、3號節點。
prepare階段:如果追隨者認為結果沒有錯誤,就告訴所有其他節點自己認可這個結果。比如1號節點會把自己的認可消息發給0、2、3號節點。
Ava Labs 發布移動端非托管多鏈錢包 Core Mobile:金色財經報道,Avalanche 開發公司 Ava Labs 宣布發布移動端非托管多鏈錢包 Core Mobile。Core Mobile 將首先在 Android 系統上推出,并計劃于 2023 年支持 iOS。Core Mobile 旨在連接 Avalanche、比特幣和以太坊網絡以及其他 EVM 兼容區塊鏈中的 DeFi、NFT 游戲生態系統,用戶可以在一個平臺上管理他們所有的主要資產和應用程序。
Ava Labs 表示,此版本現在為用戶提供了三種使用 Core 的方式:瀏覽器擴展、Web 和移動設備,開發人員未來的計劃包括跨平臺同步和許多其他功能,以統一跨瀏覽器、Web 和移動設備的體驗。[2022/12/14 21:43:34]
commit階段:如果追隨者發現超過2/3的節點認可了領導者的結果,就告訴所有其他節點自己接受這個結果為最終結果。
reply階段:如果領導者和追隨者發現超過2/3的節點接受了最終結果,就可以認為大部分節點達成了共識,就把該共識反饋給客戶端;如果客戶端收到超過1/3的節點的相同的共識,就可以認為全網達成了共識。
到此,我們就解決了有拜占庭節點的分布式系統的共識問題。不過如果系統中壞人的數量等于或多于1/3,依然是無法達成共識的。我們能做的是通過系統的準入條件或激勵措施,讓壞人可以少于1/3。
對分布式系統的第二階段的探索到這里就結束了,接下來進入到第三階段。
五、中本聰共識算法
不管Paxos還是PBFT,都使用了同步性假設,事實上,大家對共識算法的研究幾乎都是在該方向上的,直到中本聰共識的出現。中本聰共識使用的是非確定性機制。
這是什么意思呢?我們可以把一個由12臺計算機組成的分布式系統想象成一個由12名陪審員組成的陪審團。我們把這12個人關在會議室里,遞進去一張紙條闡述案情,然后坐在會議室門口等他們給出審理的結果。
這12個人對于如何判決會有不同的意見,隨著討論的深入也可能改變自己的立場,還有的人可能睡著了無法發表看法。那么坐在門口等的人有兩種選擇。第一種選擇是你們去討論吧,讓我等多久都可以,但最后你們給我的必須是唯一確定的審理結果;第二種選擇是我等不了,你們先把最多人同意的那個結果給我,如果之后出現一個更多人同意的結果,我再改成那個結果。
顯而易見,我們只能二選一,如果要求結果確定,就不能保證一定能等到結果;如果要求拿到結果,就無法保證該結果一定是最終結果。
分布式系統就是這樣,只能二選一,第一種選擇被稱作Finality,即「結果的確定性」或安全性;第二種選擇被稱作Liveness,即網絡的活性或可用性。
這兩種選擇決定了分布式共識兩種不同的設計思路:
追求Finality,是優先結果,就要對網絡做出要求。PBFT、Tendermint都是這一類型的算法,它們走的是網絡的同步性假設路線,使用這類算法的系統不會出現分叉。
追求Liveness,是優先網絡,就要對結果做出讓步。中本聰共識是這一類型的算法,它走的是結果的非確定性路線,使用這類算法的分布式網絡始終可用,而且任意節點都可以隨時加入/離開系統。
題外話,在Finality和Liveness中二選一也是分布式系統CAP定理的體現。該定理說的是:對于一個分布式系統來說,不可能同時滿足一致性、可用性和分區容錯性。因為分區容錯性是指該系統要能容忍網絡出現分區,而現實網絡是一定會分區的,所以這個條件必須滿足,那么實際上,CAP定理說的是一個分布式系統不可能同時滿足一致性和可用性,這其中,CAP一致性體現的是Finality,CAP可用性體現的是Liveness。
而不管是FLP不可能原理,還是CAP不可能定理,它們不是在告訴我們:這條路很難走通,你如果突破就是了不起的創新;它們告訴我們的是:這條路走不通,你要做的是根據需求來做權衡和選擇。
使用同步性假設的共識算法在前文已經詳細地介紹過了,它們通過引入超時概念忽略出現問題的計算機,從而達成共識。
使用非確定性機制的中本聰共識描述起來也很簡單:如果你看到某提議的區塊擁有最多的工作量證明,就接受該區塊,這也被稱作最長鏈規則。它的具體實現過程大家都很熟悉,本文就不再贅述了。
現在,讓我們看看使用同步性假設的系統和使用非確定性機制的系統有什么不同。但需要提醒的是,并非所有的PoS都是Finality路線,比如CasperFFG就不是;而PoW也不是只能走Liveness路線,雖然并沒有人設計PoW上的Finality共識。
PoW和PoS的不同在于一個是Work,一個是Stake。之所以需要強調這一點,是因為在關于PoW和PoS的討論中,我們往往不是在討論Work機制與Stake機制的不同,而是在比較Finality系統與Liveness系統的不同。比如「無需許可」性,它基本是一個Finality系統與Liveness系統的話題,而不是Work與Stake的爭論點。
讓我們回到有12個評審員的會議室。為了追求Finality,每個評審員都需要了解其他每一個人的想法,也需要把自己的想法告訴其他每一個人,因此通信復雜度會隨著評審員人數的增加而迅速遞增,整個系統將因此不可用,所以必須控制陪審員的數量。
那么對于一個分布式系統而言就是,只挑選少數節點進入會議室,由它們決定共識,而其他節點只接受共識。因此這種系統中有三種角色,領導者、追隨者和學習者,領導者和追隨者是會議室中的評審員,他們需要好好工作,不然可能導致系統無法達成共識。
中本聰共識追求的是Liveness,節點/評審員不需要與其他的每一個節點溝通,它只需要與自己身邊的節點交流即可,因此通信復雜度不會因為節點數量的增加而增加。你想成為評審員,就可以走進會議室成為評審員,無需許可,也不會增加陪審團達成共識的難度,同時你也可以不工作或隨時離開。該系統中只有領導者和追隨者兩種角色,所有人都在那間會議室里參與共識。
這樣看來中本聰共識似乎更符合大家對分布式系統的開放性的期望,但別忘了它之所以可以如此設計,是因為犧牲了Finality,它的輸出結果是一個概率上的最終結果。
試想,你百分百在星巴克得到一杯咖啡,但星巴克并不能百分百收到錢,這并不符合大多數人能理解的世界運轉規則。所以非確定性機制有它自己的短板,以及不適合的場景。
另一方面,Finality系統在保證了結果的確定性后,系統設計就要反過來追求Liveness;而Liveness系統在保證了網絡的開放性后,系統設計就要反過來追求Finality。中本聰共識為了提高結果的確定性或安全性,就需要做出其他讓步,比如TPS。
以比特幣為例。比特幣可以把出塊時間從10分鐘提高到1分鐘,TPS會大幅提升,但1分鐘的時間不夠把消息傳遍全網,系統中就會出現很多分叉,導致結果的可確定性變低;比特幣也可以把區塊大小從1MB提高到100MB,TPS也會提升,但大區塊對網絡和節點的要求高,會增加節點的進入門檻從而帶來中心化,導致輸出結果容易被篡改。
所以你看,設計分布式系統就像與撒旦做交易,你得到一些,必然要交出一些。沒有最好的系統,只有適合解決某類問題的系統;沒有單純的指標比較,只有是在什么設定下實現這種指標。
如果你理解了這一點,這篇文章的目的就達到了,而我們對分布式系統的探索到此也就全部結束了。
六、更進一步
本文是受《HowDoesDistributedConsensusWork?》一文啟發寫成的,如果你想更進一步了解分布式系統,推薦這篇文章,它從專業的角度介紹了分布式共識;同時推薦《WHATWETALKABOUTWHENWETALKABOUTDISTRIBUTEDSYSTEMS》,它系統地羅列出了分布式系統的經典論文。
鏈聞注:-HowDoesDistributedConsensusWork?https://medium.com/s/story/lets-take-a-crack-at-understanding-distributed-consensus-dad23d0dc95-中文譯本《分布式共識的工作原理》,byEthFanshttps://ethfans.org/posts/lets-take-a-crack-at-understanding-distributed-consensus-part-1-WHATWETALKABOUTWHENWETALKABOUTDISTRIBUTEDSYSTEMShttp://alvaro-videla.com/2015/12/learning-about-distributed-systems.html
分布式系統的另一個關鍵問題是時序,所有的共識算法都需要解決它,但因為是另一條線索故本文未做涉及,如果你想了解,可以從萊斯利·蘭伯特博士的這篇論文開始:《Time,ClocksandtheOrderingofEventsinaDistributedSystem》。
如果你對在Finality和Liveness間尋找平衡感興趣,可以去研究CasperFFG共識,它有Liveness的一部分,也有Finality的一部分。同時你也會發現CasperFFG的PoS與Tendermint的PoS的不同。
最后對本文做一個小結,它主要包含以下內容:
兩個定理:FLP不可能原理;CAP不可能定理。
兩種容錯能力:宕機容錯;拜占庭容錯。
兩種共識算法設計思路:Finality;Liveness。
兩類共識算法:同步性假設;非確定性機制。
三個共識算法:Paxos、PBFT、中本聰共識。
文中會有因簡化和類比帶來的不準確以及不全面之處,還望理解,謝謝指正。
參考資料:1.《HowDoesDistributedConsensusWork?》,PreethiKasireddy;中文版本:《分布式共識的工作原理》,byEthFans,由Ray、阿劍、IANLIU、stormpang、安仔翻譯2.《WHATWETALKABOUTWHENWETALKABOUTDISTRIBUTEDSYSTEMS》,AlvaroVidela3.《Time,ClocksandtheOrderingofEventsinaDistributedSystem》,LeslieLamport4.《TheByzantineGeneralsProblem》,LESLIELAMPORT、ROBERTSHOSTAK、MARSHALLPEASE5.《PaxosMadeSimple》,LeslieLamport6.《Bitcoin:APeer-to-PeerElectronicCashSystem》,SatoshiNakamoto
千呼萬喚始出來,Hello大家好!今天我們迎來了本周平臺周報。首先感謝大家對BZEX長久以來的支持與肯定,也感謝大家對我們的信任和鼓勵.
1900/1/1 0:00:00尊敬的LOEx用戶:BTJL舉辦的新用戶注冊送20萬空投活動已結束。活動期間在LOEx平臺注冊的新用戶并完成實名認證,前4000名用戶每人獲得50BTJL,活動獎勵將于9月9號前發放至獲獎用戶賬.
1900/1/1 0:00:00KuCoin成立于2017年9月,作為全球知名的加密貨幣交易所,KuCoin現在已經有超過500萬的用戶,上線400多種交易對.
1900/1/1 0:00:00文|棘輪 宣布Allin區塊鏈兩年后,迅雷沒能交出一張令人滿意的答卷。如今,迅雷股價從最高點暴跌了90%,玩客云礦場也已停產。財報顯示,迅雷的區塊鏈業務營收無實質進展.
1900/1/1 0:00:00導語:如今商業和科技日新月異的變化著,傳統的商業模式面臨被淘汰的趨勢,對于企業而言,必須借助科技進行改革以適應發展.
1900/1/1 0:00:009月初,美國華爾街傳出了幾個可能改變未來加密金融的大事。其一,資產管理巨頭富蘭克林鄧普頓投資公司已于9月3日向美國證券交易委員會提交了一份政府貨幣市場基金的初步招募說明書.
1900/1/1 0:00:00