近年來數據的快速增長催生了一個關鍵性問題,如何才能安全可靠的保存那些有價值的數據。當前以云存儲為代表的中心化存儲,可通過存儲集群技術,實現在部分節點和硬盤故障的情況下保持存儲業務的連續性。但是,在如何防患數據中心級故障、實現跨區域的應用數據就近訪問、防止數據篡改等方面一直缺乏切實可行的解決方案。隨著區塊鏈技術的發展與逐步成熟,去中心化存儲(以下簡稱區塊鏈存儲)為解決上述問題提供了理論基礎和技術可行性。
區塊鏈存儲應用的目標是要在一個更加分散、范圍更大以及在更多不確定因素的網絡環境下提供一個安全、可靠、高效的商業數據存儲環境。當前全球區塊鏈存儲項目中,影響力最廣泛的當屬Filecoin。Protocol Labs(協議實驗室)成立于2014年5月,由Juan Benet創立,并于2015年1月向世界發布了IPFS(一種去中心化存儲網絡技術)。Filecoin是協議實驗室基于IPFS技術打造的全球性區塊鏈存儲項目,旨在通過安全、高效的區塊鏈存儲平臺和可持續發展的商業模式吸引包括存儲服務商、應用開發者、數據提供和需求者參與,從而形成規模化的數據應用生態。
區塊鏈存儲與其他區塊鏈應用在模式上有較大區別,以Filecoin項目為例:1、存儲應用為保障合約期內數據存儲服務的持續性,要求所有區塊鏈存儲節點在每一次存儲數據前均需要進行費用質押。2、數據存儲前要進行密封性操作,整個流程需要計算和存儲系統協同完成。3、區塊鏈的存儲節點須在規定時限內完成數據的有效性證明,以上的應用特征也是區塊鏈存儲應用獨有的。
從數據存儲的方向上分析,區塊鏈存儲節點需求如下:
1、 海量存儲的擴展能力
頭部服務商的存儲節點日均數據量增長已達100TB-1PB級,目前越來越多的節點累計存儲容量已超過100PB,如此大規模的存儲場景對存儲系統的擴展性提出了嚴峻的挑戰。
2、 存儲系統的深度定制和優化能力
影響存儲節點的收益來自兩類時空證明(以下使用英文縮寫PoST), 第一是Winning PoST,第二是Window PoST。簡單來說Winning PoST是從已存Sector(扇區)中隨機抽取1個,然后證明數據有效;而Window PoST則是通過Window(窗口)維度進行已存Sector的全量抽取并證明這些數據有效。兩類PoST的工作均有時效性且都是隨機讀操作。另外區塊鏈存儲節點要持續存儲數據,須不間斷的接收并封裝新扇區,進而大量的被封裝完的扇區持續寫入存儲系統中,這也對存儲系統的性能提出很高要求。
3、 企業級可靠性
區塊鏈存儲為保證數據安全設置了節點的費用質押和服務異常的懲罰措施。經存儲服務商推算,1PB的數據如發生異常,在3天內恢復,將為此付出1333 Fil的代價。如1PB數據丟失并無法找回,則服務商將面臨10364Fil的高額處罰。在如此嚴苛的運營條件下,存儲節點需要采用可靠性更高的企業級存儲產品。
綜上所述,區塊鏈存儲節點內需要一套大容量、高性能、易擴展、可靠性極高的存儲系統來支撐該節點的存儲服務。由此可見,提升存儲效率、降低數據丟失風險以及在規模化應用場景下實現簡化運維是決定存儲服務商水平高低的關鍵要素。如何選擇和運維一套高效的存儲系統,也是擺在存儲服務商面前的一項重要工作。