楊春雨
北方工業大學/信息學院 北京 100144
區塊鏈是一種以加密技術為基礎的數據鏈,利用加密技術來進行數據的非篡改和非偽造,它具備分布式數據存儲、點對點傳輸和共識機制等計算機技術的新型應用模式。
整體上,采用塊鏈型的數據架構進行資料的校驗與儲存,并使用分布的結點一致性運算進行資料產生與更新,并以加密的方法確保資料傳送及存取之安全性。同時采用基于自動指令碼的智能合約對資料進行程序設計和處理,是一種基于程序的新型結構和運算方法。簡單來說,讓所有人都能通過各自的計算機網絡接口參加網絡交易。它具有如下特點[1]:
1.1.1 開放性。區塊鏈技術的技術根基是開源的,除了對交易雙方的私人資料進行加密之外,其他的都是對公眾開放的,可以在電腦上使用公共界面進行查詢。所以,整個系統的資訊是非常透明化的。
1.1.2 獨立性。區塊鏈技術的實質就是一個分布式存儲的數據庫,它以共識為基礎,完全不依靠中心處理點和其他專用的存儲裝置,在沒有人工干擾的情況下,可以安全地在系統內部進行數據驗證和交換。從而確保了高度分散的優點。
1.1.3 安全性。如果雙方都控制不住51%的數據,就無法肆意操控修改網絡數據,避免了主觀人為的數據變更。因此區塊鏈技術具有高度的安全性和穩定性。
1.1.4 溯源性。在雙方進行交易時,系統會用加密的方法將各種交易信息都寫在一起并進行信息上鏈,這樣就可以追蹤到所有的交易信息。因此,區塊鏈技術具有高度的可溯源性。
在網絡技術迅猛發展和全球一體化的推動下,通信、零售業等產業經營方式地不斷改變。而大數據的應用,也推動了整個行業的發展,從原來交易渠道的點對點,到數據化,再到高效的運營,營銷渠道朝著多元化方向發展。
然而,由于交易額不斷上升,以及病毒、木馬等新型的網絡攻擊手段層出不窮,商業資料的安全性也逐漸受到各大公司的重視。近年來,出現了大量的用戶數據泄露、數據被盜用等問題,這引發了社會各界的高度重視。而區塊鏈技術開放性、獨立性和可追溯性的特質也吸引了許多公司和學術界,其紛紛將目光投向了該行業。目前,區塊鏈技術在主要下列方面得到了廣泛的運用[2]:
1.2.1 信貸評估。由于數據具有不可偽造和追溯的特點,可以通過對持卡者的個人數據、就業狀況等數據的分析,構建起人社系統的誠信評估系統,從而為社會提供更加客觀、精準的個人征信。
1.2.2 個人賬戶支付。區塊鏈技術在我國在數字貨幣中得到了廣泛的運用,其發展對金融業的發展起到了推動作用,為參保人群提供了更多的選擇和可能性。
1.2.3 身份核實認證。將所獲取的身份信息保存到一個區塊鏈中,從而確保了其不可被篡改和偽造,提高了驗證的正確性,減少了交易過程的復雜性和冗余。
大數據在其戰略位置上的作用不僅僅在于它龐大的信息量,還在于它能夠準確分析,從而實現其價值[3]。
業態創新和新技術應用促進了我國的經濟轉型,數據量也在快速增長,但數據泄露和濫用等問題也越來越突出。目前中國數據交易普遍存在數據流轉規范不統一、數據安全隱患、交易監管機制不健全等問題[4]。
2.1.1 大數據易受到不正常的襲擊。大數據存儲的數據信息量非常大,而且通常都是分散存儲。這種存儲方法因其主視圖清晰,使得信息的保存十分單一。網絡黑客很可能會通過系統的弱點來進行非法的行為,從而造成安全風險[5]。
2.1.2 大數據存在信息泄露的風險。在新的大數據環境下,一個重要的問題就是如何保證用戶的個人數據不會被非法的泄露和使用。大數據的數據要比傳統的數據要更加的繁雜,當前的數據保密措施能否滿足對海量數據和數據的要求,這是一個必須要解決的問題。
2.1.3 大數據傳輸情況存在安全風險[6]。
2.1.3.1 資料存續期間的安全性問題。在信息傳遞的各個階段和各個環節中,逐漸顯現出大量的安全風險。比如,在傳輸大數據時,除了有泄露和造假風險,也有被數據流網入侵利用的風險。
2.1.3.2 貯存場所的安全性問題。云計算技術是海量信息的傳遞與聚合的重要載體和手段,它提供了存儲場所、安全通道、數據存儲的場所。所以,存儲在云計算平臺上的數據的安全性成為阻礙大規模信息技術發展的障礙。
2.1.3.3 涉及的個人信息的安全性。在當前網絡發展的進程中,有關個人信息泄漏的法律法規還不夠完善,使得網絡上的個人信息難以得到有效的保護。如何有效地處理和保護用戶的隱私,同時又能確保有效地進行數據的傳送是當下應當思考的問題。
2.2.1 個人隱私維護的需求。數據信息是公司的重要資本之一,其移動性差、隱私權不突出。罪犯和居心叵測者通過各種不同的資料關聯,可以對網絡上的各種數據進行分析和泄露。因此在構建大數據的安全性與隱私權保障體系中,需要重點研究的問題是如何對其進行有效的保密和保密[7]。
2.2.2 對跨境數據的流動問題解決的需求。在當今社會,資料的流通尤其是跨國的資料流通,具有獨有的特性。所以,從法律體系、數據外包服務等各個層次來保證數據的安全就顯得非常必要。因此,在構建大數據檢驗規范的架構時,必須從收集、儲存、處理等方面對傳統數據檢驗規范的適用范圍進行分析。
2.2.3 傳統的安全防范措施不可以融入問題解決的需求。常規的安全保護手段無法將大量的、多源的、異構體的問題融合在一起,由于其動態特征,使得其海量存儲結構復雜、對外開放、分布式存儲和高精度等特點,傳統的安全防護手段無法應對。為此,亟待健全與之配套的保護與控制制度。
2.2.4 平臺安全體制亟待健全的完善的需求。以前需要 ORACLE數據庫,而在大數據時代,它主要基于Hadoop。在 Hadoop體系結構下,用戶認證和授權訪問等安全性問題的處理效率很低。同時,一些開放源碼的Hadoop組件并未被發現,可能會出現一些問題,例如系統和惡意軟件等問題。
隨著交易過程中數據安全問題的暴露以及對社會產生的威脅,越來越多的學者將目光瞄向了區塊鏈技術。區塊鏈系統可以存儲的數據多元化,可有效滿足企業之間不同業務的交易往來。
3.1.1 數據存儲。為了更好地分類儲存資料,并且降低資料的重復,可以將區塊鏈的資料儲存模式分成兩種:一種是鏈內儲存,另一種是鏈下儲存。
3.1.1.1 數據鏈路。鏈上的存儲流程是利用區塊鏈的方式,將所有收到的節點進行分組,然后在區塊鏈中進行大規模的廣播,這樣的協議就會被稱為“鏈路上的數據”。符合此情況的資料將會被儲存在區塊中。
3.1.1.2 鏈上鏈下協同存儲。在鏈下鏈下,由一個塊結點組成一個散列表,在結點間設置一個數據的指標,獲得一個結點的存貯地址,再由結點的安全檢查,并利用傳送特征的代碼進行探測。若無問題,將會對所儲存的資料進行散列化,以產生對應的 Merkle樹狀結構,若出現問題,則表示資料遭到惡意攻擊或被修改[8]。
3.1.2 隱私安全。隱私數據可以劃分為2類:身份隱私和數據隱私。下面分別對這2種隱私數據的安全保護措施進行闡述。
3.1.2.1 個人信息。首先,所有的參與方必須簽署和整合這些業務,以便將多個轉移業務整合為一個轉移業務,從而掩蓋發送方和接收方賬戶的聯系。
3.1.2.2 資料保密性。為了保護個人資料的保密,可以使用公證通建立的公證書,首先進行下一步的密碼,然后進行上一步的密碼,然后在下一步進行保密。同時將密碼文件上傳到鏈路上,用密鑰進行加密,最終采用鏈下集中的方法進行管理。
在區塊鏈資料的處理過程中,要依據使用者的身份對資料進行存取許可從而保證資料的安全性。
3.2.1 身份認證。身份驗證是指在 PKI中使用區塊鏈技術進行身份驗證,其主要的工作步驟是:進行用戶的身份登記,將用戶的身份數據封裝在一個區塊中,然后進行登記;公開密鑰運算,將用戶標識與憑證公開密鑰相聯系;驗證,通過區塊鏈的公開密鑰驗證,驗證身份證明的合法性[9-10]。
3.2.2 權限訪問控制。首先采集并分類了各節點所需的數據,并依據所搜集到的數據,全面地搜集了用戶的權限存取控制,以了解用戶的存取權利的合法性。最終實現了與區塊鏈的互動,防止了用戶和權利之間的一一對應,簡化了權限的控制[11]。
數據交易數據交易安全架構的體系結構,包含了基礎安全、數據安全、交易安全等方面的問題。這些問題,除了采用常規安全運維、標準規范等規范之外,還可以采用“三分三合”的技術體系結構來實施。
“三分”技術體系結構是將試驗和計算的配線分開,將業務流、計算流和資金流分開,并將計算和安全監控分開。
“三合”是指運用模式和資料的聯合計算環境,利用區塊鏈存證和流通環境,并通過控制中心來達到一個統一的監控環境。數據流轉期間,需要對數據流轉中的關鍵信息進行統計。基于區塊鏈的非偽造屬性,可對所有參與數據的交易進行信任存儲,保證記錄的真實、有效和可追溯性[12]。
隨著區塊鏈技術的日益深入,其數據的安全性將越來越受到人們的重視。本文從數據安全的觀點,結合企業的發展動向,對數據存儲安全、隱私安全等問題進行了綜述。
即便是在可追溯性、獨立性和開放性的情況下,并且它具有一定的安全特性,但其數據真實性和匿名性還有待進一步研究。要想以區塊鏈技術來實現數據的安全性,就必須在數據隱私保護、區域間信息的保護上下功夫。