◆臧金明
(保定市公安局 河北 071000)
在當今社會中,隨著科學技術蓬勃發展的熱潮,人們對新興事物的接受能力也有很大提高,我們國家正處于從 IT(Internet Technology,互聯網技術)過渡到DT(Data Technology,數據處理技術)的階段。同時,電子數據取證作為一種打擊追究計算機網絡犯罪的很關鍵的取證方法,具備數據集中、易采集、控制力強等特性,但在當前大數據快速發展的背景下,依然面臨著許多威脅與挑戰。
傳統的取證方法大多是根據一些固定的儀器、設備和資料對要進行取證的目標實施收集、整理,而且在整個取證過程中,要求其空間上的封閉性以及時間上的精確性。而現如今,越來越多的數據存在云端,多個用戶公用分布式虛擬網絡空間資源,在電子數據取證的過程中,不僅需要對目標數據進行提取、固定,還有分析臨時產生的數據文件和訪問記錄,甚至還包括了云服務提供商、云存儲、虛擬機、網絡拓撲等。
隨著區塊鏈的出現,給電子數據云取證帶來了新的難題。一些不法分子利用區塊鏈的技術特性,在互聯網上刮起了一陣“區塊鏈犯罪”的旋風。操縱虛擬貨幣的詐騙、色情網站的傳播、黑客攻擊,當然還包括暗網中的利用比特幣進行的骯臟交易。他們利用區塊鏈的匿名特性隱藏真實身份,使執法部門很難追蹤。
雖然困難重重,但可以根據區塊鏈技術具有數據分布式存儲的特性,可以把電子數據都收集并存儲在區塊鏈上,再通過去中心化、加密算法、Merkle樹技術、共識算法等方法,找到一套完整的能識別、能提取但無法人為修改的電子數據云取證思路。
電子數據取證就是根據計算機相關技術,采用一些在合法范圍內的措施,對侵入、干擾、攻擊、毀壞計算機數據等違法操作進行數據資料收集、儲存、觀察和得出結論的一系列過程。而云計算有“5-3-4”的特點。“5”是指云服務有 5個特征:按需自助服務、廣泛的網絡訪問性、動態的資源池、快速彈性、可計量的服務。“4”個發布模型:私有云、社區云、公有云、混合云。“3”種常見的服務模式:SaaS軟件即服務、PaaS平臺即服務、IaaS基礎設施即服務。
根據對比,云取證環境比傳統取證環境更復雜。傳統取證的環境通常為單機,目標明確、環境單一,而云取證的三種架構模式和三種服務模式可以組成九種組合,取證環境要困難得多。云取證證據獲取比傳統取證更困難。云取證一般不能扣押,只能在線取證,并且難以確定某個時間點確切的證據位置。
2.2.1 工作原理
區塊鏈技術是一種根據去中心化原理來實現一個數據庫的管理的技術。區塊鏈技術的模型主要采用分布式數據存儲、點對點傳輸、加密算法等計算機技術,它其實就是一個去中心化的數據庫,然后使用加密算法形成一個一個的數據塊,每一個數據塊里都包含了許多小數據,可以檢驗信息的真實性、可靠性。區塊鏈技術最重要的優點是它的隨意一個區塊都可以存儲數據,有效地避免區塊鏈之間不互通而導致數據不流通等問題的發生。
區塊鏈技術完成了兩個記錄,即交易(transactions)和區塊(blocks)。交易是指那些被收集在區塊鏈上的真實數據,區塊是指確定一些數據進入區塊鏈數據庫的時間以及區塊位置。
2.2.2 Merkle樹概念
Merkle樹結構是用來同步電子數據的一種算法,使數據保持一致性。選擇 Merkle樹的方法來收集存儲區塊鏈的電子數據,當 Merkle樹的葉子節點存儲了一個假的數據時,該節點可能會導致其他層的節點也發生變化,甚至可能會造成根節點數據的錯誤。但當處于電子數據環境中進行檢驗時,Merkle樹可以很方便地完成定位。
電子數據取證模型能夠對整個區塊進行取證,同時管理整個電子數據庫,電子數據取證模型如圖1所示。其中,所有的管理節點、普通節點都可以叫作計算節點。

圖1 電子數據取證模型
在基于區塊鏈的電子數據云取證系統中,需要采取一種取證算法進行計算,使其形成一種數據結構模型,其中每一個數據區塊都包含4個模塊,即區塊ID地址、區塊根部數據、數據特性以及區塊保全數據數量。
區塊一般采用共識算法的目的主要是為了解決區塊鏈網絡中存在的數據容量、存儲問題。傳統的算法計算時間長、計算容量小,因此在電子數據取證網絡中并不合適。在區塊共識算法中,要求計算的錯誤節點要小于一定值,就可以確保電子數據取證系統的正常狀態。在電子數據取證系統中,從頭到尾計算一次數據的結果被稱為視圖,每一個視圖設置一個編號,從0開始。假如某個視圖的區塊不能實現共識,就要進行視圖的更換,這個時候編號也會往上遞增,直到實現共識,若使用新的區塊,則重新開始算法設計。