陳睿,歐若風,凌力
網上交易,主要是指在網絡的虛擬環境上,利用電子商務等各種手段來達成虛擬交易的過程。網上交易具有方便、快捷的優點,實現足不出戶即可完成商品的購買。但是在方便和快捷的背后,網上交易存在一定安全隱患。
由于交易在網上完成,商品的信息和描述,商議價格和訂單信息等都以電文的方式存在,要可靠安全的固化與保存交易的相關信息存在一定的難度,而這些數據恰恰是反映交易發生的重要證據,對于解決交易完成后所發生的法律糾紛,有著非常重要的影響。
本文以網上交易電文固化系統中的數據保全算法為分析和研究的主要內容。
整個系統設數據保全中心(Message Archiving Center,MAC),取證中心,另在交易平臺方(本地)設MAC代理網關,并與MAC數據保全中心和取證中心通過Internet相連。電文固化系統,其網絡拓撲結構如圖1所示。

圖1 電文固化系統網絡拓撲結構
用戶只與交易平臺和取證中心發生聯系:在交易的過程中,用戶向交易平臺發送保全請求;在解決交易糾紛的過程中,用戶向取證中心提出查看所保全的交易信息的請求。
交易平臺只與MAC網關發生聯系:當交易平臺收到用戶發出的保全請求之后,組織相關交易數據后發送給MAC網關。
MAC網關連接交易平臺、MAC數據保全中心和取證中心,具有完成保全指令、緩存管理、時鐘同步和安全傳輸等的功能,將固化保全的交易數據傳輸到MAC數據中心和保全中心。
MAC數據保全中,將收到的固化保全的交易數據進行保存,取證中心對保全固化的交易數據進行保存和司法認證。
對于交易中所產生的交易數據信息,MAC網關將其固化保全之后,按照一定標準進行分類和打包,形成兩類數據:
(1)全量數據
全量數據包含兩個部分:分量數據和交易具體信息(包含二進制數據/加密數據/電子郵件等),交易具體信息經過交易平臺方進行加密,保障數據完整性,防止交易信息被篡改,當取證需要時,再由交易平臺方進行解密和提取。
全量數據在傳輸前,MAC網關還會對其進行加密和數字簽名,保證傳輸的安全性。
(2)分量數據
對于分量數據中的具體信息,我們做如下定義:
transaction-id::交易編號
type::數據類型(訂貨單/付款單……)
title::名稱(商品名稱/金融機構……)
sheet-id::數據編號(訂單號/付款單號……)
time::日期和時間
seller-id::賣家標識
consumer-id::買家標識
根據以上定義的數據具體信息,分量數據的數據格式如下:
<archiving information>
<transaction-id>xxxx</transaction-id>
<type>xxxx</type>
<title>xxxx</title>
<sheet-id>xxxxxx</sheet-id>
<time>xxxxx</time>
<seller-id>xxx</seller-id>
<consumer-id>xxx</consumer-id>
</ archiving information >
此外,這些信息將作為固化系統中的索引數據,通過這些數據可以在系統中找到更為詳細的交易信息。
通過相關軟件進行統計,附加上傳輸過程中需要增加的數據包額外開銷之后,分量數據約占全量數據的17%。
在電文固化系統中,大量數據的交互出現在設立在交易平臺處的MAC網關與MAC數據保全、取證中心之間。
我們將連接交易平臺和MAC數據保全中心、取證中心的接口定義為平臺中心接口(trading Platform to Center Interface,PCI),此接口為應用層的接口,用于定義數據傳輸的內容和結構。
首先,我們定義某個用戶的單筆交易數據矢量Tn(c):
當某個用戶有多筆交易數據的時候,我們可以得到與之相對應的矢量矩陣s(c):

同時,我們定義數字簽名矢量K:

當數據進行傳輸前,矢量矩陣s(c)與數字簽名(有關數字簽名的設計方案由另外的人員完成)矢量K相乘,得到經過數字簽名的交易數據I。

交易平臺方通過調用服務端的電文固化接口,對指定電文進行保全,并存放到MAC數據保全中心服務器端和取證中心服務器端,作為“電子證據”。
由于在整個系統中,交易平臺、MAC數據保全中心服務器和取證中心服務器的物理位置并不在同一地點,相互之間在進行數據電文傳輸的過程中,需要考慮保全成本和傳輸效率。
同時作為一個數據保全系統,應該盡可能地記錄所有的來往信息,我們考慮在至少保證存儲一份全量數據的前提下,數據保全算法應滿足的要求:
(1)保全成本
數據保全算法需保證服務器端盡可能的用最小的代價換取最大容量的數據保全。
我們定義數據保全算法的日保全成本為Cn:

(2)傳輸效率
數據保全算法需保證通信雙方在傳輸數據的時候盡可能達到效率最高,即盡可能減少傳輸相同信息的次數。
我們定義數據保全算法的傳輸效率為En:

其中Dn表示在系統中傳輸的信息量(在計算信息量時,如數據被多次傳送,信息量中只計入傳送一次的數據大小),D表示在系統中總計傳輸過的數據量(在計算數據量時,如數據被傳送多次,數據量中就相應增加每次傳送的數據大小)。
(3)傳輸可靠性
數據保全算法需保證服務器端獲得的數據為可靠的,沒有遺漏和丟失。
由于網上交易電文固化系統是一個全新的概念,因此在數據保全算法研究的過程中,參考了有關數據備份的相關資料。
文獻[1]給出了“異地數據備份系統”的相關技術及實現方案;文獻[2]給出了由“本地數據中心、本地緩存網關和遠程備份網關”所組成的數據備份系統的實現方案。
如果將這些數據備份系統的方案運用到電文固化系統中,我們可以得到“服務器全量并行式方法”。此方法的示意圖見圖2。
在此方法中,當交易平臺方收到用戶的保全請求,通過調用服務端的MAC代理網關,對指定交易電文進行保全,將保存得到的全量數據通過網絡同時傳輸保存到MAC數據保全中心和取證中心。此方法的流程圖見圖3。

圖3 服務器全量并行式方法流程圖
根據以上所提出的設計需求,我們可以對于“服務器全量并行式方法”進行各個方面的分析。
當MAC網關向MAC保全中心和取證中心傳輸全量數據時,(1)中的每一筆交易的數據d為:

在此方法中,整個系統所需傳輸的數據總量D為:
D=2Dt
其中,Dt為全量數據。
我們可以看出,接收方接收的每筆交易的交易數據越小,則數據的保全成本相對越低。
在此方法中,
Dn=Dt
由(2)可得,傳輸效率En為:

此外,對于傳輸可靠性,在對等通信的過程中,雖然整個電文固化系統有比較完善的通信協議來保證傳輸的安全性。但是由于取證中心的硬件設備可能無法達到非常高的配置,所以當收到MAC代理網關發送過來的全量數據時,可能無法全部存儲下來,導致在傳輸的過程中無法保存全部數據,造成數據的丟失和遺漏,與MAC保全中心服務器上保全的信息無法形成一一對應,從而導致無法保證傳輸數據的可靠性。
隨著使用網上交易的用戶數量不斷增加,用戶的法制意識不斷加強,會有越來越多的人使用電文固化系統來保全交易的電文,維護自己的合法權益。
電文固化系統為了保證所保全的交易電文的法律有效性,必須在取證中心這樣的司法機構保存相關的數據,但是由于取證中心這樣的司法機構未必具有相關的設備和維護人員,所以系統必須改進已有的保全方法來適應實際的需求,從而達到取證的目的。
如果采用存儲相對較小的分量數據,對于取證中心的服務器無疑是一個最佳的選擇,通過將分量數據整理成為查詢全量數據的索引目錄,一方面可以快速的找到所需要的交易信息,另一方面可以降低存儲的成本。
因此,我們提出了“服務器分量串行式方法”。此方法的示意圖見圖4。

圖4 服務器分量串行式方法示意圖
在此方法中,交易平臺方調用服務端的MAC代理網關,對指定交易電文進行保全,將保存得到的全量數據通過網絡傳輸保存到MAC數據保全中心,當MAC數據保全中心收到全量數據之后,將全量數據中的摘要數據(分量數據)通過網絡傳輸保存到取證中心。此方法的流程圖見圖5。

圖5 服務器分量串行式方法流程圖
對于此方法,我們依然從傳輸效率、存儲成本和傳輸可靠性這3個方面進行分析。
當MAC網關向MAC保全中心傳輸全量數據時,(1)中的每一筆交易的數據d為:

當MAC保全中心向取證中心傳輸分量數據時,(1)中的每一筆交易的數據d為:

在此方法中,整個系統所需傳輸的數據總量D為:

其中,Dt為全量數據。Dp為分量數據。
在保全成本上,存儲分量數據的存儲成本僅為存儲全量數據的1/6,對于整個系統,運用此方法,在保全的成本上降低了近40%。
因為Dt包含Dp,所以在此方法中,
Dn=Dt
由(2)可得,傳輸效率En為:

在傳輸可靠性上,由于所需要的存儲空間大幅度的下降,服務器在接收數據時基本能夠保證沒有數據的丟失和遺漏。
服務器分量串行式方法在傳輸效率、存儲成本和傳輸可靠性這3方面相比服務器全量并行式方法都有了一定的提高,但是取證中心所獲得的數據由MAC保全中心提供,缺乏和原始數據進行相關的驗證與比對。
因此,我們提出了更進一步的改進方法,服務器分量分布式方法。此方法的示意圖見圖6。

圖6 服務器分量分布式方法示意圖
在此方法中,交易平臺方調用服務端的MAC代理網關,對指定交易電文進行保全,將保存得到的全量數據通過網絡傳輸保存到MAC數據保全中心,同時將分量數據通過網絡傳輸保存到交易平臺和取證中心。當MAC數據保全中心收到全量數據之后,將全量數據中的分量數據通過網絡傳輸保存到取證中心。交易平臺和取證中心將獲得的數據與之前已有的數據進行比對驗證。此方法的流程圖見圖7。

圖7 服務器分量分布式方法流程圖
在此方法中,整個系統所需傳輸的數據總量D為:

其中,Dt為全量數據。Dp為分量數據。
因為Dt包含Dp,所以在此方案中,
Dn=Dt
由公式2可得,傳輸效率En為:

此方法雖然在傳輸效率和存儲成本這兩方面稍遜色于之前的“服務器分量串行式方法”,但加入了交易數據的比對驗證,進一步加強了數據的可靠性。
本文所列出的3種方法在傳輸效率、存儲成本、傳輸可靠性、數據驗證對比、服務器保全數據類型這5個方面的比較,詳見表1。

表1 分類對比
通過對比以上各個方面,我們可以得出:
在取證中心,或者說是司法部門的技術支持和服務器設備條件允許的情況下,建議選擇“服務器全量并行式方法”,在MAC保全中心和取證中心都保存一份詳盡的交易信息。
在取證中心的技術支持和服務器設備條件不允許的情況下,同時面向C2C的交易平臺,建議選擇“服務器分量串行式方法”,因為無論買家和賣家和交易平臺都沒有利益關系,可以省略數據對比驗證這一環節。
在取證中心的技術支持和服務器設備條件不允許的情況下,同時面向B2C的交易平臺,建議選擇“服務器分量分布式方法”,此時,賣家始終為交易平臺方,所以對于每一筆保全的交易信息,我們需要進行再一次的對比驗證,以保證數據可靠性和不被篡改。
本文針對網上交易的特點,分析、比較研究了3種可行的數據保全方法,分別針對3種不同的情況,可以可靠安全地固化、保存和認證網上交易的證據,為解決網上交易證據認證這一問題提出了新的解決方法。目前此系統正逐步得到一些網上交易平臺的應用。
[1]沈曉彥,魯冰.異地數據備份系統技術應用及分析[J].光盤技術,2007(4).
[2]皮璐琳,劉曉潔,李濤,張洪亮.一種網絡多點備份系統的設計和實現[J].計算機安全,2008(5).
[3]徐偉,麥永浩.信息網絡取證的若干關鍵問題分析[J].信息網絡安全,2007(11).
[4]杭逸夫,張楚,阿拉木斯.網絡公證--解決網絡信用危機的新途徑[J].信息網絡安全,2002(5).
[5]秦曉明.基于網絡公證的電子商務認證體系研究[J].商場現代化,2008(5).