基于DNA編碼的網(wǎng)絡(luò)隱蔽存儲(chǔ)信道設(shè)計(jì)方法

2014-03-26 01:45:56高屹

實(shí)驗(yàn)技術(shù)與管理 2014年6期

關(guān)鍵詞：信息方法

高屹

(西藏民族學(xué)院信息工程學(xué)院，陜西咸陽 712082)

網(wǎng)絡(luò)隱蔽通信是指利用計(jì)算機(jī)網(wǎng)絡(luò)中合法公開的通信信道進(jìn)行秘密信息傳輸?shù)倪^程。其本質(zhì)是將秘密信息隱藏于網(wǎng)絡(luò)流量特征的信息隱藏技術(shù)[1]，是除網(wǎng)絡(luò)加密外另一種重要而有效的保密通信手段[2]。

目前，有關(guān)網(wǎng)絡(luò)隱蔽通信的研究主要分為時(shí)間信道、行為信道和存儲(chǔ)信道[3-6]。時(shí)間信道和行為信道隱蔽性較好，但時(shí)間信道存在復(fù)雜網(wǎng)絡(luò)環(huán)境下難以保證通信兩端同步的致命缺陷，且傳遞信息容量較小；而行為信道依賴于流量行為的識(shí)別，難以保證較高的準(zhǔn)確性，所能攜帶秘密信息也較少；存儲(chǔ)信道能利用網(wǎng)絡(luò)協(xié)議合法字段簡(jiǎn)單、準(zhǔn)確地傳送大量秘密信息，不受網(wǎng)絡(luò)環(huán)境干擾，但同時(shí)也易于遭受檢測(cè)，降低了該信道的隱蔽性。

現(xiàn)有的網(wǎng)絡(luò)存儲(chǔ)隱蔽信道一般是將秘密信息附加在不常用的數(shù)據(jù)包字段中(如IP頭部ID和Offset字段、TCP頭部Seq字段等)來實(shí)現(xiàn)隱秘傳輸。Murdoch等人[7]在預(yù)設(shè)密鑰的控制下，通過模擬操作系統(tǒng)中產(chǎn)生IP ID字段和TCP ISN (Initial Sequence Number)字段值的過程，將含有秘密信息的隨機(jī)數(shù)嵌入到正常數(shù)據(jù)包的此2個(gè)字段中，減少了秘密信息被檢測(cè)的可能性，但該方法需借助塊加密算法才能完成秘密信息的嵌入，增加了該方法的時(shí)空復(fù)雜度；Ahsan等人[8]指出IP頭部中存在冗余位，并給出了利用IP頭部中指示數(shù)據(jù)包分片的3個(gè)標(biāo)志位和ID字段作為隱蔽信道，該方法可使單個(gè)正常數(shù)據(jù)包傳輸多個(gè)bit秘密信息；Zhai等人[9]設(shè)計(jì)了一種隱蔽存儲(chǔ)信道，在保證TCP頭部校驗(yàn)和不變的情況下，通過補(bǔ)償算法在重傳數(shù)據(jù)包中TCP有效載荷尾部嵌入秘密信息，隨著重傳數(shù)據(jù)包數(shù)增多該方法才能增大秘密信息容量，但也會(huì)引起網(wǎng)絡(luò)異常，使得秘密信息易被發(fā)現(xiàn)和檢測(cè)，降低了隱蔽性，且該方法會(huì)改變TCP有效載荷內(nèi)容，需要對(duì)應(yīng)用層解析程序修改，不易于使用。

本文提出一種基于DNA編碼的網(wǎng)絡(luò)存儲(chǔ)隱秘信道設(shè)計(jì)方法(network Covert Storage Channel based on DNA coding，CSCDNA)。實(shí)驗(yàn)結(jié)果表明：在保證較好隱蔽性的情況下，對(duì)于傳輸同等長度的秘密信息，本文所提方法與其他方法相比使用時(shí)間較少，所使用的數(shù)據(jù)包數(shù)量也較少。

1 預(yù)備知識(shí)

1.1 DNA編碼

眾所周知，脫氧核糖核酸 (deoxyribonucleic acid，俗稱DNA)分子序列是由A(adenine)，C(cytosine)，G(guanine)和T(thymine)4種核苷酸堿基組成。其中，A和T，C和G構(gòu)成互補(bǔ)堿基對(duì)，且此配對(duì)規(guī)律是固定不變的。而在二進(jìn)制編碼中，00和11，01和10也構(gòu)成互補(bǔ)對(duì)。因此，4種核苷酸堿基可用00、11，01及10的組合來表示。本文中01和00分別代表A、C，10和11分別代表T、G。

DNA編碼使用3個(gè)核苷酸堿基來表示一個(gè)字符[10]，如表1所示，每個(gè)字符的DNA碼長為6 bit。雖然DNA編碼只表示了小寫字母、數(shù)字和一些標(biāo)點(diǎn)符號(hào)，但在實(shí)際應(yīng)用中已足以編碼秘密信息，而且與經(jīng)典的8 bit ASCII相比，減少了表示字符所使用的二進(jìn)制位數(shù)，提高了對(duì)字符的編碼效率。例如，若秘密消息M=“ab”,根據(jù)表1，M對(duì)應(yīng)的DNA編碼為MDNA=“CGACCA”,變成二進(jìn)制序列為MDNA=“001101000001”，而MASCII=“0110000101100010”，很顯然，MDNA長度要小于MASCII。

表1 DNA編碼表

注：AC—ASCII Character;DC—DNA Code。

因此，DNA編碼是不同于傳統(tǒng)ASCII碼的新編碼方式，采用DNA編碼對(duì)秘密信息編碼，既可提高編碼效率，還能在一定程度上增強(qiáng)秘密信息的隱蔽性。

1.2 Arnold變換

為進(jìn)一步增強(qiáng)MDNA的隱蔽性及隨機(jī)性，CSCDNA中還使用了Arnold變換[11]對(duì)其進(jìn)行置亂。該變換可將原始序列置亂后，再通過若干次相同的變換操作，恢復(fù)出原始序列，是一種傳統(tǒng)的混沌系統(tǒng)。Arnold變換目前主要作為一種圖像置亂技術(shù)，應(yīng)用于圖像數(shù)字水印領(lǐng)域[12-13]。

定義設(shè)A為K×K的方陣，(x,y)表示A中某個(gè)元素的坐標(biāo)，則將元素(x,y)變到另一元素(x′,y′)的以下變換過程稱為Arnold變換

(1)

x,y,x′,y′=0,1,2,…,K-1,K(K≥2)為整數(shù)，mod為余數(shù)運(yùn)算。

推論對(duì)于K×K方陣A中的任一元素(x,y)，存在一個(gè)整數(shù)T(T>0)，使得式(2)成立

(2)

此推論說明Arnold變換具有周期性。表2給出了不同階數(shù)矩陣A的Arnold變換周期。

表2 不同階數(shù)矩陣A的Arnold變換周期

2 CSCDNA網(wǎng)絡(luò)隱蔽信道機(jī)制

2.1 CSCDNA系統(tǒng)模型

CSCDNA系統(tǒng)模型結(jié)構(gòu)如圖1 所示，發(fā)送端利用編碼器Encoder在共享密鑰的干預(yù)下將秘密信息M變換處理后嵌入到其所發(fā)送的正常合法的數(shù)據(jù)包中，形成合法的網(wǎng)絡(luò)流，該網(wǎng)絡(luò)流在經(jīng)過網(wǎng)絡(luò)信道傳輸?shù)竭_(dá)接收端。接收端利用解碼器Decoder按照與Encoder相反的處理過程對(duì)網(wǎng)絡(luò)流量的數(shù)據(jù)包進(jìn)行處理，以恢復(fù)出秘密信息M。共享密鑰可事先通過其他途徑分發(fā)給發(fā)送端與接收端。

圖1 CSCDNA系統(tǒng)模型

可以看出：Encoder、Decoder及共享密鑰是CSCDNA系統(tǒng)模型的核心所在，且Decoder與Encoder互為逆過程。因此，本文此處僅對(duì)Encoder部分作詳細(xì)介紹。

2.2 Encoder算法過程

假設(shè)秘密消息M為由ASCII字符組成的字符串，Encoder的任務(wù)是根據(jù)密鑰將M經(jīng)過變換處理后嵌入進(jìn)發(fā)送端所產(chǎn)生的正常數(shù)據(jù)包流中，其處理流程如圖2所示，包含如下基本步驟：

(1) 利用DNA編碼將M轉(zhuǎn)換為對(duì)應(yīng)的二進(jìn)制序列MDNA。例如，若M=“abc”,根據(jù)表1可知，MDNA={CGACCAGTT}={001101000001111010}；

(2) 將MDNA劃分為q個(gè)KKbits的數(shù)組Wi和一個(gè)rbits數(shù)組Z，并將q個(gè)數(shù)組直接轉(zhuǎn)換為q個(gè)方陣Ai(i=1 ,2 ,3 ,…，q)；

(3) 對(duì)此q個(gè)方陣分別進(jìn)行k次Arnold變換；

圖2 Encoder處理過程

Decoder的任務(wù)是根據(jù)與發(fā)送端共享的密鑰,從到達(dá)接收端的數(shù)據(jù)包中正確恢復(fù)出秘密信息M，其處理過程與Encoder算法相反，比較簡(jiǎn)單，本文此處不再贅述。

3 實(shí)驗(yàn)結(jié)果

為測(cè)試CSCDNA的性能，本文采用C語言在Ubuntu12.05平臺(tái)上實(shí)現(xiàn)了Encoder和Decoder，并實(shí)現(xiàn)了面向TCP/IP網(wǎng)絡(luò)環(huán)境的收發(fā)程序。發(fā)送方調(diào)用Encoder處理秘密信息，并嵌入合法數(shù)據(jù)包中，然后將這些數(shù)據(jù)包發(fā)送到網(wǎng)絡(luò)上。接收方被動(dòng)接收數(shù)據(jù)包并傳遞給Decoder，Decoder執(zhí)行與Encoder相反的處理過程以恢復(fù)出秘密信息。收發(fā)程序被部署在校園網(wǎng)內(nèi)地理位置相距較遠(yuǎn)的兩臺(tái)主機(jī)上，其硬件配置均為Intel(R) Pentium(R) G640 2.80 GHz,4 GB RAM及 Ubuntu12.05 。在實(shí)驗(yàn)中，收發(fā)雙方所使用的DNA編碼表為表1，Arnold變換參數(shù)分別為K=16，k=8，T=12。

實(shí)驗(yàn)主要將CSCDNA與Murdoch[7]及Zhai[9]的方法從嵌入秘密信息時(shí)間開銷和數(shù)據(jù)包使用數(shù)量方面進(jìn)行了對(duì)比，其結(jié)果分別如圖3、圖4所示。圖中L代表MDNA序列所包含的bit總數(shù)。

圖3 CSCDNA,Murdoch及Zhai時(shí)間開銷對(duì)比

圖4 CSCDNA,Murdoch及Zhai數(shù)據(jù)包使用數(shù)量對(duì)比

對(duì)于同一長度的MDNA序列，CSCDNA與Murdoch在完成嵌入MDNA序列時(shí)所使用的數(shù)據(jù)包數(shù)量比Zhai方法要少得多(如圖4所示)。這是因?yàn)椋m然從單個(gè)數(shù)據(jù)包可攜帶的秘密信息長度來看，Zhai算法將秘密信息嵌入在重傳數(shù)據(jù)包的TCP載荷內(nèi)，其長度可達(dá)幾十個(gè)字節(jié)。而Murdoch和CSCDNA算法則將秘密信息嵌入在單個(gè)數(shù)據(jù)包內(nèi)IP或TCP報(bào)頭的某些合法字段中，最多每次可嵌入幾個(gè)字節(jié)。Zhai算法貌似比Murdoch和CSCDNA算法能攜帶更多的秘密信息，但由于Zhai算法只能在發(fā)生重傳的數(shù)據(jù)包中嵌入秘密信息，而數(shù)據(jù)包重傳的發(fā)生是整個(gè)流量傳輸過程中一個(gè)小概率事件，整個(gè)流量傳輸過程是產(chǎn)生重傳數(shù)據(jù)包的前提，因此，Zhai算法完成秘密信息的嵌入是建立在整個(gè)流量基礎(chǔ)上的。盡管Zhai算法對(duì)流量?jī)?nèi)其他正常數(shù)據(jù)包不嵌入任何秘密信息，但其本質(zhì)上相當(dāng)于使用了整個(gè)流量的所有數(shù)據(jù)包(重傳和正常數(shù)據(jù)包之和)。而Murdoch和CSCDNA算法基本上能在流量?jī)?nèi)的每個(gè)數(shù)據(jù)包中嵌入秘密信息，對(duì)整個(gè)流量利用率非常高。圖4為重傳率為5%的情況下，3種算法所使用數(shù)據(jù)包數(shù)量對(duì)比。可見，Murdoch和CSCDNA算法使用數(shù)據(jù)包數(shù)量基本相同，而Zhai算法所使用的數(shù)據(jù)包數(shù)量明顯高于前兩種算法。

4 結(jié)論

綜上所述，本文給出了一種基于DNA編碼的網(wǎng)絡(luò)存儲(chǔ)隱蔽信道設(shè)計(jì)方法。該方法借用DNA編碼和Arnold變換不僅有效增強(qiáng)了秘密信息的隱蔽性和隨機(jī)性，而且還維持了較低的時(shí)空開銷。通過實(shí)驗(yàn)中與其他同類方法對(duì)比，結(jié)果表明：在嵌入相同長度的秘密信息條件下，與其他方法相比，該方法不僅時(shí)間開銷小，而且所需的數(shù)據(jù)包數(shù)量也較少，其性能優(yōu)于其他同類方法。下一步將繼續(xù)在實(shí)際應(yīng)用環(huán)境中對(duì)該網(wǎng)絡(luò)存儲(chǔ)隱蔽信道做測(cè)試，研究如何增強(qiáng)其抗檢測(cè)性。

[1] Moulin P，O’Sullivan J A.Information-theoretic analysis of Information Hiding[J].IEEE Transactions on Information Theory,2003,49(3):563-593.

[2] Lampson B.A note on the confinement problem[J].Communication of the ACM,1973,10(16):613-615.

[3] Hoffman C,Johnson D,Yuan B，et al.A Covert Channel in TTL Field of DNS Packets[C]//In Proceedings of 2012 International Conference on Security and Management.Las Vegas:Elsevier,2012.

[4] Johnson D,Lutz P，Yuan B.Behavior-based covert channel in Cyberspace[C]// Proceedings of Intelligent Decision Making Systems,New Jersey,2009:311-318.

[5] Bukke Devendra Naik,Sarath Chandra Boddukolu,Pothula Sujatha.Connecting entropy-based detection methods and entropy to detect covert timing channels[J].Advances in Computing and Information Technology,2012,176(1):279-288.

[6] Cabuk S,Brodley C E,Shields C,et al.IP covert timing channels:design and detection[C]// Proceedings of the 11th ACM Conference on Computer and Communications Security,Washington DC,2004:178-187.

[7] Murdoch S J,Lewis S.Embedding Covert Channels Into TCP/IP[C]// Proceedings of Information Hidding’05.Berlin,Heidelberg:Springer-Verlag,2005.

[8] Ahsan K,Kundur D.Practical Data Hiding in TCP/IP[C]// Proceedings of Workshop on Multimedia Security at ACM Multimedia ’02,Juan-les-Pins (on the French Riviera):ACM,2002.

[9] Zhai J,Liu G，Dai Y.An Improved Retransmission-based Network Steganography:Design and Detection[J].Journal of Networks,2013,8(1):182-188.

[10] Liu Hongjun,Lin Da,Kadir A.A novel data hiding method based on deoxyribonucleic acid coding[J].Computers and Electrical Engineering.2013,39(4):1164 11 73.

[11] Wikipedia.Arnold’s cat map [EB/OL].(2013-9-24) [2013-10-24].http://en.wikipedia.org/wiki/Arnold%27s_cat_map.

[12] Zhong Q C,Zhu Q X.A DCT domain color watermarking scheme based on chaos and multilayer Arnold transformation[C]// Proceedings of 2009 International Conference on Networking and Digital Society,Guiyang:IEEE,2009,2:209-212.

[13] Kishore Kumar N K,Sheeba V S.Blind biometric watermarking based on contourlet transform[C]// Proceedings of the 3rd International Conference on Computing Communication &Networking Technologies,Coimbatore IEEE ,2012:1-6.