唐晶晶,張玉瑛,黃自強,龍 佳
(湖南人文科技學(xué)院 計算機科學(xué)技術(shù)系,湖南 婁底 417000)
當(dāng)今,Internet在人們生活中各個方面起著非常重要的作用,文件共享是目前Internet上最主要、最成功的P2P應(yīng)用,可以說文件共享的需求直接引發(fā)了P2P技術(shù)的產(chǎn)生與開發(fā)熱潮[1],而且文件共享應(yīng)用已經(jīng)成為當(dāng)今互聯(lián)網(wǎng)流量的重要組成部分[2-3]。因此,P2P文件共享系統(tǒng)的節(jié)點行為特征研究是整個網(wǎng)絡(luò)通信領(lǐng)域研究的熱點之一。P2P文件共享系統(tǒng)的節(jié)點行為特征研究需要解決的一個關(guān)鍵問題是如何準(zhǔn)確地刻畫文件的復(fù)制傳播特性。文件復(fù)制傳播特性的研究有兩個方面的意義:一是加深研究對P2P文件共享系統(tǒng)的認(rèn)識,包括定性和定量的認(rèn)識;二是為P2P文件共享系統(tǒng)的流量分析和控制提供指導(dǎo)。
由于P2P文件共享系統(tǒng)中文件復(fù)制傳播范圍很廣,而且具有突發(fā)性,通過在真實網(wǎng)絡(luò)環(huán)境中觀測來精確地研究其傳播特征是不可行的。通過統(tǒng)計分析的方法來仿真建模是進行研究P2P文件共享系統(tǒng)中文件復(fù)制傳播的一種重要的手段。文件復(fù)制傳播模型是通過一組微分方程或者離散的遞歸表達(dá)式來描述文件在網(wǎng)絡(luò)中復(fù)制傳播的統(tǒng)計規(guī)律和動態(tài)過程。由于文件在網(wǎng)絡(luò)中的復(fù)制傳播與流行疾病在人群中傳播有許多相似之處,因此,本文運用系統(tǒng)動力學(xué)方法提出基于SEIR的文件復(fù)制傳播模型(以下簡稱SDFCM模型),從定性和定量兩個方面來研究文件在網(wǎng)絡(luò)中復(fù)制傳播的過程。
定義1 S態(tài)是指用戶節(jié)點在提出文件下載請求前,在文件共享系統(tǒng)中搜索和查找文件時的狀態(tài)。集合S的元素總數(shù)記為s, 時刻t的S態(tài)節(jié)點總數(shù)記為s( t)。
定義2 P態(tài)是指用戶節(jié)點在提出下載請求后,會進入下載隊列等待下載完成的狀態(tài),相當(dāng)于疾病傳播模型中的潛伏期態(tài)。集合P 的元素總數(shù)記為p, 時刻t 的P態(tài)節(jié)點總數(shù)為p( t) 。
定義3 用戶節(jié)點在提出下載請求后,進入下載隊列等待文件下載的時間段記為π。
定義4 I態(tài)是指當(dāng)用戶節(jié)點下載文件完成后,可能會共享該文件一段時間的狀態(tài)。集合I的元素總數(shù)記為i, 時刻t 的I態(tài)節(jié)點總數(shù)記為i( t) 。
定義5 Q態(tài)是用戶節(jié)點在文件共享系統(tǒng)中搜索和查找文件后,對該文件不感興趣,沒有提出下載請求后的狀態(tài)。集合Q 的元素總數(shù)記為q, 時刻t 的Q態(tài)節(jié)點總數(shù)記為q( t) 。
定義6 用戶節(jié)點完成下載文件后并不共享該文件或者共享該文件一段時間后刪除了該文件,此時的狀態(tài)為R態(tài)。集合R 的元素總數(shù)記為r, 時刻t 的R態(tài)節(jié)點總數(shù)記為r( t) 。
用戶節(jié)點狀態(tài)之間的轉(zhuǎn)移關(guān)系如圖1 所示。

圖1 SDFCM模型中用戶節(jié)點狀態(tài)轉(zhuǎn)移關(guān)系圖
在SDFCM模型中,我們給出兩個基本假設(shè):
1)我們分析的是用戶節(jié)點的統(tǒng)計變化規(guī)律,使用在一個時間段上各種狀態(tài)下用戶節(jié)點的統(tǒng)計數(shù)目來描述其行為的變化,并通過微分方程來描述用戶節(jié)點在文件傳播過程中行為的變化。
2)環(huán)境封閉原則,即所研究的各種狀態(tài)用戶節(jié)點的總數(shù)量和沒有發(fā)生變化,并假設(shè)所有用戶節(jié)點的總數(shù)為N。
根據(jù)上面的兩個基本假設(shè)和用戶節(jié)點狀態(tài)轉(zhuǎn)移關(guān)系圖,建立微分方程組。
S態(tài)的用戶節(jié)點數(shù)量隨時間變化的速度為:
(1)
其中α是單位時間內(nèi)S態(tài)的用戶節(jié)點對某種文件感興趣,并提出下載請求的概率,設(shè)α=ω(1-p(t)/N)λ,一般情況下ω=0.5,λ=3[4-5];β是單位時間內(nèi)S態(tài)的用戶節(jié)點對某種文件不感興趣,不會提出下載請求的概率,β=1-α。
P態(tài)的用戶節(jié)點數(shù)量隨時間變化的速度為:
其中δ是單位時間內(nèi)P態(tài)的用戶節(jié)點經(jīng)過等待后下載完成并愿意共享該文件的概率,設(shè)δ=δ0(1-i(t)/N)λ/π。
一般情況下,δ0=0.8/N,λ=3,ε=1-δ[4-5]。
I態(tài)的用戶節(jié)點數(shù)量隨時間變化的速度為:
(3)
其中μ=K/Ts,Ts是I態(tài)的用戶節(jié)點愿意共享該文件的平均時間,一般情況下K為一個經(jīng)驗值,可以根據(jù)實際情況而定。
R態(tài)的用戶節(jié)點數(shù)量隨時間變化的速度為:

(4)
Q態(tài)的用戶節(jié)點數(shù)量隨時間變化的速度為:

(5)
我們使用BitComet系統(tǒng)中記錄用戶節(jié)點上傳和下載信息的日志文件來構(gòu)造實驗環(huán)境。
實驗環(huán)境說明如下:
1)假設(shè)所有用戶節(jié)點在會對其中的某些流行文件感興趣,選取BitComet系統(tǒng)中MP3格式的流行度排名在前5名的文件,它們分別以A,B,…,E來表示,作為我們的實驗數(shù)據(jù)。用戶節(jié)點數(shù)是指系統(tǒng)注冊號不同的節(jié)點。
2)由于系統(tǒng)中存在一些不上傳文件的節(jié)點,設(shè)節(jié)點共享概率等于系統(tǒng)中既上傳又下載的節(jié)點數(shù)量和所有下載節(jié)點的數(shù)量的比值。
3)平均下載速度定義為所有用戶節(jié)點的下載量除以所有用戶節(jié)點自進入下載隊列排隊到下載結(jié)束這段時間的商。平均下載速率除以文件長度即是單位時間的下載完成速率。

表1 實驗結(jié)果
實驗結(jié)果如表1所示。可以看出,用戶日志記錄的下載完成用戶數(shù)據(jù)和實驗結(jié)果相差不大,吻合性很好,說明我們的模型具有很好的實用性。
本文提出的SDFCM模型能夠比較合理地刻畫P2P文件共享系統(tǒng)中文件復(fù)制傳播過程特征。該模型從定性和定量兩個方面對文件復(fù)制傳播過程進行建模,通過實驗來驗證了模型的合理性和實用性。如何對模型進行改進,使其能適用于P2文件共享系統(tǒng)規(guī)模動態(tài)變化等情況,是今后的研究工作之一。
參考文獻:
[1]MOORE D,HEBELER J.對等網(wǎng)[M].蘇忠,戰(zhàn)曉雷,等譯.北京:清華大學(xué)出版社,2003.
[2]AZURI C , IPOQUE.Internet study 2007:P2P file sharing still dominates the world wide Internet [EB/OL].http://www. ipoqpe.com,2007.
[3]The true picture of Peer-to-Peer file-sharing [EB/OL].http://www. cachelogic.com/researh/Cache-Logic_Analyst_Presnetation_july2004.Pdf, 2004.
[4]戴明強,李衛(wèi)軍,楊鵬飛.?dāng)?shù)學(xué)模型及其應(yīng)用[M].北京:科學(xué)出版社,2007.
[5]馬知恩.傳染病動力學(xué)的建模和研究[M].北京:科學(xué)出版社,2004.