999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

利用抽樣技術和分層多哈希方法實現長流的識別

2016-09-22 12:50:02景泉
現代經濟信息 2016年5期
關鍵詞:測量

景泉

摘要:本文提出了一種利用抽樣技術和分層多哈希的方法來識別長流,選取合適的哈希函數,能夠方便還原出五元組信息,減少了資源的開銷;使用多哈希函數,可以極大的降低哈希沖突,保證數據的準確性。

關鍵詞:抽樣技術;分層多哈希

中圖分類號:TP393.08 文獻識別碼:A 文章編號:1001-828X(2016)005-000-01

隨著互聯網規模和用戶數量的迅速擴大,導致網絡流量不斷增大,網絡行為越劇復雜,安全攻擊的頻率和對網絡造成的破壞性也在急劇的增長。為了更好的保障網絡安全,需要對網絡流量進行有效的監測和分析。現代網絡面臨的又一緊迫任務是為用戶提供可靠的業務質量保障。而用戶獲得的服務質量以及網絡供應商可提供的服務能力都必須通過流量數據分析獲得。因此,研究網絡流量特性是改善網絡服務質量問題的一個關鍵。而網絡流量測量技術是目前唯一能用于分析網絡狀況、掌握流量特性的有效方法。

一、國內外研究概況、水平和發展趨勢

Cristian Estan在長流識別的過程中就提出了一種抽樣技術和哈希技術結合的算法——sample and hold算法。sample and hold 算法是按照一定的概率對字節進行抽樣,如果一個報文被抽到,且其所屬的流標識未被創建,則以概率P創建這個流標識;而一個流的標識在內存中已經存在,則更新屬于該流標識的報文的記錄。這種方法可以較精確地識別長流,所用的內存空間也較小,但它對每個報文進行處理的同時都要訪問內存,因此要求內存的速度達到線速,給測量系統帶來很大的壓力。同時哈希的過程中也會造成一定的沖突,導致一定的誤差。并且在哈希的過程中還要記錄流標識的信息,會帶來存儲空間的增加。

國內的網絡測量研究起步較晚,近年研究網絡行為學逐步增加。長流占據了大部分的網絡通信量,了解長流的信息就能對一次通信行為有著很好的描述。長流識別在網絡測量領域也有很大的研究,提出了多種識別長流的方法。

二、識別過程

(一)分層隨機抽樣

分層隨機抽樣:如果每層中的抽樣都是獨立地按照簡單隨機抽樣進行的,那么這樣的抽樣稱為分層隨機抽樣,所得的樣本稱為分層隨機樣本。

分層隨機抽樣由于抽樣在每一層中獨立進行,所以各層的數據可以用于對本層(子總體)進行較精確的參數估計,然后將這些總和全部累加,就能得到對總體的一個較精確的參數估計。使用分層隨機抽樣可使樣本中分布更加均勻,從而具有更好的代表性。這樣就避免了樣本分布不平衡的現象。

(二)Bloom Filter的使用

Bloom Filter最早由Burton Bloom提出,并開始廣泛的應用到數據庫領域中,最近在網絡研究中得到了廣泛的應用,并取得了一些進展。如在高速網絡測量方面。

Bloom Filter是一個基于多個哈希函數映射來壓縮參數空間的數據結構,它支持成員查詢、隨機存儲。其具體的工作原理是,它描述了一個源串的集合S={x1, x2…, xn},我們把xi稱作是一個源串。申請一個內存大小為m比特位的存儲空間A,并定義一個哈希函數集合H={H1, H2,…, Hk},我們把Hi稱作是一個哈希函數。對于源串集合S中的任何一個元素xi來說,通過集合H中的K個獨立的哈希函數映射到存儲空間A中,得到K個[1…m]之間的數,并把存儲空間A中的這K個對應比特位置1。也可以利用哈希函數集合H的映射過程來檢驗 是否屬于集合S。下面的兩個算法分別描述了源串集合S中的元素被哈希到存儲空間的過程和驗證給定元素 是否屬于源串集合S的過程。

(三) 閾值的確定

識別長流的第一步就是要確定閾值。中給出了兩種確定閾值的辦法。第一種方法是考慮到收集的數據集合存在著重尾分布的特征。第二種方法更加的直接。閾值的確定會考慮到操作的環境。它要求計算一個參數,這個參數與總通信量有著密切的關系。利用這一參數可以把流分為兩類:一類就是超出了這個參數值,我們這一類的流定義為長流。另一類是沒有超過這個參數值,就把它們定義為短流。

本文采用的確定閾值的方法類似第二種辦法。即在測量的過程中利用一個計數器記錄總的報文數,設為M。我們約定把占據報文總數1%以上的流記為長流,則閾值T=M/100。在測量結束后,Bloom Filter中具有相同流標識的報文的命中次數如果超出了T值,就把這個流識別出來。

然后,我們要在測量的時間內選用簡單的哈希函數對到來的報文按照報文頭中的流標識分組,并對分組后的流標識進行Counting Bloom Filter變換。測量結束后,利用第二部分中所介紹的長流的定義,對每個哈希空間中的命中次數加以統計,把超出閾值的流識別出來,并存儲在存儲器中。我們利用段地址重疊的比特還原出主機的原始信息。中指出活躍IP分布是非常不均勻的重尾分布,相鄰網段或者IP活躍度較大。但是他們的活躍度相差較大不會影響我們分析的結論,我們可以用短標簽重疊的比特進行糾正。

(四)識別的基本步驟

1.構建一個多哈希站的模塊,每個哈希站都存放一個獨立的哈希函數

2.利用分層哈希方法依次哈希到對應的存儲空間

3.統計在某一時間粒度下總的報文數,并計算閾值。

4.對TCP的五元組進行Counting Bloom Filter變換。

5.統計每個流的報文數,把超過閾值的流記錄下來。

6.對記錄下的長流進行原始信息的還原。

圖1利用Counting Bloom Filter進行長流識別的過程。結構體BF由兩個成員組成。分別攜帶了主機原始信息和經過哈希函數作用后所命中該存儲空間中的報文數。圖中把IP地址分為三段,每一段都維護一個相應的Bloom Filter數據結構。把超出閾值的信息存儲在存儲器中。

圖1 ?利用Counting Bloom Filter進行長流識別的過程

三、結論

本文使用抽樣技術和分層多哈希方法實現了長流的識別,利用Bloom Filter這種數據結構在識別長流的過程中可以不用維護五元組信息,降低了在維護五元組信息的過程中帶來的資源的開銷。經數據測試,本文提出的識別長流的算法在識別長流的同時,可以還原成五元組信息,使用多哈希可以降低沖突,保證數據的準確性。

參考文獻:

[1] Veru Paxson,Jamshid Mahdavi. Scale Internet measurement[J].IEEE Communications,1998, 36(8):48-54.

[2]彭艷兵,龔儉,劉衛江,等. Bloom Filter哈希空間的元素還原[J]. 電子學報,2006,34(5):822-827.

[3]龔儉,彭艷兵,楊望,等.基于Bloom Filter的大規模異常TCP連接參數再現方法[J].軟件學報, 2006,17(3):434-444.

猜你喜歡
測量
測量重量,測量長度……
把握四個“三” 測量變簡單
滑動摩擦力的測量和計算
滑動摩擦力的測量與計算
測量的樂趣
二十四節氣簡易測量
日出日落的觀察與測量
滑動摩擦力的測量與計算
測量
測量水的多少……
主站蜘蛛池模板: 四虎成人免费毛片| 98超碰在线观看| 欧美精品在线观看视频| 亚洲欧美精品一中文字幕| 狠狠色婷婷丁香综合久久韩国| 午夜国产理论| 国产国模一区二区三区四区| 国产jizzjizz视频| 久久久精品无码一二三区| 污网站免费在线观看| 国内精品自在欧美一区| 伊人久久大香线蕉成人综合网| 99re视频在线| 丁香婷婷久久| 色婷婷在线播放| 精品人妻无码中字系列| jizz在线观看| 国产一级一级毛片永久| 素人激情视频福利| 97国产在线视频| 又爽又大又光又色的午夜视频| 一本大道香蕉中文日本不卡高清二区 | 亚洲AV无码一区二区三区牲色| 99在线观看精品视频| 欧美日韩一区二区三区四区在线观看| 欧美午夜视频| 欧洲一区二区三区无码| 亚洲男人天堂久久| 欧美a在线| 日韩久草视频| 亚洲无码熟妇人妻AV在线| 欧美另类精品一区二区三区| 亚洲精品日产AⅤ| 欧美日韩导航| 成年人福利视频| 欧美成人午夜视频免看| 国产v精品成人免费视频71pao| 97成人在线视频| 午夜福利视频一区| 理论片一区| 亚洲一区免费看| 91九色视频网| 亚洲永久视频| 国产成人综合在线视频| 亚洲资源站av无码网址| 色综合久久88| 夜夜爽免费视频| 99久久婷婷国产综合精| 欧美午夜视频在线| 欧美日韩精品一区二区视频| 国产日本欧美在线观看| 欧美v在线| 国产精品精品视频| 在线欧美国产| 凹凸国产分类在线观看| 日韩 欧美 小说 综合网 另类| 欧美三級片黃色三級片黃色1| 国产在线视频导航| 国产剧情伊人| 亚洲第一成人在线| 成年片色大黄全免费网站久久| 国产精品白浆无码流出在线看| 国产亚洲视频中文字幕视频| 69av在线| a毛片在线免费观看| 69av在线| 一本一本大道香蕉久在线播放| 日韩在线影院| 亚洲色图综合在线| 综合五月天网| 又猛又黄又爽无遮挡的视频网站| 美女视频黄频a免费高清不卡| 久久99国产视频| 国产精品一区在线麻豆| 精品视频在线一区| 一级一级特黄女人精品毛片| 国产毛片基地| 国产免费精彩视频| 国产在线精品99一区不卡| 狠狠色丁香婷婷综合| 伊人色在线视频| 久久亚洲中文字幕精品一区|