陳誠
【摘 要】高校管理者應從制度著手,合理進行網絡使用引導,對各種網絡流量控制策略進行合理微調與修正,從技術角度提升網絡應用水平,為教學及應用體驗提供良好的網絡環境。
【關鍵詞】數據挖掘 網絡流量 控制
【中圖分類號】 G 【文獻標識碼】A
【文章編號】0450-9889(2014)07C-0187-03
隨著網絡規模的逐步擴大和計算機網絡中流量應用的日益復雜,我們管理計算機網絡的難度也逐漸增大,對網絡應用的管理技術也要求越來越高,為此,計算機網絡管理技術的新方法及新技術應運而生。直至目前,在現有的網絡帶寬的條件下,計算機網絡管理技術必須根據網絡流量、應用及服務的新要求,將網絡管理控制逐步從網絡層滲透到應用層。在應用層中,各種網絡應用都會產生相應的網絡流量,網絡流量作為網絡用戶活動特征的重要載體,發揮著極為重要的作用。通過分析對網絡流量進行監測得到的日志,可以實現網絡異常監測、網絡性能分析、鏈路狀態監測等,此舉對于計算機網絡的維護和運行都發揮極其重要的作用。
網絡應用的日志挖掘研究主要有兩個方向:一個是將網絡內所有用戶的網絡應用行為看成一個整體,分析這個整體在網絡中的訪問規律,了解用戶的網絡應用流量趨勢,制定相應的網絡訪問策略,從而達到針對不同網絡應用類型實現帶寬優化配置的目的。第二個是對網絡內單個用戶的網絡應用行為進行研究,每個用戶作為網絡中一個獨立的最小單位,都具有自己獨特的網絡行為慣性,通過分析這些用戶的網絡應用行為,不僅可以從細節上完善網絡流量控制策略,同時也可以針對不同的時段進行網絡流量的控制,使用戶能享受到更優質、流暢的網絡體驗。
一、數據挖掘
數據挖掘就是數據庫中的知識發現,是從大量的、不完全的、有噪聲的、模糊的、隨機的存放在數據庫、數據倉庫或其他信息庫中的數據中獲取有效的、潛在有用的、新穎的、最終可理解的模式的過程。
在眾多數據挖掘研究中關聯規則挖掘是較常使用的一種主要模式,同時也是最活躍的一種日志數據挖掘研究方法。因為關聯規則挖掘可以用來發現大量數據中各項集之間相關的關聯信息或一些有趣的關聯信息,進而找出數據庫中隱藏的信息關聯網。
就像在美國的沃爾瑪連鎖超市,為何會將尿布與啤酒這兩種完全不相干的商品擺在同一個貨架上?一段時間后的銷售統計結果卻是尿布和啤酒的銷量都一并大幅提高了。原因是妻子在家照顧孩子,會讓丈夫在下班后去超市買些孩子用的尿片回來,所以進入超市的丈夫們在選購尿片的時候,如果在同一貨架上看到自己喜歡喝的啤酒,就會順手購買,這就是不同事物間隱藏的關聯性所帶來的經濟效益,而這些關聯性則是通過數據挖掘中的關聯規則挖掘來發現的。
至今,比較經典的關聯規則挖掘算法有 Apriori算法和FP-growth算法,從算法思路上后者的效率高于前者,所以我們將使用FP-growth算法對網絡日志進行挖掘計算,從而找出網絡中頻繁出現的應用行為和用戶習慣性的訪問行為,以此為參考依據對網絡流量策略進行設置。
二、FP-growth算法
FP-growth算法的主要思想是分而治之,該算法會在對數據庫完成第一次頻繁項掃描操作之后,將掃描結果得到的頻繁項集數據通過排列樹算法形成一棵頻繁模式樹,稱為FP-tree,以此來保存頻繁項集的關聯信息,然后將FP-tree壓縮成特殊類型的投影數據庫,投影中的每個節點即為之前掃描到的頻繁項,相當于一棵樹中的支點,并針對該FP-tree進行闕值遍歷運算,此算法相比Apriori算法避免了產生大量候選項集,經過一次或多次遍歷操作,即可直接獲得頻繁模式。
三、分析挖掘網絡日志
(一)網絡應用分析
因監測對象是辦公網絡,所以在7點半至12點是一個行政辦公和教學時間,整個網絡中的流量跑到了最大,表明行政和教學都有對網絡的一個需求,而下行流量比上行流量高則表明網內用戶都在上午時段使用網絡查找資料或進行教學活動;12點至18點這段時間,上下行流量對半分則表明網內用戶在處理一些非網絡上的材料及教學活動已減少;而下班后至晚上22點只有下行流量則可說明在網內有部分用戶在使用相關軟件進行網絡下載的行為,不過我們之前設置的策略已將在上班時間的下載行為控制在一個可接受的范圍,即不會影響到白天正常辦公及教學的展開。
總之,通過網絡流量控制設備及基于SNMP協議的網絡軟件,可以全面了解網絡中詳細的流量狀況,再利用相關的網絡日志,結合日志挖掘的分析,分析得出網絡內占用大量帶寬流量的應用,將這些應用限制在一定的帶寬流量范圍內,使得用戶獲得更好的網絡體驗。當然也有用戶的網絡體驗覺得不如從前,如限制 P2P 類應用使得部分用戶無法快速下載所需網絡資源,或是一些網絡教學應用被錯誤識別并被限制,進而反映網絡變慢或無法順暢進行教學活動。管理者應從制度著手,合理進行網絡使用引導,同時,根據長期的網絡日志觀察分析,對各種網絡流量控制策略進行合理微調與修正,隨著網絡應用的不斷更新發展,根據之前分析日志制定出的流量控制策略也應不斷更新、調整,從技術角度提升網絡應用水平,為教學及應用體驗提供良好的網絡環境。
【參考文獻】
[1]楊際林,戴勃,唐姿偉,王禮景.基于數據挖掘算法的網格日志分析[J].遼寧工業大學學報,2011(4)
[2]晏杰,亓文娟. 基于Aprior & FP-growth 算法的研究[J].計算機系統應用,2013,22(5)
【作者簡介】陳 誠,廣西衛生職業技術學院助理實驗師。
(責編 丁 夢)