王光斌 楊菊英



摘 要: 通過對互聯網實際數據的分析,中國互聯網網站數量眾多,在復雜的網絡中真正有效的鏈接經過試驗調查分析卻非常有限,本文進一步通過算法設計和計算機仿真,對中國互聯網的資源整合提出看法,旨在對互聯網資源的整合有較強的實用價值。
關鍵詞: 小世界網絡 互聯網資源 影響
1.引言
根據中國互聯網中心CNNIC發表的實測數據顯示,中國互聯網的網站數量已經超過60多萬,而且數目在迅速增加,但是每一個網站的有效連接差別非常巨大。在這龐大復雜的信息網絡中,如何讓人們享受到更高的有價值信息?李德毅院士認為,當前的迫切目標是讓“適當的人在適當的時候享用適當的信息”。有用的信息未必都是每一個人需要的信息,李國杰院士指出:“信息取精是關鍵。”李幼平院士借助冪次定律提出的互聯網信息資源一分為二,對信息資源進行整合。
2.計算方法
網絡(Network)在數學上以圖(Graph)表示,圖的研究最早起源于18世紀瑞士著名數學家Euler的哥尼斯堡七橋問題。復雜網絡可以借助圖論的語言和符號精確簡潔地描述對復雜網絡研究進行研究過程中,人們提出許多概念和度量方法,用以表示復雜網絡的結構特性。
表1 變量及說明
度分布(Degree Distribution),是網絡的一個重要統計特征。這里的度(Degree)也稱為連通度(Connectivity),節點的度指的是與該節點連接的邊數,度分布則表示節點度的概率分布函數P(x),指的是節點有條邊連接的概率(見表1)。
平均路徑長度(Average Path Length,APL)。平均路徑長度是網絡中另一個重要的特征度量,是指網絡中所有節點對之間的平均最短距離,即節點之間經歷的邊的最小數目,其中所有節點之間的最大距離稱為網絡的直徑(Diameter),其都是影響網絡的傳輸性能與效率的重要參數。
3.模型分析
表2 互聯網連接數目調查報告
通過表2可以看出,連接數量超過50家以上的網站,所占比例不到總網站的2.7%,超過97%的網站的連接數目少于50個,只有極少數網站才擁有穩定的連接:
A照馬衛東的對中國互聯網資源研究得知,目前中國的互聯網是一種無尺度網絡,并求出冪值數為2.124。并通過計算機的模擬仿真結果顯示節點間距離和服務器數目之間的關系所示,度分布的計算為:
假如服務器數目假設達到3000,隨著服務器數目的增加,節點間的平均距離在縮短,說明網絡世界小世界網絡存在,并且差異極大,當服務器的數目接近2000個網站是中心,節點的距離出現反彈,當超過2000這個數目的時候,平均距離又開始降低,這個數目的網站,在互聯網中的數量是適當的,效果也是較佳的。
但是并不是意味著服務器的數目越少,效果更佳,通過大連理工大學劉建國和中國科技大學的王文旭的研究實驗結果如下圖發現,當代互聯網絡的用戶數目在2000左右的時候,對數據訪問的效果情況是:
圖 萬維網的r隨s的變化
r的數值開始趨近于-1,小于2000這個數值,r會逐步減少,網絡有效連接反而提高,畢竟人能夠接受的生理連接是有限度的,說明這個時候正是一個結點,超過這個數值,小世界網路越明顯,網絡越復雜,人們開始獲取信息的難度開始增加,在2000附近的時候,人們獲取信息資源的渠道較多,獲取信息資源的難度也比較適中。如何整合主流的網站,網站的數量需要不斷整合,并且控制有效的連接數量,是互聯網絡資源整合的重點。
4.結語
經過計算結果發現:網絡直徑有明顯的下降表明萬維網的小世界性質增強,但是網站的數量與客戶端的連接數m的增加卻是下降的,也就是說人們獲取信息的難度隨之增加。因此,只要整合兩三千個網站作為主流資源,就可以在很大的程度上滿足網民的日常需求。
參考文獻:
[1]Li Xiang,Chen G R.A local-world evolving network model[J].Physical A,2003,328:274-286.
[2]朱濤.改進的加權復雜網絡節點重要度評估的收縮方法.系統工程與電子技術,2009.8.
[3]席運江,黨延忠.基于知識網絡的專家領域知識發現及表示方法.系統工程,2005,23(8):110-115.
[4]李幼平.和諧互補的文化傳播體系.中國傳媒科技,2008.4.
[5]李幼平.雙結構互補網絡的研究.西南科技大學學報,2006.3.
[6]章忠志.BA網絡的一個等價演化模型.系統工程,2005.2.