


摘 要:本文運用R軟件對20個國家的信息基礎設施發展情況進行分析,最后根據分析結果,將這20個國家分為了三類。
關鍵詞:聚類分析;信息基礎設施;SPSS18.0
聚類分析的基本思想是,從一批樣品的多個指標變量中,定義能度量樣品間或變量間相似程度(或親疏關系)的統計量,在此基礎上求出各樣品(或變量)之間相似程度度量值,按相似程度的大小,把樣品(或變量)逐一分類,關系密切的類聚集到一個小的分類單位,關系疏遠的類聚集到一個大的分類單位,直到所有的樣品或變量都聚集完畢,把不同的類型一一劃分出來,形成一個親疏關系譜系圖,用以更直觀地顯示分類對象(樣品或變量)的差異和聯系。
1 數據收集
根據信息基礎設施的發展情況,對世界20個國家和地區進行聚類分析。
2 聚類分析
利用SPSS18.0軟件對表1中的數據進行聚類分析,具體操作為:
(1)Analyze-Classify-Hierarchical Cluster Analysis,將所有的變量選入到Variables中,將國家選入Label Cases by。(2)在Statistics選項中,勾選Range of Solutions,在Mininum number of clusters中輸入3,在Maxinum number of clusters中輸入8。(3)在Plot選項中,勾選Dendrogram(4)在Method選項中。將Cluster Method選擇Wards Methods,Transform Values:選擇Standardize:Z Scores(5)在Save選項中,Cluster Membership: Range of solutions:3-8
聚類分析產生的最重要的結果就樹狀圖。如圖1-1所示。通過樹狀圖可以非常直觀地看出整個聚類過程和結果。
3 結論
按照上面的樹狀圖,世界20個國家信息基礎設施的發展情況可以大體分為3類,具體分類如下:
[參考文獻]
[1](美)約翰遜(Johnson,R.A.).實用多元統計分析.清華大學出版社,2008.
[2]薛毅.統計建模與R軟件.清華大學出版社.
作者簡介:王芳(1981-),女,漢族,陜西西安人,助教,2010年畢業于西安工程大學供熱、供燃氣、通風機空調工程專業,碩士研究生學歷,陜西國防工業職業技術學院在職教師,現從事暖通空調教學研究工作。