滕文惠 葛紫穎 康亞茹
[摘 要]SPSS是世界上最早采用圖形菜單驅動界面的統計軟件,它集數據錄入、整理、分析功能于一身。本文以學生成績數據為例,介紹了SPSS制作4種箱圖的方法和技巧,為教育和科研工作者提供一些參考。
[關鍵詞]SPSS;箱圖;數據描述
doi:10.3969/j.issn.1673 - 0194.2018.14.101
[中圖分類號]G40-03 [文獻標識碼]A [文章編號]1673-0194(2018)14-0-02
隨著云計算等技術的快速發展和互聯網、物聯網的廣泛應用,人類迎來了大數據時代,而要管理和利用這些數據,就需要專門的技術與工具。常見的統計分析軟件有SAS、SPSS、Minitab和Excel等。這些統計軟件的功能和作用大同小異,各自有所側重。其中的SAS和SPSS是目前在大型企業、各類院校以及科研機構中較為流行的兩種統計軟件。特別是SPSS,其界面友好、功能強大、易學、易用,包含了幾乎全部尖端的統計分析方法,具備完善的數據定義、操作管理和開放的數據接口以及靈活、美觀的統計圖表制作。
1 SPSS軟件介紹
SPSS為IBM公司推出的一系列用于統計學分析運算、數據挖掘、預測分析和決策支持任務的軟件產品及相關服務的總稱。統計圖可以對數據的特征進行分析和描述,在探索的基礎上對數據進行更為復雜的建模分析。利用SPSS軟件可以繪制各種統計圖,主要包括條形圖、線性圖、面積圖等,不同圖形可能有著不同的數據要求和適用環境,使用時一定要考慮每種統計圖的功能和特點。
SPSS中直接繪制統計圖形的功能通過圖形菜單實現,下設的子菜單有:圖形構建程序、圖形畫板模板選擇程序和舊對話框,本文主要介紹了舊對話框作圖的方法。
2 箱圖在學生成績描述中的應用
統計圖的使用,首先要滿足的是“準確”?!皽蚀_”就是指使用恰當的統計圖去描述數據。通常在描述定性數據時主要使用的有柱狀圖、條形圖、餅圖和環形圖,反映的是定性變量的各個水平的頻數分布或者占比;描述定量數據時主要使用的是散點圖和箱圖,反映的是數據的分布情況,包括對稱性、是否有離群點等;對于時間序列數據則常使用折線圖,反映指標隨時間的變化趨勢。同時,寫好描述性文字,畫完圖要有適當的評述。撰寫描述性文字可以分為兩個層次:第一個層次叫作客觀陳述,即描述統計圖中的內容;第二個層次叫作合理推斷,即解讀統計圖背后的原因,猜測數據為什么呈現出某種規律。本文以箱圖為例,說明SPSS統計圖在數據描述中的應用。
2.1 箱圖的介紹
箱圖是描述定量數據最常用的統計圖之一,主要用來描述一個定性變量和一個定量變量的關系,用于對比不同組別在某一定量變量上的平均水平、波動水平等的差異。在箱圖中,最上方和最下方的線段分別表示數據的最大值和最小值,其中箱圖的上方和下方的線段分別表示第三四分位數和第一四分位數,箱圖中間的粗線段表示數據的中位數。另外,箱圖中在最上方和最下方的星號和圓圈分別表示樣本數據中的極端值。
打開圖形菜單,選擇舊對話框命令下的箱圖命令,SPSS將彈出“箱圖”導航對話框。如圖1所示。
在“箱圖”導航對話框中,可以選擇箱圖的類型,并定義箱圖中數據的表達方式。SPSS將箱圖大致分為以下兩種類型:
①簡單,一個圖形中有多個箱,各個箱相互獨立;②復式條形圖,一個圖形中有多個箱,多個箱之間按照分組變量分成若干組,相同組別的箱集中放置,以方便用戶進行比較。
“圖表中的數據為(Data in Chart are)”欄,可以選擇如下的數據表達類型。
①個案組摘要。用分類值作圖,箱圖中每一條線代表觀測量的一個分類。②各個變量的摘要。用變量值作圖,箱圖中每一條線代表一個變量。通過以上兩個箱圖類型和兩個數據表達方式的不同搭配,SPSS可以生成4種不同的箱圖。
2.2 4種箱圖的具體應用
2.2.1 以個案組摘要為數據表達類型的簡單箱圖
在圖1中選擇箱圖類型為“簡單”,數據表達類型為“個案組摘要”,單擊定義。打開“定義簡單箱圖:個案組摘要設置對話框”,在該對話框中將數學選入“變量”框中,班級選入“類別軸”框中,然后單擊確定,即可在結果輸出窗口中得到各班級數學成績箱圖,如圖2所示。
通過圖2可以看出三班數學成績平均水平較低且有離群點,一班和二班相差較小,一班兩極分化較為嚴重。
2.2.2 以各個變量的摘要為數據表達類型的簡單箱圖
在圖1中選擇箱圖類型為“簡單”,數據表達類型為“各個變量的摘要”,單擊定義。打開“定義簡單箱圖:各個變量的摘要”設置對話框,在該對話框中將各科成績均選入“框的表征”列表框中,然后單擊確定,即可在結果輸出窗口中得到各科成績箱圖,如圖3所示。
通過圖3可以看出,英語和歷史成績平均分較高,且歷史成績較集中,物理成績較差且分散。
2.2.3 以個案組摘要為數據表達類型的復式條形圖
在圖1中選擇箱圖類型為“復式條形圖”,數據表達類型為“個案組摘要”,單擊定義。打開“定義復式箱圖:個案組摘要”設置對話框,在該對話框將物理選入“變量”框中,班級選入“類別軸”,性別選入“X軸上的聚類”,然后單擊確定,即可在結果輸出窗口中得到各班級男女生物理成績箱圖,如圖4所示。
通過圖4可以看出,三班男生物理成績高于其他班男生,二班女生物理成績高于其他班女生。相比較而言一班物理成績較分散,兩極分化嚴重。
2.2.4 以各個變量的摘要為數據表達類型的復式條形圖
在圖1中選擇箱圖類型為“復式條形圖”,數據表達類型為“各個變量的摘要”,單擊定義。打開“定義復式箱圖:各個變量的摘要”設置對話框,在該對話框將數學、語文、英語選入“框的表征”列表框中,“性別”選入類別軸,然后單擊確定,即可在結果輸出窗口中得到男女生語數英成績箱圖,如圖5所示。
通過圖5可以看出,男生數學和英語成績均高于女生,而女生語文成績要高于男生。
3 結 語
數據描述是對數據最基本的處理方式,難度也不大,但是在完整的分析中又不可或缺。SPSS在數據分析和作圖方面都是很好的軟件,本文主要介紹了箱圖作圖方法和技巧,其他類型圖的作圖方法類似。圖形的制作和數據分析都需要在實際應用中反復摸索,不斷總結,才能熟能生巧。
主要參考文獻
[1]武松,潘發明.SPSS統計分析大全[M].北京:清華大學出版社,2014.
[2]姜忠尉.統計分析軟件SPSS的特點和應用分析[J].中國證券期貨,2012(4).