褚啟龍,哈建利
(湖北職業技術學院醫學院,湖北 孝感 432000)
Excel在直線相關分析中的應用
褚啟龍,哈建利
(湖北職業技術學院醫學院,湖北 孝感 432000)
在醫療衛生和科研工作中,經常需要觀察2組變量之間是否存在線性相關關系。利用Excel軟件進行直線相關分析,結果準確且方便快捷,可提高非統計專業人員工作效率。
Excel;直線相關;應用
在醫療衛生和科研工作中,經常需要觀察2組變量之間是否存在線性相關關系,即對資料進行直線相關分析。傳統分析方法是使用計算器,先按公式逐步計算,求出相關系數r值,然后再按照相應公式計算統計量t值,并查t界值表確定P值,最后得出結論。由于直線相關分析中的計算公式多而復雜、步驟繁多,因而計算量大且易混淆,對一般醫務工作者來說有一定難度,需耗費大量時間。如今,利用計算機完成統計分析工作已成為人們的首選。目前,雖有SAS、SPSS等專業統計軟件可供選用,但這些軟件操作較復雜,且價格昂貴。Excel是Office家族的成員之一,幾乎每臺計算機上都有安裝,眾多醫藥衛生和科研工作者常用以記錄和整理實驗數據,但許多人并不知道Excel還可提供一些經典統計分析方法。筆者根據多年應用Excel軟件的經驗,談談如何利用Excel進行直線相關分析,以期提高工作效率。
(1)使用“分析工具”前,應檢查“工具”菜單,確定Excel當前是否安裝了“分析工具”。如果在“工具”菜單中沒有“數據分析”命令項,則需通過調用加載宏安裝“分析工具庫”[1]。
(2)單擊“工具”菜單,在其下拉菜單中選中并單擊“加載宏”,彈出“加載宏”對話框,見圖1。
(3)在對話框的“當前加載宏”列表框中選中“分析工具庫”,并在左側復選框中打“√”,然后單擊“確定”按鈕,關閉對話框。至此,已安裝“分析工具庫”。

圖1 當前加載宏對話框
(1)打開Excel工作表,輸入分析數據。例如:某醫生分別用皮膚氧測定儀和血氧分析儀測定10名健康成年男子的動脈氧分壓(mmHg),皮膚氧測定儀測定結果(X)分別為:77、78、79、80、81、82、83、84、76、79;血氧分析儀測定結果(Y)分別為:87、90、89、90、91、89、91、92、86、88。現問 2 種測定結果是否存在直線相關關系?如何解決這一問題呢?首先應輸入數據。X用A列表示,分別輸入A2~11的區域;Y用B列表示,分別輸入B2~11的區域,見圖2。
(2)先求出相關系數r值。在“工具”菜單選項卡中單擊“數據分析”,彈出“數據分析”窗口,在“分析工具”中選擇“相關系數”;然后單擊“確定”按鈕,出現“相關系數”窗口,見圖3。將光標移至“輸入區域(I)”,選定 A2~B11間的數據,點擊“確定”按鈕,出現相關系數值,見圖4,本例r=0.843 621 558。

圖2 數據輸入截圖

圖3 相關系數窗口
對于同一樣本來說,相關系數r和回歸系數b的假設檢驗是等價的,2者t值相等[2],也就意味著同樣2組數據無論是用r還是b進行假設檢驗,其結論是完全一致的。由于Excel沒有提供對r進行假設檢驗的功能,但可對b進行假設檢驗,故可用回歸系數b的假設檢驗代替相關系數r的假設檢驗,具體操作如下。

圖4 相關系數值截圖
(1)先在“工具”菜單選項卡中單擊“數據分析”,彈出“數據分析”窗口,在“分析工具”中選擇“回歸”;然后單擊“確定”按鈕,出現“回歸”窗口,見圖5。
(2)首先,將光標移至“Y值輸入區域”,選定B2~11間的數據;其次,將光標移至“X值輸入區域”,選定A2~11間的數據;最后,在“置信度”左側復選框中打“√”,單擊“確定”按鈕,出現分析結果,見圖6。

圖5 回歸分析窗口

圖6 分析結果截圖
(3)結果分析。圖6所示數據中主要看方差分析結果,其中“Significance F”表示 P 值。一般來說,若 P<0.05,表明有統計學意義,即總體相關系數ρ≠0;反之,則表明無統計學意義,總體相關系數 ρ=0。本例 P=0.002 156 606,即 P<0.01,表明 2 組數據之間存在直線相關關系,其相關系數r=0.843 621 558。
本文通過具體實例,詳細說明了利用Excel對2組數據進行直線相關分析的方法,多次重復計算結果完全相同。同時,筆者也用SPSS軟件對上述數據進行驗證性分析,與Excel分析結果完全一致,充分說明這種分析方法穩定、可靠且結果準確。其分析結果直接給出精確的P值,無需使用者查t界值表確定P值范圍,僅需使用者對統計學基本概念和基本方法有所了解即可。這種方法方便快捷,可節約大量寶貴時間。同時也提示在醫學統計學教學過程中,應把如何分析統計結果作為教學重點,既降低了這門課的難度,提高了學生學習興趣,又注重了其實際應用效果。另外,Excel還可與Word、PowerPoint和SPSS等軟件進行數據交換[3],使之充分發揮作用。本方法操作簡便,計算快速、準確且穩定可靠,值得大力推廣。
[1]劉鋼.Excel在統計分析中的應用[M].北京:人民衛生出版社,2002.
[2]楊樹勤.衛生統計學[M].第2版.北京:人民衛生出版社,1990.
[3]陳雄新,曾建一,蔡岳華.Excel在四格表χ2檢驗中的應用技巧[J].現代預防醫學,2006,33(10):1867~1870.
TP317.3
B
1671-1246(2011)17-0047-03
Vol.29 2011 No.17