王鑫
摘 要:不管從理論還是實踐角度來看,正態分布都是統計學中的重要方式之一。在實際的工作生活中,多種隨機變量情況都能服從正態分布或者近似正態分布,如降雨量、儀器中的誤差測量、金融指標等。正態分布既是一種極限分布,又包含了概率密度和分布函數的多種優勢,所以正態分布模型是工作學習中不可缺少的數據分析模型。本文首先對正態分布所具備的特點進行介紹,再將其與極限定理的關系和應用進行分析,最后詳細闡述了正態分布在醫學生化指標、部分住院指標和醫學教育等方面的應用情況。
關鍵詞:正態分布;極限定理;醫學
一、正態分布的有關知識
1.正態分布的特點
正態分布的早期發現者是棣莫弗,他在求解二項分布時發現了該規律。而后高斯在進行誤差測量時,再次導出了該公式,同時對正態分布的性質進行了研究,所以又稱之為高斯分布[1]。正態分布在數學、物理等領域的應用非常廣泛,在統計學中有著不可或缺的影響力。
2.正態分布的圖形特點
正態分布曲線呈鐘形,圖形兩端低,中間高,且左右對稱分布,所以又稱之為鐘形曲線,如圖1所示。正態分布由兩個重要的參數構成,即均數μ和標準差σ[2]。μ值決定了圖形靠左或靠右,即決定了圖形的分布位置;σ決定了圖形陡峭或平穩,即決定了圖形的形狀。當σ為常數時,μ越大,曲線越向橫軸的右方向移動,反之μ越小,則曲線越往橫軸的左方向移動。標準差主要描述正態分布的曲線形狀,當μ為常數時,σ越大,正態分布曲線越平穩;σ越小,曲線越陡峭。當μ=0,σ=1時為標準正態分布。
二、正態分布與中心極限定理
1.中心極限定理
在統計學中,中心極限定理有著重要的意義。當樣本容量足夠大時,隨機變量近似服從標準正態分布。中心極限定理是處理大樣本數據的重要工具[3]。
2.正態分布與中心極限定理的應用
正態分布與中心極限定理的應用體現在多個方面,本文主要以下述兩個方面做出具體說明:
(1)計算累積概率,可得出正態分布面積
假設2018年某醫院新聘用護士的平均身高μ=163cm,標準差為σ=20cm,請問隨機抽取16個護士樣本身高均數超過168cm的概率是多少?
解:設X作為樣本均值,則樣本均值的期望即標準差=總體的標準差=
所求概率P{X>168}則P{}=P{Z>1}=0.16
所以,樣本平均身高超過168cm的概率為16%。
(2)運用于證明某理論或假說
在醫學科研中,存在著很多的理論和假說需要證明,我們可以通過正態分布模型來對其進行推論。如在進行醫學研究時,往往需要從總體數據中隨機抽取出一些樣本進行研究。隨著樣本量的增加,樣本的均數和標準差也會更接近數據總體的μ和σ,樣本的平均數和正態分布面積也會逐漸趨于穩定。如果總體數據已呈現正態分布,那么隨機抽取的大樣本(n>100)也會呈現正態分布,服從正態分布的規律,同時通過對均值μ進行替換,做出假設檢驗,以確定總體與樣本存在的差異,找到分布規律,進而進行判斷,從而對某些理論、假說進行驗證[4]。
三、正態分布與醫學的聯系
醫學領域包羅萬象,本文在研究正態分布與醫學的聯系時,主要選用了生化指標、部分住院指標和醫學教育等三個領域進行闡述。
1.正態分布與生化指標的關系
一些醫學上的指標,如紅細胞數量、血紅蛋白含量、以及人體內的微量元素、抗體產生及分布規律等,都呈現正態或者近似正態分布曲線的情況。而有些指標雖然是以偏態分布為主,但是經過數據轉換與處理后,所形成的新指標仍為正態或近似正態分布曲線,可以利用正態分布公式進行考量。例如對數正態分布,其從原理上看是一種非正態的連續分布圖形,其概率密度函數可用如下公式進行描述:
人體中的不少微量元素正常含量、抗體分布、疾病恢復時間和食物中毒潛伏期的分布曲線等都與上文描述的對數正態分布相類似[5]。為了讓這些生化指標更容易被讀懂看懂,通常會將各變量轉為對數,對數值的分布通常會變成近似的正態分布曲線。
2.正態分布與部分住院指標的關系
評價一個醫院效率、效益等綜合指標可通過病人住院時間、住院費用和日均費用等體現,這些指標可以充分體現出醫院在醫療、技術和管理等多方面的有效性和先進性水平。這些指標的計算對于醫院管理和機關單位評估等都有著重要的意義。
選擇濟南市某三甲醫院2018年9月全部出院患者資料,將每位患者的住院時間、總費用和日均費用等作為調查對象,通過對這三個指標的所有數據進行均值處理,得出三個指標的偏度值和峰度值均略大于0,圖形呈現較偏右狀態。而正態分布曲線正是呈現左右對稱、峰值居中。初步表明這三個指標具有正態輪廓,但有所偏差。再采用散點圖進行測試,結果發現點與線只存在小幅偏差,再次驗證該指標具有正態分布規律。由此可見,簡單的均值無法準確衡量部分指標的正態分布概率,也無法得出合理的評估結果。所以,在研究正態分布與部分住院指標的關系時,可引入中位數,將原始數據進行中位數處理后,再進行正態檢驗,就能比較容易得到近似的正態曲線[6],進而進行合理的數據分析。
3.正態分布與醫學教育的關系
在醫學教育中,學生的考試成績分布一直是教育界學者研究的重點。醫學知識博大精深,需要有容納百川的學習能力才能將各科知識融會貫通,而醫學教育工作者也認為,如若一屆醫學生的成績分布呈現“中間高,兩頭低”的正態曲線狀態,說明該屆醫學生綜合能力較強,可塑性很強。
本文選擇了某醫科大學49門課程的考試成績進行研究,發現分數分布主要有四種類型,具體如表1所示:
如表1所示,各科成績呈現不同的概率分布類型。如若對各科教學效果做出科學評定,呈現近似正態分布的13門課教學效果最好,其他學科應當效仿。利用該信息,教學老師可以在教學方法和學生復習方法等方面多做研究,將另外三中呈現不均衡分布的科目成績、教學成果等轉化為正態分布模式,讓更多的學生學到有用的知識,造福病人和全社會。由此可以看出,正態分布模型能間接為醫學教育改善提供方向。
結論:綜上所述,正態分布模型在統計學上具有重要的意義,在醫學領域的應用也相當廣泛,尤其在生化指標分析上,可以通過正態轉換,將指標變得簡單易懂好分析;在醫院指標評估上,通過引入中位數,可以將各指標與正態分布更好的結合,從而得出更精確的質量評估;以及在醫學教育上,正態分布模型可以為教學效果研究提供合理的改善方向。
參考文獻
[1]肖庭英.正態分布在醫學研究中的應用[J].贛南醫專學報,1987(01):62-65+59.
[2]施濟民.正態得分檢驗在醫學上的應用[J].中國衛生統計,1988(01):24-25.
[3]祝俠麗,侯琳,賈永艷.正態分布在本科生藥劑學成績分析中的應用[J].科技創新導報,2013(34):197.
[4]馮一鳴.正態分布在教育上的應用[J].川北教育學院學報,1996(02):5-8.
[5]馮忠蕙.變異與正態分布的應用[J].中華兒童保健雜志,1997(02):139-141.
[6]雷鳴.正態性檢驗的直線相關分析法在醫學統計中的應用[J].北華大學學報(自然科學版),2010,11(01):61-62.