翁雪
[摘要]流行病生態學研究是生態學與流行病學的有效融合,旨在從環境變化與生態變化的層面探索疾病的發生在地域、時間與人群上的分布規律,從而通過生態學指標參數盡早預測相關疾病發生的可能性,以更加科學的依據積極主動地預防疾病的流行。本文對流行病生態學研究的統計分析方法進行闡述并分析,以供參考。
[關鍵詞]流行病學;生態學;研究;統計分析方法
數千年來,人類一直面臨著疾病為何出現和如何防治等重大問題。在缺乏生物學實驗技術的年代,上述問題的解答僅能通過基于多個對象的觀察所獲得的經驗性結論。此為流行病學研究方法的雛形,此種方法下,生物現象的或然性問題不能得到有效的解決,兩個事物之間的復雜因果關聯與伴隨現象即很難辨別,因而很容易出現錯誤的判斷。在流行病生態學研究的發展過程中,廣義因果律(概率論下的因果觀)的出現、邏輯學理論的完善、數理統計學的發展以及辯證唯物主義科學技術方法論的形成,為流行病生態學研究方法的形成提供了廣泛的理論基礎。在此背景下,一套探討疾病發生的因果關系、了解疾病的分布規律的研究方法逐漸出現,使得以人群為基礎的流行病生態學研究結果更具科學性與說服力。以下筆者就流行病生態學的概念與流行病生態學研究的統計分析方法進行探討。
一、流行病生態學概述
流行病生態學研究是一種描述性的研究,以群體為觀察、分析的基本單位,進而在群體水平上研究與疾病發生有關的因素,以及該因素與疾病之間的關系。一般而言,暴露因素與疾病之間的關系能夠通過描述不同人群該因素的暴露情況與疾病情況進行分析。在流行病生態學研究過程中,結合常規資料與數據庫等信息,可以在較短的時間內獲得分析結果,進而節省人力、物力與時間。20世紀中期,為了適應多病因論的需求,流行病研究方法有了突飛猛進的發展。如今,流行病學的群體研究方法在醫學的各個領域得到了較為廣泛的應用,并成為醫學相關學科不可或缺的研究方法。
在流行病生態學研究中,生態學研究能夠為病因未明的疾病提供重要的病因線索,進而對該疾病進行深入的研究,此為生態學研究的顯著優點。針對待研究暴露因素在某一人群中變異程度較小的情況,疾病與待研究暴露因素之間的關系的測量存在較大的難度,此時采用多個人群比較的生態學研究方式則能夠取得較為有效的研究結果。因此,在疾病監測工作中,借助生態學研究方法,能夠較好的評估疾病的發展趨勢,從而為預防、控制策略的制定提供重要的依據。但流行病生態學研究也存在一定的缺陷,即生態學謬誤。生態學謬誤是因研究群體由各個情況不同的個體集合而成,加之其中存在的混雜因素,而導致的研究結果與真實情況之間的差異。
二、流行病生態學研究的發展
在當代流行病生態學研究中,自然環境與人類社會之間的關系被納入研究的范疇,以社會一經濟一自然的復合生態系統觀點研究流行病學面臨的問題。因此,生態學研究越加注重個體與群體的結合,以及社會發展與生活實際需求的結合。在生態學研究中,以群體為研究與觀察的單位,對兩個變量進行相關性分析或回歸分析,其疾病測量的準確性或暴露水平相對較低,且其間的時序關系很難確定,因而研究的結果并不能直接作為因果關系的有力證據。
就流行病生態學研究手段與研究設施來看,除了一些可準確獲取信息的手段與技術在流行病生態研究中得到有效應用外,部分數學模型與模擬方法也在大尺度、多因素的研究中得到了重視。基于信息技術與網絡技術的應用,流行病生態學的研究對象與研究任務也發生了一些變化。在傳統的生態學研究中,多是在一個相對孤立的局部地區的研究的基礎之上逐步擴大,而繼SARS之后,我國的疾病控制信息系統已在全國范圍內建立,這對流行病生態學研究具有實質性意義。
三、流行病生態學研究的統計分析方法
在流行病生態學研究中,為保證研究結果的準確性,一般數據總量是巨大的,與之對應的數據分析處理方法也相對較多。就統計分析方法的分類來看,大致可分為傳統統計方法與空間統計分析方法。以下分別進行探討。
(一)傳統統計分析方法
傳統分析方法建立在大樣本容量與樣本獨立兩項基本假設之上,根據待分析危險因素的數量可細分為單因素分析與多因素分析兩類。生態學研究的觀察與分析單位是由不同情況的個體組成的群體,如縣區等。在群體層面監測或者收集與流行疾病發病、危險因素、傷殘、死亡等信息,常見的危險因素如氣象指標、空氣污染指標、群體經濟水平、其他基礎疾病等,在此基礎上構建危險因素與疾病發病之間的關聯。
在單因素分析中,常見的統計分析方法有相關分析、t檢驗、F檢驗與Mann-Whitney檢驗等。相關分析是對總體中確定存在聯系的標志進行分析的過程,以描述客觀事物之間的關系,同時選用適當的統計指標進行展示。在統計分析過程中,為了明確兩個變量之間的關系,需要收集成對的數據,而后通過散點圖等方式進行呈現,以便分析二者之間的關系。在流行病生態學研究中,相關分析旨在分析單個危險因素與疾病發生之間的關系,即獨立危險因素。t檢驗又稱studentt檢驗,主要用于小樣本、總體標準差盯未知的正太分布分析,借助t分布理論推導差異發生的概率,從而比較兩個平均數之間是否具有顯著性差異。t檢驗是流行病生態學研究中較為常用的一種統計分析方法,能夠有效構建疾病發生與危險因素之間的關系。F檢驗又稱方差比率檢驗、聯合假設檢驗、方差齊性檢驗,是一種基于零假設之下統計值服從F-分布的檢驗方法。F檢驗對數據的正態性具有較高的敏感性,常用于分析模型中部分參數或全體是否適合母體的估計,也可用于三組或者多組數據之間的均值比較,但當顯著性水平較低時,數據的穩健性將出現大幅降低。Mann-Whitney檢驗又稱曼-惠特尼u檢驗,旨在檢驗兩個總體的均值之間是否存在顯著性差異。此種檢驗方法基于兩個樣本分別來自除了總體均值以外完全相同的兩個總體這一假設,明確地考慮了每一個樣本中各測定值所排的秩,所使用的信息相對較多。
在多因素分析中,常見的統計分析方法有對應分析、回歸分析、主成分分析、聚類分析等。對應分析主要用于分析二維數據矩陣中行、列因素之間的關系,又稱相應分析,其基本原理為通過二維數據矩陣的對應變換,分析矩陣的行因素與列因素之間的關系。對應分析是近年發展起來的一種新的多元相依變量統計分析方法,基于定性變量構成的交互匯總表,揭示變量之間的聯系。在流行病生態學研究中,采用對應分析,可借由視覺化的表示方式,將多組看不出任何聯系的暴露因素進行展現。回歸分析旨在處理與分析多個變量之間的線性依存關系,在流行病生態學研究中,多為多重線性回歸模型,即多個自變量對1個因變量的變化關系的研究。聚類分析又稱點群分析,是一種多元統計分析方法。在聚類分析中,通過相應的類別劃分方法(性質相近的歸為一類)進行“聚類”,并對各類事物進行直接比較。聚類分析的原則為不同類中的個體差異相對較大,借助相應的聚類方法(模糊聚類、系統聚類、最優分割法、動態聚類),實現待研究變量之間的相異性研究。主成分分析是借助多變量之間的線性變換選出其中的重要變量,以實現變量壓縮的一種統計分析方法。在流行病生態學研究中,為了滿足全面分析相關危險因素與疾病發生之間的關系的要求,常常需要提出較多的危險因素。但就實際的研究過程來看,過多的變量將會急劇增加問題分析的難度與復雜度。此外,兩個變量在解釋同一問題時可能存在重疊部分,提示變量存在壓縮的可能性。基于此,主成分分析的統計分析方法得到重視并逐漸用于流行病生態學分析。
(二)空間統計分析方法
針對空間數據,多數空間數據樣本并不獨立,使得傳統的統計分析方法的兩項基本假設難以滿足。針對流行病生態學研究,各種空間統計分析方法的應用,為流行病影響因素的探索、空間聚集性的分析以及防治控制策略的制定提供了重要工具。
空間統計分析又稱地理統計分析,以區域化變量理論為基礎,研究分布于空間中呈現出一定的隨機性、結構性的自然現象。常見的空間統計分析方法包括空間自相關分析、空間分類分析、多變量統計分析、空間模擬等。空間自相關分析建立在現象或食物具有對空間位置的依賴關系的理論之上,其計算方法可細分為全局性與局部性。全局空間自相關分析常用于整個研究區域下空間對象某一屬性取值的空間分布狀態的描述,從而判斷其在空間上的聚集性。全局性計算方法忽略了空間異質性,以此為基礎,局部空間自相關分析方法出現。空間插值分析是通過一組分區數據或離散數據推求未知區域的數據的分析過程,主要包括變換函數插值、邊界內插值、樣條函數插值、距離倒數插值等方法。流行病學標點地圖法是一種較為常用的流行病生態學研究方法,可細分為以密度為基礎、以距離為基礎與以疾病分布熱點為基礎的流行病學標點地圖的空間推斷方法。
四、結語
在流行病學研究中,傳統統計分析方法的應用較為成熟,空間統計分析方法仍存在較大的進步空間。因此,在實踐應用中,應當加強空間統計分析方法的應用分析,從而為流行病學的理論研究提供重要的支持。