張霖琳 李繼華 汪亞杰 吳國平 魏復盛
我國云南省東北部的曲靖是全世界肺癌高發地區之一,當地居民以煙煤為燃料,用不通風的爐灶做飯、取暖,煙氣無法直排到室外,造成室內空氣的嚴重污染[1]。研究[2]表明長期暴露在燃煤煙氣中是導致兩地居民肺癌持續高發的主要原因,但是近年來隨著改爐改灶的進行和社會主義新農村建設,當地環境污染有了明顯的改善,但是肺癌發病率和死亡率仍然居高不下[3]。2007年在云南省衛生廳的組織下,曲靖地區開展了5萬人的大規模肺癌流行病學調查。本研究僅對此次調查過程中環境狀況與肺癌發病的部分內容展開討論,旨在為當地肺癌高發的病因學研究提供科學依據和數據支持。
1.1 調查對象和內容 通過收集歷史資料,了解云南曲靖市宣威、富源等地的環境背景情況,包括大氣、土壤、水等。采用流行病學問卷調查的方式,掌握當地自然村使用燃料的種類、附近有無煉焦廠、鐵鋅廠、化工廠等情況,自然村環境污染狀況的調查問卷設計見附表。
1.2 抽樣方法 樣本量估算:由于腫瘤發生屬于低概率事件,腫瘤的分布呈Poisson分布,樣本量估計依據Poisson分布期望值可信限表[4]和滇東(產)燃煤區肺癌發病率的估計值(50/10萬)推算,總樣本量約50,000人。
鄉級樣本:根據肺癌歷史發病、死亡情況把曲靖市轄區內產(燃)煤鄉鎮分為肺癌高發區、次高發區、中發區和低發區。發病率或死亡率≥80/10萬為高發區,次高發區50/1萬-79/10萬,中發區20/10萬-49/10萬,低發區<20/10萬。無發病率或死亡率資料的鄉鎮以2003年-2006年當地縣、市級主要醫院新診斷的肺癌病例數為依據劃分:高發區≥90例、次高發區60例-89例、中等發病區30例-59例和低發區<30例。按比例(2:1)通過電腦軟件隨機抽取18個鄉級樣本。村級樣本:從每個鄉級樣本隨機1個-2個行政村,共抽取28個行政村。調查點:每個村級樣本隨機抽取居住人口比較集中的6個-8個自然村作為整群抽樣調查點,以滿足2,500人-3,000人的鄉級樣本量要求,共計280個調查點。
1.3 數據分析 用Access建立數據庫,將問卷中的信息錄入到編好的程序中,把所有匯總后的數據導入到SPSS 18.0軟件中進行統計分析,利用Logistic回歸方法分析變量之間的關系并進行預測。
1.4 質量保證和質量控制 本次流行病學調查規模較大,采用了系統、嚴格的質量控制和保證措施來確保數據的準確性和可靠性,具體做法如下:①組織保障:成立市級流調領導小組、領導小組辦公室、技術指導組(省、市級)、現場流調督導組、臨床督導組,各縣成立相應的協調小組;②業務培訓:由技術指導組制定實施計劃以及詳細的實施細則,對參加調查的流調人員和臨床診斷人員進行技術培訓;③現場調查:流調表由市疾病預防控制中心統一印制,市、縣督導組于流調開展初期和進展中進行定期、不定期現場督導,及時更正發現的錯誤。流調現場發現問題及時上報市流調技術指導小組。調查表完成后,由各組審核員完成當天調查表的審核,發現問題或缺項的,及時糾正或補充。審核完成后,審核人員簽名確認。經過流調技術指導小組檢查驗收合格后,采用雙錄入法進行錄入,確保數據錄入的準確性。
2.1 區域劃分和調查對象 根據肺癌篩查的陽性率將宣威和富源分為A、B、C、D四個地區,調整分層區域的結果見表1。A為高發區,包括宣威市來賓和西寧;B為次高發區,包括富源縣后所、大河、墨紅以及麒麟區東山;C為中發區,包括宣威市倘塘、龍潭、格宜、龍場、羊場、田壩以及富源縣中安、竹園、營上;D為低發區、麒麟區茨營、羅平縣阿崗、師宗縣雄壁。
2.2 調查問卷統計結果 2007年調查曲靖市宣威、富源產煤市、縣、區,調查點分布與曲靖市煤炭資源地理分布一致,行政村樣本地理分布無明顯偏倚,共走訪19個鄉鎮28個行政村280個自然村,每個自然村填寫一份環境狀況調查表,總計收集到280份調查問卷,根據低發區主要產無煙煤或者不產煤,燃料使用無煙煤或者木柴,而其它地區均產煙煤,使用煙煤或者焦煤,因此分成高、低兩組,其中高發區、次高發區和中發區共計228份,低發區52份,問卷內容統計的詳細結果見表2。
根據表2中匯總的數據統計得出,高發區78.1%的自然村使用煙煤和焦煤,43.4%自然村附近有焦化廠,31.1%附近有鐵鋅廠,11.8%附近有化工廠;低發區78.8%的自然村使用無煙煤和不產煤,26.9%自然村附近有焦化廠,23.1%附近有鐵鋅廠,5.8%附近有化工廠。煉焦廠和鐵鋅廠的使用年限和產量在高、低發區差異不大,但高發區附近的化工廠較為集中,比低發區的使用年限長且產量較高。高發區的工廠在上風向的較多,對自然村的污染較工廠在下風向的嚴重。
2.3 調查問卷二項Logistic回歸 由于本表設計被解釋變量為二值變量即高發區或低發區,因此建立二項Logistic回歸模型探討各個解釋變量如燃煤種類和各種工廠的興建對不同區域的影響。采用極大似然估計法對回歸方程進行檢驗。調查問卷中的各個啞變量的確定及其賦值情況詳見表3,燃料類型以木柴為參照類,附近無工廠作為另三項的參照類,其它定距變量均用原始調查表中該項數值直接代入方程。

表1 調整分層區域肺癌篩查陽性率(1/10萬)Tab 1 Positive rate of lung cancer screening in adjusted investigating area (per 100,000)
使用統計軟件對表中數據進行分析時,采用向前逐步篩選策略,表3中的變量如煉焦、金屬冶煉和化工廠均沒有進入方程,只有燃料類型進入到最終的篩選結果中(表4)。以使用木柴為參照,煙煤和焦煤的回歸系數β值為正值,提示煙煤和焦煤的使用與肺癌高發具有正關聯作用,Exp(β)>1,且Wald觀測值所對應的概率P均<0.05,說明煙煤和焦煤較不產煤對于Logit P平均增長2.162和1.855個單位,結合Exp(β)值可知使用煙煤和焦煤在高發區的發生比是木柴的8.689倍和6.389倍。無煙煤的回歸系數β值為-1.952,提示木柴、無煙煤與肺癌高發具有負關聯作用,Wald觀測值所對應的概率P<0.05,且Exp(β)<1,說明無煙煤在高發區的發生可能性與煙煤和焦煤相反。二項Logistic回歸分析的結果表明,當地居民使用燃料類型是影響肺癌高發的重要因素,其中煙煤和焦煤對當地肺癌高發的有促進作用,而無煙煤或者木柴作用不大或有抑制作用。
本次流行病調查調查抽樣框架合理,調查點嚴格按設計要求抽取,調查點分布基本與曲靖地區煤炭資源分布一致,調查區域體現了肺癌高、低發區的特點,保證了設計、抽樣的科學性和樣本的代表性。在流行病學調查的全過程,均采取嚴格的質量保證和質量控制措施來確保數據的準確性和可靠性。自然村環境污染狀況的調查問卷的統計分析結果表明,使用的燃料類型是當地肺癌高、低發區形成的關鍵因素,其中煙煤和焦煤對當地成為肺癌高發區的影響較大,而無煙煤的作用則與之相反。金屬冶煉、化工生產、大規模煉焦等企業在高發區要高于低發區,雖然對環境有一定影響,但大多數生產時間較短,且就目前情況來說對當地肺癌的影響尚不明顯。
附表見http://www.lungca.org/files/survey0308.pdf

表2 自然村環境狀況調查統計結果Tab 2 Statistics of environmental survey of sampling villages

表3 編碼類目型變量表Tab 3 Variable table of coding method

表4 環境狀況調查問卷的二項Logistic回歸分析(逐步篩選策略)Tab 4 Binary logistic regression analysis of environmental survey by means of stepwise strategy