于 蓉,席 新,王 華,李 波
癌癥是全球發(fā)病和死亡的主要原因,2016年全球約有1 720萬新發(fā)癌癥病例和890萬死亡病例,2006年至2016年新增癌癥病例增加了28%,增幅最大的是最不發(fā)達國家[1]。21世紀以來,隨著我國經濟的高速發(fā)展和城鎮(zhèn)化率的不斷攀升,我國城鎮(zhèn)居民因癌癥而發(fā)生死亡的情況不可避免地會發(fā)生各種各樣的變化。預防是治愈疾病最佳的良藥,尤其對于癌癥來說,如果能對癌癥進行提前預測并進行干預,無疑能達到最好的效果。
在癌癥的流行病學調查中,經常收集有關研究參與者的大量數(shù)據(jù),其中包括很多分類變量,如性別、年齡、癌癥類型等。對應分析是對大型列聯(lián)表進行分類數(shù)據(jù)分析的一種特別有用的方法。盡管已有大量關于此方法的研究,但大多未能充分發(fā)揮其潛力,僅關注圖形解釋[2]。鑒于此,本研究收集我國2014年至2018年癌癥死亡數(shù)據(jù),運用對應分析法對我國城鎮(zhèn)居民性別、年齡與癌癥死亡類型進行偏好分析,以突出特定人群日益增加的癌癥死亡危險,并為相關部門制定干預措施提供支持。
1.1 材料本研究數(shù)據(jù)資料來自2015年至2017年中國衛(wèi)生和計劃生育統(tǒng)計年鑒、2018年至2019年中國衛(wèi)生健康統(tǒng)計年鑒[3-7]。
1.2 方法采用IBM SPSS Statistics 26軟件對采集數(shù)據(jù)進行對應分析。
1.2.1 變量設計選取癌癥中的鼻咽癌,食管癌,胃癌,結腸、直腸和肛門癌,肝癌,膽囊癌,胰腺癌,肺癌,乳腺癌,宮頸癌,卵巢癌,前列腺癌,膀胱癌,腦及神經系統(tǒng)惡性腫瘤和白血病設為類型變量(Type),并分別用C01~C15代表;選取1~4歲、5~9歲、10~14歲、15~19歲、20~24歲、25~29歲、30~34歲、35~39歲、40~44歲、45~49歲、50~54歲、55~59歲、60~64歲、65~69歲、70~74歲、75~79歲、80~84歲、≥85歲設為年齡組變量,將城鎮(zhèn)男性和城鎮(zhèn)女性設為性別變量,將年齡組和性別合并為性別-年齡組變量(Sex-age)(M代表城鎮(zhèn)男性,F(xiàn)代表城鎮(zhèn)女性,1~85分別取自各年齡組的起始年齡);計算出2014年至2018年各年齡組癌癥的平均死亡率,得出基礎數(shù)據(jù)。見表1。

表1 我國城鎮(zhèn)居民癌癥性別、年齡類型死亡率基礎數(shù)據(jù)
1.2.2 對應分析性別-年齡組變量和類型變量共同構成了對應分析的列和行。對應分析是一種R型和Q型因子分析相結合的多元統(tǒng)計分析方法,其本質是一種在低維空間中用圖形方法表示關聯(lián)的技術,其最大的特點是能把眾多的樣品和變量同時表現(xiàn)在一張二維圖上。將表1的數(shù)據(jù)錄入IBM SPSS Statistics 26軟件進行對應分析。
2.1 卡方檢驗在對應分析過程中進行卡方檢驗,結果表明,卡方值為3 183.470,顯著性值為0.000,卡方檢驗結果顯著,表明性別、年齡組與癌癥類型之間具有顯著的相關性,使用對應分析是有效的。第一維和第二維的累積慣量比例為0.771,表明使用前兩個維度可以解釋總信息量的77.1%,即經過降維后,二維對應分析圖仍能較好地描述兩變量間的關系。
2.2 偏好的定性分析圖1是用SPSS 26得出的對應分析圖,解讀的方法是:從坐標原點出發(fā),如果代表列變量(性別、年齡組)的某個點與代表行變量(癌癥類型)的某個點在同一方位上距離較近,則表明二者有較強的關聯(lián)性;如果距離較遠或不在同一方位,則表明兩者關聯(lián)性較弱[8]。具體到本研究,若某個性別、年齡組與某種癌癥類型在同一方位上且距離較近,則意味著該性別、年齡組偏好該癌癥類型。

藍色“〇”代表性別、年齡組,紅色“〇”代表癌癥類型,X軸線和Y軸線在坐標原點(0,0)交叉。
就同一變量而言,在癌癥類型中,乳腺癌、卵巢癌和宮頸癌所處同一方位且距離較近,表明它們的發(fā)生具有較強的相似性和可替代性,發(fā)生這3種癌癥的條件極為相似;在性別、年齡組中,F(xiàn)40、F45和F50所處同一方位且距離較近,表明她們罹患癌癥風險的概率幾乎相同。同樣的,F(xiàn)1~F10和M1~M10罹患癌癥風險的概率幾乎相同,且由于遠離中心點,罹患癌癥死亡的風險更高。就不同變量而言,可以將性別、年齡組和癌癥類型大致分為3類,第一類包括M40~M85,前列腺癌,膀胱癌,食管癌,肺癌,胃癌,肝癌,結腸、直腸和肛門癌,表明40~89歲男性偏好前列腺癌,膀胱癌,食管癌,肺癌,胃癌,肝癌,結腸、直腸和肛門癌,主要集中在左象限;第二類包括F40~F85、胰腺癌、膽囊癌、乳腺癌、卵巢癌和宮頸癌,表明40~89歲女性偏好胰腺癌、膽囊癌、乳腺癌、卵巢癌和宮頸癌,主要集中在右上象限。第三類包括M1~M35、F1~F35、鼻咽癌、腦及神經系統(tǒng)惡性腫瘤和白血病,表明1~39歲男性和女性偏好鼻咽癌、腦及神經系統(tǒng)惡性腫瘤和白血病,主要集中在右下象限。


表2 我國城鎮(zhèn)居民各性別、年齡組的癌癥類型偏好值
2.3.1 性別、年齡分析在區(qū)分性別的情況下,城鎮(zhèn)女性居民(偏好值=-19.80)的全年齡段總體癌癥死亡風險高于城鎮(zhèn)男性居民(偏好值=-47.87)。在區(qū)分年齡的情況下,城鎮(zhèn)男性隨著年齡的增長,癌癥偏好值不斷上升,于85歲及以上達到最高;城鎮(zhèn)女性隨著年齡的增長,癌癥偏好值呈現(xiàn)先升后降的趨勢,于40~44歲達高峰,而后不斷下降。在1~14歲年齡段,城鎮(zhèn)男性的癌癥偏好值高于女性,15歲及以上的年齡段,城鎮(zhèn)女性的癌癥偏好值高于男性。見圖2。

圖2 城鎮(zhèn)居民不同年齡段的癌癥死亡偏好值
2.3.2 癌癥類型分析城鎮(zhèn)男性全年齡段的癌癥類型偏好值(從高到低,且偏好值>0)排序依次為:鼻咽癌、白血病、肝癌、腦及神經系統(tǒng)惡性腫瘤。城鎮(zhèn)女性全年齡段的癌癥類型偏好值(從高到低,且偏好值>0)排序依次為:腦及神經系統(tǒng)惡性腫瘤、白血病、鼻咽癌、肝癌、卵巢癌、宮頸癌、乳腺癌。見圖3。

圖3 城鎮(zhèn)居民全年齡段癌癥類型的偏好值
2.3.3 綜合分析在城鎮(zhèn)男性居民中,1~64歲偏好癌癥類型依次為(偏好值從高到低):鼻咽癌(偏好值=56.01)、白血病(偏好值=55.83)、肝癌(偏好值=55.20)和腦及神經系統(tǒng)惡性腫瘤(偏好值=54.23),且年齡越小偏好關系越強;65歲及以上偏好癌癥類型依次為(偏好值從高到低):食管癌(偏好值=1.72),前列腺癌(偏好值=1.72),肺癌(偏好值=1.58),膀胱癌(偏好值=1.55),胃癌(偏好值=1.42),結腸、直腸和肛門癌(偏好值=-0.07,其中80歲及以上年齡的偏好值=0.19),且年齡越大偏好關系越強。見圖4。在城鎮(zhèn)女性中,1~29歲偏好癌癥類型依次為(偏好值從高到低):白血病(偏好值=47.17)、鼻咽癌(偏好值=47.14)、腦及神經系統(tǒng)惡性腫瘤(偏好值=46.52)和肝癌(偏好值=45.47),且年齡越小偏好關系越強;30歲及以上偏好癌癥類型依次為(偏好值從高到低):卵巢癌(偏好值=20.28),宮頸癌(偏好值=20.23),乳腺癌(偏好值=20.12),膽囊癌(偏好值=17.20),胰腺癌(偏好值=16.56)和結腸、直腸和肛門癌(偏好值=0.69,其中40歲及以上年齡的偏好值=1.92)。見圖5。

圖4 城鎮(zhèn)男性居民不同年齡段不同癌癥類型的偏好值

圖5 城鎮(zhèn)女性居民不同年齡段不同癌癥類型的偏好值
癌癥已成為重要的公共衛(wèi)生問題,是全球第二大死亡原因[9]。對于中低收入國家的衛(wèi)生系統(tǒng)來說,了解癌癥的流行病學是一個相對較新的挑戰(zhàn),因為直到20世紀下半葉,主要的病理特征都是急性和傳染性疾病,因此癌癥沒有得到足夠的重視[10]。目前,發(fā)病率、死亡率、存活率和患病率已成為評估公共衛(wèi)生政策和估計人群癌癥治療需求的關鍵指標[11],但這些指標在評估多種分類變量之間內在聯(lián)系方面缺少相應的效能。
對應分析又稱關聯(lián)分析,也稱R-Q分析,是在R型因子分析(研究變量之間的相關關系)和Q型因子分析(研究樣本之間的相關關系)的基礎上發(fā)展起來的一種多元統(tǒng)計分析方法,它主要分析定性變量構成的列聯(lián)表來揭示變量之間的關系,并被廣泛應用于公共安全和衛(wèi)生健康等領域[12-14]。本研究應用“維得分”和計算公式,在定性可視化分類變量關系的基礎上,進一步達到了定量變量之間關系的目的。這里偏好值代表某個性別、年齡組和某種癌癥類型的關聯(lián)程度,偏好值越高代表兩者的關聯(lián)特征越明顯,反之,偏好值越低代表兩者的關聯(lián)特征越弱。即在相同的環(huán)境條件下,偏好值高的人群比其他人群更容易發(fā)生某種癌癥死亡。當然也存在死亡率很高但偏好值低的癌癥,不是說這樣的癌癥不重要,而只是說明這樣的癌癥在選擇人群方面的偏好特征不明顯,不具有統(tǒng)計學意義。
性別和年齡是影響癌癥死亡的重要因素。癌癥的性別差異可能是由于環(huán)境、遺傳和表觀遺傳因素的結合,以及基因調控和表達的差異所致[15]。而癌癥的年齡差異與免疫功能缺陷、老年人健康下降高度相關[16]。分析不同性別、年齡與癌癥類型的偏好關系,就可以有針對性地采取預防措施,具有非常重要的研究價值。本研究發(fā)現(xiàn)在15種癌癥類型和36個性別、年齡組構成的540對對應關系中,存在偏好關系的有230對(偏好值>0)。總體而言,城鎮(zhèn)女性居民全年齡段罹患癌癥死亡風險高于城鎮(zhèn)男性居民;城鎮(zhèn)女性于40~44歲與癌癥的偏好關系最強,城鎮(zhèn)男性年齡越大與癌癥的偏好關系越強;城鎮(zhèn)男性全年齡段偏好鼻咽癌、白血病、肝癌、腦及神經系統(tǒng)惡性腫瘤,城鎮(zhèn)女性全年齡段偏好腦及神經系統(tǒng)惡性腫瘤、白血病、鼻咽癌、肝癌、卵巢癌、宮頸癌和乳腺癌。具體而言,在城鎮(zhèn)男性居民中,1~64歲偏好鼻咽癌、白血病、肝癌和腦及神經系統(tǒng)惡性腫瘤,且年齡越小偏好關系越強;65歲及以上偏好食管癌,前列腺癌,肺癌,膀胱癌,胃癌,結腸、直腸和肛門癌(80歲及以上年齡存在偏好關系),且年齡越大偏好關系越強。在城鎮(zhèn)女性中,1~29歲偏好白血病、鼻咽癌、腦及神經系統(tǒng)惡性腫瘤和肝癌,且年齡越小偏好關系越強;30歲及以上偏好卵巢癌,宮頸癌,乳腺癌,膽囊癌,胰腺癌,結腸、直腸和肛門癌(40歲及以上年齡存在偏好關系),且卵巢癌、宮頸癌、乳腺癌、膽囊癌和胰腺癌于40~44歲偏好關系最強,結腸、直腸和肛門癌于50~54歲偏好關系最強。
綜上,癌癥主要有3種類型:第一類偏好年輕人群,包括鼻咽癌、白血病、肝癌和腦及神經系統(tǒng)惡性腫瘤;第二類偏好老年男性,包括食管癌,前列腺癌,肺癌,膀胱癌,胃癌,結腸、直腸和肛門癌;第三類偏好中年女性,包括卵巢癌,宮頸癌,乳腺癌,膽囊癌,胰腺癌,結腸、直腸和肛門癌。由此得出,鼻咽癌、白血病、肝癌、腦及神經系統(tǒng)惡性腫瘤、食管癌、前列腺癌、肺癌、膀胱癌和胃癌是與年齡高度相關的癌癥類型;卵巢癌,宮頸癌,乳腺癌,膽囊癌,胰腺癌,結腸、直腸和肛門癌是與年齡和性別均高度相關的癌癥類型。以往研究總是側重于一種癌癥類型在人群中的發(fā)病率和死亡率,往往僅僅依據(jù)死亡率隨著年齡或者性別的變化就得出結論,認為癌癥僅與性別、年齡增長有關[17-22]。本研究運用對應分析法挖掘多種癌癥類型與城市居民性別、年齡的內在聯(lián)系,發(fā)現(xiàn)多種癌癥風險偏好不僅與性別有關,而且不同的癌癥類型在年齡偏好上也不盡相同,表明對應分析更有利于篩選出不同癌癥類型的風險人群。
總之,通過性別和年齡可以大致了解癌癥死亡發(fā)生的性別和年齡偏好特征,后續(xù)的研究應進一步挖掘可能導致癌癥死亡發(fā)生的條件和原因,制定更加詳細的癌癥死亡偏好模型,以達到從源頭上預防癌癥和降低其死亡率的目的。