海軍軍醫大學衛生勤務學系軍隊衛生統計學教研室(200433)
秦宇辰 郭 威△
【提 要】 目的 介紹比較醫學研究與公共衛生工作中常用的兩大變化趨勢描述指標,年度變化百分比(annual percent change,APC)和年均變化百分比(average annual percent change,AAPC)間的異同,介紹兩者在joinpoint軟件中的實現方法,為兩者的實踐運用提供實用建議。方法 比較分析兩個指標的基本原理、方法特性和相對優劣勢,論述各指標的適用情景和應用價值。結果 APC的使用需嚴格遵守線性趨勢假定,而AAPC具有諸如無需線性變化趨勢假定、適用面廣、方便各亞組間變化趨勢比較、更充分利用既有信息和取值對分割時間區段內子時間段不敏感等優點,在線性變化趨勢假定下可化簡為APC。結論 AAPC具有顯著的方法學優勢,可更科學、有效地刻畫觀察期內的總體變化趨勢,在醫學研究的趨勢分析中應優先選用。
醫學研究與公共衛生工作中,常采用平均增長速度、年度變化百分比(annual percent change,APC)和年均變化百分比(average annual percent change,AAPC)等指標定量分析描述某事物或現象的時間變化趨勢。已有研究表明,相較于平均增長速度,APC能更充分利用每個時段觀察值的信息,科學性和嚴謹性更強,推薦在實踐工作中優先使用[1]。然而目前,尚未有研究介紹比較年度變化百分比(APC)和年均變化百分比(AAPC)兩種時間變化趨勢描述指標的特點與相對優劣勢。本文旨在簡要介紹兩個指標的基本原理和特點,比較它們的優劣之處,并介紹軟件實現方法,以期為其推廣應用提供參考。
假設目標現象y(如發病率、死亡率等)在整個觀察期內的變化速度恒定,采用線性回歸方程ln(y)=b0+b1x,擬合時間變量x與目標現象的自然對數值ln(y)之間的線性關系,通過對該直線斜率b1的t檢驗,實現對APC取值是否為0的假設檢驗。假設2015-2020年間某疾病發病率的APC為1%,2015年的發病率為20/10萬,則2016年的發病率為20/10萬×1.01=20.2/10萬,2017年的發病率為20/10萬×1.0122=20.402/10萬,以此類推。APC及其95%置信區間(95% confidence interval,95% CI)的計算公式為:
APC95%CI={exp(b1±s×td(q))-1}×100,q=1-α/2
其中,s表示擬合線性回歸方程斜率b1的標準誤,td(q)指自由度為d的t分布的第百分之q×100分位數。
當對數化后的發病率或者死亡率隨時間呈線性關系時,可用APC描述其變化趨勢。而當該線性假定不滿足時,觀察時間內的非線性變化趨勢可采用分段回歸模型(segmented regression model or piecewise regression model)[2],計算分段年度變化百分比sAPC(annual percent change from segmented analysis)進行描述。sAPC的基本思想是,將觀察期內的非線性變化趨勢劃分為多個呈線性變化的子時間段,并分別采用線性模型刻畫。具體地,設觀察期內有k個“趨勢轉折點”(trend transitions points),將整體變化趨勢劃分為k+1個子時間段。每個子時間段內的變化速率認為不變,而子時間段間的變化速率可以不同。在每個子時間段內分別擬合對數化的目標現象特征和時間的線性回歸模型,得到各個子時間段內的sAPC,具體計算方法參見相關文獻[3]。sAPC在實際應用中可能存在以下問題:(1)無法用一個數值綜合描述一段固定長觀察期內(如10年、20年等)的總體變化趨勢;(2)在比較不同性別、年齡段等亞組間的變化趨勢時,不同亞組的趨勢轉折點個數及子時間區段不同,導致無法直接使用sAPC進行組間比較。
鑒于sAPC存在的問題,年均變化百分比AAPC被提出用于綜合描述觀察時間段內的總體變化趨勢,方便不同亞組間的趨勢比較。其基本思想為,首先基于分段回歸模型得到k+1個子時間段的變化速率bi(i=1,…,k+1),然后對bi加權求和得到一個綜合數值。各個bi對應的權重Wi為各個子時間段長度占總觀察期的百分比。
假設某現象對數化后的發生率ln(y)在時間段[a,b]內呈非線性變化,使用分段回歸模型擬合后得到k個拐點,也即k+1個變化速率恒定的子時間段,則AAPC及其95%CI的計算公式為:

-1}×100

用于兩組比較時,可采用下式計算兩組AAPC差值AAPC(1)-AAPC(2)的95%CI。其中,AAPC(1)表示組1(如男性人群)在觀察時期內的AAPC值,AAPC(2)表示組2(如女性人群)在觀察時期內的AAPC值。
APC、sAPC和AAPC三類時間變化趨勢描述指標的相對優劣勢如表1所示?;诤唵尉€性回歸的APC計算簡單,易于理解和解釋,但其對線性變化趨勢假定的強依賴也客觀限制了其適用的問題情境。而基于分段回歸模型的sAPC則能很好地解決這一問題,通過引入趨勢轉折點,將總體的非線性變化趨勢切分為若干個呈線性變化趨勢的子時間段并分別描述其平均變化百分比,如此即可為整體的非線性變化趨勢提供一個細致、全面的多區段變化趨勢描述。但sAPC不利于綜合把握觀察期間的總體變化趨勢。此外,由于分段回歸模型很可能在不同亞組中擬合出不同的時間轉折點和子時間段,故無法使用sAPC進行亞組間變化趨勢的檢驗和比較。AAPC是由各子時間段sAPC加權得到的綜合指標,既可描述觀察期內的總體變化趨勢,也可用于亞組間的趨勢比較[6],其實質是各子時間段的年度變化率的幾何均數,故被稱為年均變化百分比[3]。值得注意的是,APC可看作AAPC的特例,若整個觀察期的變化速率恒定,AAPC可化簡為sAPC或APC。由于AAPC對于子時間段的選取不敏感,在描述子時間段變化趨勢時,也可利用整個觀察期的信息。
總體而言,AAPC相較于傳統的APC有以下三點顯著優勢:(1)AAPC無需線性趨勢假定,適用面更廣;(2)AAPC可用于亞組間共同觀察時間段內的總體趨勢比較和檢驗;(3)當AAPC描述被趨勢轉折點分割出子時間區段的變化趨勢時,任意子時間段內任意兩時點間的AAPC都相同(均等于該子時間段的sAPC),故其對子時間區段內的子區間選取不敏感。計算AAPC需基于分段回歸模型,故AAPC描述子時間區段變化趨勢時可利用整個觀察期的信息。而傳統的APC只能使用該子區間的有限數據重新計算變化速率,故會對所選定的子區間比較敏感。綜上,在描述觀察期內的總體變化趨勢時應盡可能選用AAPC,若使用APC則應注意其所需的線性假定是否滿足。當我們對觀察期內各時點的具體變化趨勢感興趣時,可使用基于分段回歸模型的sAPC詳細刻畫。

表1 三類時間變化趨勢描述指標間的優劣勢比較
AAPC和APC可由美國國家癌癥研究所開發的Joinpoint軟件計算獲得[4]。用戶只需在官網(https://surveillance.cancer.gov/joinpoint/)簽署使用協議并完成注冊便可免費下載安裝。該軟件分為桌面版和命令行版。桌面版適合習慣進行界面點選操作的用戶,命令行版則允許用戶編寫代碼執行批量分析任務。目前軟件的最新版本為Join point Regression Program,Version 4.8.0.1(Statistical Research and Applications Branch,National Cancer Institute)。
如下以鄭文龍等[5]報告的2006-2015年天津市宮頸癌死亡率數據(表2)為例,介紹如何使用桌面版Join point 4.8.0.1軟件計算APC和AAPC。

表2 2006-2015年天津市宮頸癌死亡率(/10萬)
首先將表2中數據整理成縱向格式,數據包括year(年份)、mortalityrate(死亡率(/10萬))和grp(分組,1:城市,2:農村;3:總體)三個變量,如圖1所示。需注意的是,原始數據需按照分組變量grp和時間變量year升序排列后,方可導入Joinpoint軟件,否則軟件會提示發生錯誤。

圖1 可導入Joinpoint軟件數據格式舉例
Joinpoint軟件支持*.dic(Seer*Stat Dictionary)、*.csv、*.gz、*.txt、*.xls、*.xlsx等多種數據格式導入。打開軟件后,在界面菜單欄點選“File”→“New Session”,隨后在彈出的界面中,選中目標數據文件并點擊“打開”,則可在新建的Joinpoint Session會話框中分別點選界面左上端的“Input File”、“Method and Parameters”和“Advanced Analysis Tools”設置數據導入和分析的參數。
首先在新建的Joinpoint Session會話框中的“Input File”界面(圖2)設置數據導入和模型基本參數。界面上半部分的數據導入參數通常保持默認即可,下半部分的模型基本參數設置中,首先需在右側的“Independent Variable”下拉菜單欄中將時間變量year選入為分段回歸模型的自變量;然后,在左側的“Dependent Variable”欄目的“Type of Variable”下拉菜單中選中“Crude Rate”;設定“Crude Rate”對應的變量為mortalityrate;隨后在左側底端的“Heteroscedastic Errors Option”下拉菜單欄中選中“Constant Variance(Homoscedasticity)”,設定回歸模型的隨機誤差項為同方差的。由于同方差假定在實踐中經常無法滿足,故當率的標準誤可獲取時,最好選擇“Standard Error(Provided)”并將標準誤變量選入“Standard Error”下拉菜單,以允許軟件使用加權最小二乘法處理異方差問題。本界面左下方的“Log Transformation”顯示,默認會先對原始的死亡率進行自然對數轉換后再擬合回歸模型。如此即完成了所擬合分段回歸模型的基本參數設定,最后在“By Variables”子界面下點擊“Add”選項,將分組變量grp納入模型,允許軟件按grp變量分別擬合分段回歸模型以分析三組(城市、農村以及總體人群)的死亡率變化趨勢。

圖2 Joinpoint Session會話框的“Input File”界面
在“Method and Parameters”界面可以詳細設置分析的方法和參數,一般采用默認設置即可。點選界面左下端的“AAPC Segment Ranges—Entire Range”并設定時間范圍即可計算該時段內的AAPC。設置完畢即可點選軟件界面上端快捷方式欄中的“Execute Current Session”按鈕,運行分析程序獲得結果。
軟件結果輸出界面如圖3所示,左側菜單欄顯示,界面中包含URBAN(城市)、RURAL(農村)和TOTAL(總體)三個隊列的分析結果。每個隊列均擬合了兩個分段回歸模型,標★號的為軟件推薦的擬合模型,城市組和農村組因十年間的死亡率變化趨勢均較為穩定,無明顯趨勢轉折,故軟件推薦采用“0 Joinpoints”模型,在總體人群中發現一個有意義的趨勢轉折點,故軟件推薦采用“1 Joinpoints”模型。右側的“Graph”視圖圖形化展示了三組死亡率變化趨勢的擬合情況,可通過點選結果輸出界面左上角的“Filter Cohorts”按鈕下的“View Multiple Models Simultaneously”并多選左側菜單欄顯示的多組擬合曲線,使其展示在同一畫幅中。在軟件菜單欄“Output”—“Options”下可設置結果輸出界面各子界面的展示形式,在“Graph”下完善美化趨勢圖,詳細過程此處不贅。
擬合趨勢如圖3所顯示,城市組和農村組2006-2015十年間的死亡率總體變化趨勢較為穩定,無明顯的趨勢轉折點,兩組APC分別為7.68%和12.74%。而總體人群的死亡率變化趨勢于2013年存在一個有意義的轉折點,2006-2013年間的APC為7.03%,2013-2015年間的APC為29.94%。

圖3 Joinpoint軟件的圖形化分析結果
圖4展示了“Trends”子界面的結果,主要包括各組的APC、AAPC及其95%CI的上下限、檢驗統計量和P值等詳情??梢钥闯?,2006-2015年間,城市、農村和總體人群的宮頸癌死亡率AAPC為7.68%(4.39%,11.07%)、12.74%(5.85%,20.08%)和11.74%(4.40%,19.60%),P值均小于0.01,提示三組宮頸癌死亡率的年均變化趨勢有統計學意義。本實例中,由于城市組和農村組十年間均無有意義的趨勢轉折點,故此兩組AAPC和APC的點估計及95%CI一樣。

圖4 Joinpoint軟件的趨勢分析結果
本文簡要介紹了APC、sAPC和AAPC三個指標的基本原理及關聯關系,梳理比較了三者的優劣勢,給出了使用Joinpoint軟件進行基礎趨勢分析的基本流程和參數設置,以期為醫療和公共衛生研究者提供參考。實際研究中,APC和AAPC均得到較為廣泛的應用,但許多文獻使用APC時并未充分報告指標所需的線性假設是否滿足,可能存在較多方法誤用的情況。研究者應重視各個指標背后的前提假定,結合自己的實際問題作出合理選擇。鑒于AAPC的顯著優勢,本文建議在實踐工作中優先選用AAPC,如可能,可同時報告APC和AAPC的結果。限于篇幅,本文未介紹如何使用Joinpoint軟件進行亞組間變化趨勢的檢驗和比較,我們將另文介紹具體實現方法及注意事項。感興趣的讀者可以在Joinpoint軟件官網,下載軟件的使用手冊研讀學習。用戶也可在官網上反饋Joinpoint軟件使用過程中遇到的問題并尋求指導和幫助。