河南省人民醫院(450000) 和 融
基于Joinpoint回歸模型的住院量實證分析
河南省人民醫院(450000) 和 融
目的對醫院住院量進行Joinpoint回歸分析的實證研究。方法應用SAS 9.3軟件確定數據分析方法,應用Joinpoint回歸分析軟件建立Joinpoint回歸預測模型。結果該院住院患者人次數據為非正態分布W=0.69,P<0.01,呈現指數趨勢,應用非線性回歸模型;Joinpoint回歸分段點為1989年、1995年、2001年、2007年和2013年,5個分段點的假設檢驗(P<0.05)具有統計學意義;根據Joinpoint回歸方程預測2016-2020年住院量為189119,201119,213881,227452,241885。結論Joinpoint回歸分析可用于醫院管理數據的分析與預測,且擬合效果較好;醫院需進一步優化服務流程,應對住院患者人數的變化。
Joinpoint 回歸分析 入院人次 醫院管理
醫院住院量是醫院重要的工作量指標,也是醫院發展決策中的重要輔助信息。有必要通過科學的統計模型,擬合住院患者人次數的歷史演變規律來推測未來情況。
本文所用數據來源于某院統計臺賬及HIS系統,獲得該院1979-2015年的住院量,所選數據的質量真實可靠,具體數據見表1。

表1 某院1979-2015年住院量
(1)模型介紹
Joinpoint(以下簡稱JP)回歸模型是由Kim等于2000年提出[1],其基本思想是將一個長期趨勢線分成若干段,每段用連續性的線性進行描述。JP可用于對數據的分段線性回歸來總結分析腫瘤的趨勢變化,并被美國國立癌癥研究所推薦使用,應用JP分析軟件JoinpointVersion 4.2進行JP回歸分析。
(2)模型表達式
JP回歸模型又稱片段回歸(piecew ise regression),線段回歸(broken-line regression)或多階段回歸(multi-phase regression),對數據序列本身是否存在明顯趨勢等并沒有要求,越來越多地應用于確定時間序列數據的變化程度分析[2]。JP回歸模型分為線性數據模型與非線性數據模型[3],見公式(1)和(2)。
線性數據模型:

非線性數據模型:

xi(i=1,2,…,n)為自變量;yi(i=1,2,…,n)為因變量;β0表示不變參數,β1表示斜率參數(回歸系數);δn=βn+1,1-βn,1表示分段函數的回歸系數;τ是未知的線段分段點,如果(xi-τn)>0,那么(xi-τn)+=(xi-τn);否則(xi-τn)+=0。
(3)分段點與模型檢驗
應用網格檢索法[4](the grid search method,GS)進行數據分段點數量的選擇和檢驗時,JP分析軟件默認數據量與分段點數量的對照選擇見表2[5]。

表2 數據與默認分段點間對應表
JP分析軟件采用Z檢驗進行分段點的假設檢驗,以確定數據是否有足夠的證據來添加多少個分段點[6]。假定無任何分段點,即H0:0個分段點,則原數據可以用簡單線性回歸進行描述為 E[y|x]=β0+β1x;備擇假設為有n個分段點,即H1:有n個分段點,則原數據描述為 E[yi|xi]=β0+β1xi+δ1(xi-τ1)++…+δn(xi-τn)+。如果拒絕 H0,再檢驗有1個分段點與n個分段點差異是否有統計學意義,以此類推。非線性數據回歸模型檢驗類似。
37個歷史數據的散點圖可發現數據呈現指數發展趨勢。見圖1。

圖1 散點圖
應用SAS 9.3軟件對數據進行正態性檢驗,其自身分布(W=0.69,P<0.01)以及殘差(W=0.85,P<0.01)的檢驗表明,數據并不滿足正態分布,不適用于線性數據回歸模型。故在JP回歸分析中采用非線性數據回歸模型。
JP分析將原數據序列分為5個分段點(1989年、1995年、2001年、2007年和2013年)和6個不同的階段(1978-1988年、1989-1994年、1995-2000年、2001-2006年、2007-2012年和2013-2015年)。
JP分析軟件計算出數據進行JP回歸的各項參數,根據JP回歸模型的公式與參數解釋,可得該數據的JP回歸表達式為:

分段點分別為 1989年(P=0.0002)、1995年(P=0.0002)、2001年(P=0.0002)、2007年(P=0.0002)、2013年(P=0.004)。故拒絕原假設,5個分段點具有統計學意義。
由回歸公式得到該院1979-2015年住院量的擬合值,見表3。

表3 住院量實際值與JP擬合值比較
根據預測的精度要求:長期預測(5~10年的預測期)相對誤差在30%~40%,中期預測(1~5年的預測期)相對誤差在10%~20%,屬正常范圍[7]。表2中的平均相對誤差為1.94%,符合相關要求。JP回歸預測醫院住院量模型可信,可用于外推預測。JP回歸預測2016-2020年住院量依次為:189119、201119、213881、227452、241885。
傳統的模型如線性模型或曲線模型只能預測一種趨勢,時間序列方法也存在種種局限。JP模型除應用于分析癌癥死亡率和發病率的連續變化趨勢[8],同樣可以應用于任何時間序列數據的分析,也可以適用于醫院管理與決策,根據醫院數據的趨勢分析對發展做出決策。本文實證分析了JP回歸可被應用于醫院管理數據的分析與預測,且擬合度較好,分析結果和角度較新穎、深入,結果可被醫院管理者采用以及作為輔助決策信息。JP回歸應用專業分析軟件,降低了其計算和分析難度;JP分析軟件操作簡單,便于醫院管理者在數據分析中進行應用。
只有在深入分析分段點產生的背景和原因后,才能更明晰影響醫院發展的因素,保證醫院平穩、健康的發展。國務院于1992年9月下發了《關于深化衛生改革的幾點意見》,提出要進行醫院的市場化,該院1993年開辦了分院開展醫療服務;2001年,該院當年開放床位數較前一年度增長了23.6%,達到1341張,有能力收治更多的患者;2007年1月原衛生部披露醫改的新方案;2013年該院所在省份開始執行新農合醫保政策,規定省級醫院新農合起付線為3000元,報銷補償比例為45%和65%,遠低于縣級醫院起付線500元,報銷補償比例80%[9]。
根據JP回歸分析結果,該院自2007年起開始進入快速發展階段,但2013年后發展速度放緩。2015年9月11日國務院辦公廳發布《關于推進分級診療制度建設的指導意見》,明確指出到2017年實現分級診療體系[10],可以預見的是,住院量的增長速度放緩,甚至會出現下降。醫院在現有的規模和社會環境下,需要做好準備,以應對這種變化,如適時調整床位,優化病房結構[11];主動參與區域分級診療的構建,特別是實行高血壓、糖尿病、腫瘤等診斷明確、病情穩定的慢性病患者在基層醫療機構實施治療,必要時成立縱向相聯的醫療集團,以確保區域影響力的持續與病源市場的穩定。
附:SAS9.3程序
data t1;input x y@@;cards;
1979 9739 1980 9893 1981 10393 1982 10789 1983 10685 1984 10732 1985 10638 1986 10999 1987 12088 1988 12664 1989 12749 1990 12331 1991 12151 1992 12214 1993 11356 1994 12051 1995 12770 1996 13633 1997 15440 1998 18177 1999 21420 2000 24264 2001 28486 2002 31038 2003 34393 2004 39625 2005 41910 2006 46153 2007 52826 2008 63144 2009 79106 2010 93184 2011 108643 2012 129163 2013 155214 2014 168442 2015 176929;
procgplot data=t1;plot y*x;run;
proc univariate normal plot data=t1;var y;run;
[1]Kim HJ,Fay MP,Feuer EJ,et al.Permutation Tests for Joinpoint Regression with Applications to Cancer Rates.Statistics in Medicine,2000,19(3):335-351.
[2]Goovaerts P,Xiao H.Geographical,Temporal and Racial Disparities in Late-Stage Prostate Cancer Incidence across Florida:A Multiscale-Joinpoint Regression Analysis.International Journal of Health Geographics,2011,10(1):63.
[3]Huriye T,Sinan S.Joinpoint Regression Analysis and An Application On Istanbul Stock-Exchange.Alphanumeric Journal,2014,2(1):44-49.
[4]Lerman PM.Fitting Segmented Regression Models by Grid Search.Applied Statistics,1980,29(1):77-84.
[5]Joinpoint User′s Guide 4.2.http://surveillance.cancer.gov/joinpoint/Joinpoint_Help_4.2.0.0.pdf.
[6]Zhu L,Pickle LW,Ghosh K,et al.Predicting US-and state-level cancer counts for the current calender year:PartⅡ:evaluation of spatiotemporal projection methods for incidence.Cancer,2012,118(4):1100-1109.
[7]董承章.經濟預測原理與方法.大連:東北財經大學出版社,1993:6-10.
[8]馬臣,姜永曉,劉曙正,等.河南省居民2010年至2019年肺癌死亡率預測.鄭州大學學報(醫學版),2013,48(2):220-225.
[9]河南省衛生廳.河南省新型農村合作醫療統籌補償方案指導意見(豫衛農衛[2012]20號),2012-12-11.
[10]國務院辦公廳.《關于推進分級診療制度建設的指導意見》(國辦發[2015]70號),2015-9-11.
[11]馬春柳,劉海霞,李小升,等.SARIMA模型在醫院住院人次預測中的應用.中國衛生統計,2013,30(3):432:433.
(責任編輯:鄧 妍)