閆錫鵬 李 賢 黃林賓 何保仁 梁義安 李 彬
南寧中心血站,廣西南寧 530007
輸血依賴性地中海貧血(transfusiondependent thalassemia,TDT)是重型β地中海貧血(thalassemia major,TM)的一種[1]。定期輸注紅細胞制劑是TDT患者維持血紅蛋白水平和抑制無效紅細胞生成最經濟有效的方法。廣西是地中海貧血高發區,而南寧市集中全區優質的醫療資源,對于輸血依賴性地中海貧血患者的“虹吸效應”導致地中海貧血單病種用血量的急劇增長。為了給TDT患者提供更合理的供血服務,本研究回顧性統計南寧地區2016年1月至2021年6月(每月)TDT患者單病種供血量,建立了基于自回歸移動平均模型(autoregressive integrated moving average,ARIMA)的地中海貧血患者供血預測最優模型,并以此模型預測2021年7—12月的地中海貧血供血量,得到的預測值與實際值相對誤差在10%以內,證實了基于ARIMA模型的時間序列分析方法可用于南寧市(區)月度地中海貧血供血量的短期預測,為更好地開展“以供(血)定采(血)”的策略提供科學參考依據,現報道如下。
從南寧中心血站血液信息管理系統(SHINOW 9.0唐山啟奧科技有限公司)收集南寧市區醫療機構地中海貧血用血數據,按月度統計2016年1月至2021年6月的地中海貧血單病種月度用血量數據(包括洗滌紅細胞、去白細胞懸浮紅細胞,200 ml為1個血量單位U)。
①依據數據的時序圖、自相關函數(ACF)圖和偏自相關函數(PACF)圖判斷序列的平穩性,若為不平穩序列,則對其進行差分(通常只進行一階差分),有明顯季節性或周期性數據需要進行季節性差分,實現序列平穩。②選取合適模型,確定ARIMA模型的自回歸階數p與移動平均項數q。平穩處理后,若差分后的平穩序列ACF是拖尾、PACF是截尾的,建立AR模型;若ACF是截尾而PACF是拖尾的,建立MA模型;若ACF與PACF均是拖尾的,建立ARIMA模型。③根據殘差ACF圖與PACF圖判斷殘差序列是否為白噪聲序列,若是則用所得模型進行預測。若不是則需重新選取參數,訓練模型。④選取最優ARIMA模型來進行預測,計算95%CI以及相對誤差,并同實際值進行比較,驗證模型的預測效果。
用Excel軟件按月統計2016年1月至2021年6月南寧市區醫院TDT用血總量數據庫,用于模型建立。統計2021年7—12月用血量用于預測模型的驗證;采用SPSS 26.0統計學軟件進行數據分析及模型建立,采用白噪聲檢驗,P< 0.05為差異有統計學意義。
南寧市區醫院地中海貧血用血量自2016年1月以來總體呈上升趨勢,見圖1。繪制地中海貧血月度用血量時序的ACF和PACF圖,ACF圖顯示自相關系數長期大于0,PACF圖顯示1階截尾。

圖1 南寧市區醫院月度地中海貧血用血量時間序列
由于此時間序列不平穩,且為單調趨勢。對時序做一階差分見圖2,處理后序列在0上下波動;一階差分后進行ADF檢驗。顯示P< 0.01,此時序列平穩。

圖2 月度地中海貧血用血量一階差分后的時間序列
對平穩序列分別繪制一階差分ACF、PACF圖(圖3~4)和一階季節性差分ACF、PACF圖(圖5~6)。顯示ACF與PACF均為拖尾,且結合南寧市區醫院地中海貧血用血量受季節性采血量波動影響的實際情況,適合建立ARIMA(p,d,q)(P,D,Q)S模型對南寧市區醫院地中海貧血用血月度數據進行擬合。通過觀察序列及實際情況,地中海貧血用血數據顯示年度周期性,確定季節性周期s為12;對原始序列進行了一階差分,故取d=1;一階差分ACF圖顯示一階截尾或拖尾,自回歸階數p=1或0;1階差分PACF圖顯示拖尾,取q=1;一階季節性差分ACF圖顯示拖尾且有單調趨勢,故P=0,D=0或1;一階季節性差分PACF圖顯示一階截尾,季節性移動平均階數Q=1。模型參數的取值從低階到高階不斷嘗試,通過比較各個模型的標準化BIC值,選取備選模型。以此識別的兩個備選模型為模型1:ARIMA(0,1,1)(0,0,1)12、模型2:ARIMA(1,1,1)(0,0,1)12。比較兩個備選模型的正態化BIC值:模型1的BIC值為10.038,模型2的BIC值為11.009。根據貝葉斯最小信息準則,BIC值越小擬合效果越好。確定南寧市區醫院地中海貧血月度用血量的預測模型為模型1:ARIMA(0,1,1)(0,0,1)12。

圖3 月度地中海貧血用血量一階差分后的ACF圖

圖5 月度地中海貧血用血量一階季節性差分ACF圖

圖4 月度地中海貧血用血量一階差分后的PACF圖

圖6 月度地中海貧血用血量一階季節性差分PACF圖
對確定的最優模型的殘差序列做自相關函數ACF和偏自相關函數PACF圖(圖7),殘差序列 的ACF和PACF值 均 在95%CI內,楊-博 克斯(Ljung-Box test)Q統計量為22.8,差異無統計學意義(P> 0.05),即殘差序列無自相關性。判定ARIMA(0,1,1)(0,0,1)12適用于南寧市區醫院地中海貧血月度用血量的預測。

圖7 模型1殘差序列的ACF、PACF圖
繪制最優模型ARIMA(0,1,1)(0,0,1)12包含實測值、擬合值和預測值的模型擬合圖(圖8)。由圖可見地中海貧血月度用血量擬合值和實測值的曲線趨勢變化基本一致。除2020年1月地中海貧血月度用血量的預測值外,其他實測值均在95%CI內,擬合效果較好。利用最優模型對2021年7—12月的地中海貧血月度用血量進行預測并與實際用血量比較,預測平均誤差為8.42%,見表1。

表1 模型1對2021年7—12月預測及誤差情況

圖8 模型1預測效果圖
TDT是兩廣地區高發的單基因遺傳性貧血病[6],由于供體的稀缺性、移植相關風險以及患者家庭經濟條件等因素限制,異基因造血干細胞移植在TDT患者的治療中并未得到廣泛應用。定期定量輸血雖然不可避免地承擔包括輸血傳播疾病、輸血不良反應及鐵過載引起的多器官功能損傷等風險[7-11],但仍是目前最常用的方法。為了保障TDT患者供血充足,南寧市從2013年起就做了大量工作[12-14],建立了TDT患者“定點供血-定期輸血”的模式。南寧TDT患者仍然迫切需要加強規范輸血和祛鐵治療[15]。
血站作為公益性事業單位,保障臨床用血的安全、充足和有效是必須承擔的社會責任,自2016年南寧市在全國率先全面取消互助獻血[16]以來,滿足TDT患者科學合理用血需求一直是血站重點工作之一。根據最新統計,2021年地中海貧血患者專項供血(僅以紅細胞計算,下同)總量為23 159.5 U,占2021年全部供血總量的10.42%,是2016年地中海貧血患者專項供血總量(5485.5 U)的4.2倍。TDT患者實際用血量主要受以下因素影響:①無償獻血采集量(全血)。無償獻血易受天氣季節、國家政策、突發事件、疫情、人群輿情等各類不確定因素的影響,臨床供血緊張時,TDT患者供血將會受到限制;②TDT患者年齡及輸血頻率。定期、足量的規范輸血治療常能使TDT患者良好生存至40歲以上,但是實際用血量還會受到醫療條件和患者經濟條件的影響。
2016—2021年,南寧市區地中海貧血用血占總紅細胞供血量的比例從3%升至10.42%。同時由于受血液采集量季節性的影響,地中海貧血供血量也呈現一定的季節性周期變化,一般每年二三月份和七八月份獻血淡季(寒暑假),地中海貧血用血量也相應縮減,而年末則表現出地中海貧血供血量增高的趨勢。南寧市區的獻血人群主要是本地區常住人口和駐邕各大高校以及機關企事業單位的人群,而用血人群則包含區內各個縣市來邕求醫的人群。因此,即使南寧在十三五期間千人口獻血率達到16.85‰,并顯著高于全國平均水平,但臨床血液供應量一直以來在苦苦追趕市區內各醫院規模擴大的步伐,供血壓力巨大。獻血活動的季節性和血液血型結構性的不穩定也增加了血液供需平衡的不確定性[17]。因此,對南寧市區醫院地中海貧血用血量進行科學預測,從而指導血液的調配與發放,實現供需平衡,具有較大的應用價值。
既往國外類似研究的預測對象多為紅細胞或血小板總體供血量[18],本研究將ARIMA模型預測應用于地方性單病種血液供應,旨在解決南寧市區醫院地中海貧血單病種用血供需矛盾。南寧市區醫院TDT患者月度供(用)血量是一組以固定間隔,時間順序記錄的時間序列數據,呈現一定的周期性和趨勢性,符合ARIMA模型建模對時序的特征要求。經過統計分析,利用ARIMA模型的建模原理,結合實際情況,確定參數,經過反復檢驗和識別,得出最優模型為ARIMA(0,1,1)(0,0,1)12。運用最優模型對2021年7—12月用血量進行預測,得到的預測值和用血實際值的變化趨勢基本一致。其中對7—11月預測誤差較小,對9、11月預測誤差甚至小于2%,預測效果良好。6個月預測值的平均相對誤差為8.42%,小于10%(多數學者認為,平均誤差小于10%說明模型的預測效果良好[2-4]),此模型可用于南寧市輸血依賴性地中海貧血單病種月度用血量的短期預測。
TDT患者月度用血需求預測模型的構建,可以為采供血機構制訂采供血計劃提供科學依據,提前調整供血結構和儲備及預留地中海貧血用血,緩解地中海貧血用血供需矛盾。使供血計劃既能滿足臨床需求又能避免浪費。
雖然本研究所采用模型的擬合度和預測精度均達到預期,但是建立的ARIMA模型也具有一定的局限性,因為模型是依靠歷史數據建立的,模型準確預測的條件是原始數據存在的客觀規律,根據模型做出的預測一般為理想狀態下的預測,尚未能考慮突發公共衛生事件及各種原因導致的血液庫存量劇烈變化,以及國家政策等外部不確定因素的影響。對個別月份用血數據峰值(如2021年12月)的預測還不夠理想。因此依據歷史數據建立的模型,還需要繼續長期收集建立大數據,及時更新參數。此外,2018年出臺了《廣西嚴重類型地中海貧血胎兒零出生計劃實施方案》(桂政辦發〔2018〕76號),新增TDT患者將逐步減少,在后續工作中需要找到TDT患者用血量變化趨勢拐點,及時對模型有效性驗證并調整。