傅成杰,閆維新,趙言正
(上海交通大學 機械與動力工程學院 機器人研究所, 上海 200240)
近年來,心腦血管疾病的發病率呈逐年上升的趨勢,嚴重影響了人們的健康質量[1],如何快速有效地治療心腦血管疾病是當前醫學界和整個社會關心的問題。隨著心腦血管學的不斷發展,研究者發現心腦血管疾病的產生與炎癥的持續刺激有關,炎癥對其形成過程起到了重要作用,而C反應蛋白(C-reactive protein,CRP)水平是臨床上炎癥的一種標志物[1-2],可作為炎癥診斷中的重要檢測指標[3]。
隨著人們生活水平的提高,醫療檢測設備及分析技術也在不斷改善,其中C反應蛋白的定量檢測技術受到了醫學界的普遍認可,在病情檢測、疾病診斷等方面得到了廣泛的應用[4]。然而,CRP相關檢測大多停留在檢測階段,無法提供病情診斷與預測等功能。另外,目前CRP檢測設備大多體積較大、操作復雜,只適合在醫院中使用。因此,研制出一種小型化、操作簡單并能提供心腦血管疾病診斷與預測功能的家用血液檢測服務系統具有重要的意義。本文首先介紹了系統的整體設計,然后在系統基礎上詳細介紹了病情診斷算法和病情預測算法,最后通過分析算法實驗驗證了算法的準確性。
家用血液檢測服務系統是比較復雜的生機光電一體化系統,主要包括家用血液檢測設備和軟件系統。家用血液檢測設備主要由機械結構和光電檢測模塊組成,軟件系統由下位機和上位機組成。下位機是嵌入式控制系統,上位機是人機交互平臺,包括安卓APP和Web服務端,負責數據存儲、數據分析處理等功能。系統整體設計如圖1所示。
機械結構是檢測設備實現定量檢測的基礎,由步進電機、導軌滑塊、光電限位傳感器、推送裝置等組成。在下位機的控制驅動下,可完成推送免疫層析試紙條、動態掃描采樣等動作。系統的整體機械結構是實現自動化檢測的保障。
光電檢測是檢測設備的關鍵模塊,對檢測結果起著不可替代的作用。為保證設備體積小、結構緊湊,本文選用單光路結構。同時,本文選擇較為成熟的光強與電流的雙閉環反饋電路來保證激發光光強的穩定性,以外環光強反饋來調整激發光的光強,以內環電流反饋來調整驅動電流。光電檢測模塊掃描采樣得到的熒光光強信號由光電二極管(PD)轉換成電信號之后,經放大電路、A/D轉換電路傳遞給上位機進行后續的數據分析處理。

圖1 系統整體設計
下位機是家用血液檢測設備的神經中樞。本文選擇TI公司的CC2640作為設備的主控芯片。下位機點亮光電檢測模塊的LED光源,驅動機械結構執行相關動作,完成對免疫層析試紙條的掃描采樣。下位機通過藍牙將熒光光強信號數據傳輸給上位機。
人機交互平臺即上位機,由安卓APP和Web服務端組成。安卓手機APP首先完成用戶的登錄功能,接著將從下位機通過藍牙傳輸過來的熒光光強信號數據緩存于對應的用戶信息中。安卓手機緩存的數據可以通過網絡上傳到Web服務端,根據相應算法完成對數據的處理得到C反應蛋白的濃度,同時把數據展示在瀏覽器上或者存儲于本地的MySQL數據庫中。診斷與預測算法位于上位機,能根據現有的醫療數據和病歷對病情做出一定的診斷與預測。
病情診斷算法中,其中一個較有效的診斷方法是做一定的量化分析,進行區間分段得到分類標準。然后分析檢測得到的數據,找到對應的分類,從而得到病情診斷結果。但是對于通過CRP濃度來診斷心腦血管疾病的方式,并不能簡單地采用少量的數字作為分段區間進行分類診斷,因為這樣獲得的診斷結果未考慮環境和個人因素,是比較粗糙的,病情診斷的準確性較低。為解決這個問題,本文采用以決策樹模型為基礎的病情診斷算法。由于具體的CRP檢測數據和病歷數據較少,即模型訓練集較少,無法完成模型構造,因此本文放棄重新構造模型,尋找現有的決策樹模型參數進行構造,把查找到的CRP數據作為測試集對該模型進行分類準確性評估[5]。圖2所示為病情診斷算法總體流程。

圖2 病情診斷算法總體流程
算法首先充分考慮環境因素和個人因素,得到C反應蛋白診斷相關的有效判斷因子作為決策樹模型參數,即決策樹的節點。Shemesh等[6]對70余名心腦血管疾病患者進行了2年多的跟蹤調查之后發現,在沒有任何干預措施的前提下,患者體內的CRP濃度是相對恒定的,相比其他危險因子如高血壓、膽固醇等更穩定,可作為心腦血管疾病的獨立危險因子。Chiriboga等[7]對583位健康的成年男女進行了長達4年的研究工作,按季節周期性地檢測他們的CRP濃度。其研究結果表明:不同性別的成年人的CRP平均濃度不同, 且CRP濃度會隨季節產生波動,高峰期在11月,低谷期在5月。Rückerl等[8]對1 003名MI病人進行每月CRP濃度檢測,通過分析發現采血之前患者是否有吸煙、喝酒和應激等行為對其自身每月的CRP濃度沒有影響。孫亞超等[9]對120例心腦血管疾病患者及60名健康體檢者進行研究,發現預后好轉健康組的平均CRP濃度高于普通健康組。
綜合各種資料可得決策樹的有效判斷因子,即決策樹節點(包括性別、季節、是否預后),以及具體的分類規則。圖3所示為CRP濃度相關的決策樹模型。

圖3 CRP濃度決策樹
任何一個系統都有其自身已知和未知的信息[10]。信息完全可知的系統稱為白色系統;信息完全未知的系統稱為黑色系統;介于兩者之間的系統則稱為灰色系統。對于醫學科學來說人體是一個復雜的系統,人體感染疾病是由多個已知和未知的子系統綜合作用產生的結果,因此人體是一個灰色系統。對心腦血管疾病進行預測即對人體這個灰色系統進行預測,這就需要預測算法運用一定數學方法使信息不完全可知的系統經處理后成為信息較明確的系統。以灰色預測模型為基礎的預測算法就是一種能實現該功能的算法[11]。灰色預測在流行病和疾病發病率等領域的預測方面得到了廣泛應用[12],本文將其應用在心腦血管疾病的預測方面,即對CRP濃度的預測。
建立灰色預測模型的主要過程是首先得到原始數據,進行初步處理后將其從無規律狀態變成較有規律狀態,之后對其進行建模。灰色預測模型相比一般的統計預測模型的優點是灰色預測不要求有大量的數據樣本,也不需要樣本有典型的概率分布,其計算簡單、適用性較強。另外,灰色預測在短期范圍內的預測效果佳[13],這些都與CRP濃度預測性質相符,滿足對心腦血管疾病預測的要求。灰色預測模型中最常用的是一個變量的一階微分方程G(1,1)模型,如圖4所示為以灰色預測模型為基礎的病情預測算法流程。
假設原始數據X(t)={x(1),x(2),…,x(n)}為弱化隨機性強化規律性,則需要對X(t)進行一次累加,生成Y(t)。對Y(t)進行均值處理,均值生成W(t),具體見式(1)~(2)。

(1)
(2)

圖4 病情預測算法總體流程
首先對Y(t)建立1階線性微分方程,即G(1,1)模型:
(3)
其中:a和u均為待定系數,a是發展灰數,u是灰色控制量。求解式(3),其特解為
(4)
根據最小二乘法,估計參數向量為
(5)



(6)
(7)

將式(6)和(7)代入式(4)中,可得累加估計值為
(8)


(9)

(10)

如果檢驗模型的擬合效果不佳,則需要調整模型參數a和u進行殘差修正,重新建立G(1,1)模型。如果兩者擬合效果較好,則該預測模型可進行外推病情預測,外推公式為

(11)
決策樹可以表達成IF-THEN的規則形式,從根節點到每一個葉節點的路徑都可以生成一條分類規則。路徑上的各個屬性值由AND相連構成IF部分,表示判斷條件;每個葉子節點構成THEN部分,表示所屬的具體分類。IF-THEN規則形成的分類比較簡單、易于理解。根據如圖3所示的決策樹模型,式(12)即表示其中一個具體規則。
IF 性別=男 AND 季節=春季 AND 是否預后=
是 AND 濃度<1.6 mg/L
THEN 結果=CRP濃度正常
(12)
將查找到的焦作市人民醫院2013年8月—2014年12月的CRP檢測數據作為測試集,對該決策樹模型進行評估,由評估結果發現測試集的準確率為88.45%,符合診斷要求,因此可利用該決策樹模型進行病情診斷。
選取焦作市人民醫院2014年某段時間連續7天的CRP濃度數據建立灰色預測模型,并校驗模型的擬合效果。若擬合效果符合要求,則利用該模型外推預測之后2天的CRP濃度,并與這2天的實際檢測值作比較。表1為2014年某連續9天的CRP濃度值。

表1 2014年某連續9天的CRP濃度值
根據前文的病情預測算法,設置實驗步驟如下:
1) 根據前7天的數據建立灰色預測模型G(1,1)模型,求得模型參數a=-0.012,u=1.840 6,代入式(8)求得G(1,1)模型為
(13)

表2 CRP濃度實際值與預測值


表3 預測精度檢驗等級劃分
4) 根據式(11)做外推預測,得到后面2天的預測值,并與實際值進行比較。作卡方檢驗,求得對應的顯著性差異水平P,如表4所示為預測檢驗結果。

表4 CRP濃度實際值與預測值檢驗結果
由表(4)中第8天和第9天的檢驗結果P值可知,CRP濃度的實際值與預測值無顯著性差異,表明預測模型的結果是準確的。
家用血液檢測服務系統包括家用血液檢測設備和軟件系統,其中軟件系統的上位機部分包含診斷與預測算法。本文在充分考慮C反應蛋白濃度各個影響因素的前提下,設計了以決策樹模型為基礎的病情診斷算法和以灰色預測模型為基礎的病情預測算法。對兩種算法的實驗結果表明,病情診斷算法的準確度達到了系統的設計標準,同時病情預測算法的擬合效果佳,兩種算法均符合系統要求,表明家用血液檢測服務系統的診斷與預測算法具有一定的實用意義,可為有效輔助心腦血管疾病的醫學治療提供參考。
[1] 李小毓.超敏C反應蛋白檢測對心腦血管病診斷的臨床意義[J].國際檢驗醫學雜志,2014,35(15):2092-2093.
[2] 丁嬌.CRP、尿微量白蛋白與血脂聯合檢測對心血管疾病早期診斷的臨床價值分析[J].中西醫結合心血管病電子雜志,2017,5(13):49,52.
[3] 白彩娟,吉尚戎.C-反應蛋白研究進展及熱點爭議[J].蘭州大學學報(自然科學版),2013,49(3):361-369,376.
[4] ZHYDKOV A,CHRIST-CRAIN M,THOMANN R,et al.Utility of procalcitonin,C-reactive protein and white blood cells alone and in combination for the prediction of clinical outcomes in community-acquired pneumonia[J].Clinical Chemistry & Laboratory Medicine,2015,53(4):559-66.
[5] 趙紫奉,李韶斌,孔抗美.基于決策樹算法的疾病診斷分析[J].中國衛生信息管理雜志,2011,8(5):67-69.
[6] SHEMESH T,ROWLEY K G,JENKINS A J,et al.C-reactive protein concentrations are very high and more stable over time than the traditional vascular risk factors total cholesterol and systolic blood pressure in an Australian aboriginal cohort.[J].Clinical Chemistry,2009,55(2):336.
[7] CHIRIBOGA D E,MA Y,LI W,et al.Seasonal and sex variation of high-sensitivity C-reactive protein in healthy adults:a longitudinal study[J].Clinical Chemistry,2009,55(2):313-21.
[8] RüCKERL R,PETERS A,KHUSEYINOVA N,et al.Determinants of the acute-phase protein C-reactive protein in myocardial infarction survivors:the role of comorbidities and environmental factors[J].Clinical Chemistry,2009,55(2):322.
[9] 孫亞超,鄭海軍.C-反應蛋白檢測在心血管疾病檢測中的作用[J].中西醫結合心血管病電子雜志,2015,3(6):92-93.
[10] 周霞,邱宏,王鵬.灰色預測建模方法及在醫學中的應用[J].數理醫藥學雜志,2007(1):73-75.
[11] 虞亞平.灰色關聯、聚類、預測的研究及其在醫學方面的應用[D].南通:南通大學,2009.
[12] 李論.基于灰色預測模型的我國心腦血管疾病死亡率預測[J].現代電子技術,2015,38(11):107-111.
[13] 周脈耕,楊功煥.灰色數列GM(1,1)模型在心腦血管疾病死亡預測中的應用[J].中國公共衛生,2002(5):117-119.