沈 藍, 浦同青, 周志聰, 陸春梅, 鄧學林, 謝 好, 陳朝明
(云南省滇南中心醫院/紅河州第一人民醫院, 1. 急診醫學部, 2. 重癥醫學科, 云南 蒙自, 661199)
據統計,全球范圍內中老年人群骨質疏松性骨折具有4個特征,即高發病率、高致殘率、高致死率、高醫療費。但國內流行病學研究[1]發現,包括老年骨質疏松性骨折在內的骨骼疾病診療依舊處于低診斷率、低治療率、低治療依從性和低規范性的狀態。而隨著醫療大數據技術概念的提出與實踐,越來越多的研究[2-3]證實,由于老年骨質疏松性骨折有其自身特殊性,以科學、合理的方式對老年骨質疏松性骨折的院前急救的結構、過程及結果的相關指標進行針對性分類研究已迫在眉睫,有其現實意義與價值。但需注意的是,運用現代數理模型對醫療大數據下的老年骨質疏松性骨折院前急救的結構、過程、結果指標分類的多學科交叉研究卻鮮有涉獵,本文以醫療大數據為背景,構建該病院前急救分類模型并驗證,現報告如下。
K-means算法判定包括3項,一是目標函數,二是歐幾里得距離,三是誤差的平方和(SSR)。基本步驟包括:首先隨機選取K個對象,將每個對象視作一個聚類質心,按就近原則將對象與各聚類質心之間的距離進行匹配并分配至相近聚類子集中;其次,對每個聚類中心的質心進行計算并命名為新質心[4];第3步為重復前2個操作流程,直至獲取穩定,不再變化準則下的函數。故按本文研究目標設醫療大數據下的結構、過程、結果指標分類要素定義為一個含n個點的d維數據集,即D={χ1,χ2Λ,χn}, 聚類分析后所產生的類別集合C={C1,C2,C3, …,Cm}的一個數據集,故可將院前急救的K-means算法的目標函數SSE的公式表示如下:
(1)

(2)
該目標函數中,第j個簇類的中心點為cj=(cj1,cj2,cj3, …,cjd), 含有d個不同屬性。在此可獲3個定義函數:

(3)

(4)

(5)
(3)中的dis(χi,cj)表示χi和ci之間歐幾里得距離; (4)中的cj表示同一簇類的中心點,同一簇類?j中數據的個數為N(?j)。
通常而言,K-means算法的最終目的主要是為了找到最小化的SSE聚類結果,最優解。但從最終結果來看,其操作更為簡單易懂、操作方便,因此應用范圍較為廣泛。簡而言之, K-means算法利用迭代方式對聚類結果進行更新的過程,其實就是將SSE最小化的過程。
但需注意的是,雖然K-means算法的可伸縮性很強,但若處理不當也會影響最終的聚類結果的準確性。故如表1所示,進行數據處理時必須嚴格按照其操作步驟推進。在此過程中,還需注意以下問題:一是評估各數據的分類屬性,因為K-means算法對具有分類屬性的數據無法處理; 二是K-means算法對初始中心點的選擇極敏感,操作不當可能影響聚類結果; 三是K-means算法對噪聲點和離群點同樣敏感,故應減少上述潛在或已在干擾因素。

表1 K均值算法的操作步驟
為建立一套科學、合理、系統且敏感基于醫療大數據的老年骨質疏松性骨折院前急救的中醫證候要素分類評估質量指標,為老年骨質疏松性骨折的院前急救與臨床治療提供參考借鑒依據,還需在K-means算法的基礎上按院前急救的結構-過程-結果理論構建DeepFM預測模型。DeepFM預測模型主要由深度神經網絡(DNN)和因子分解機(FM)2個組件構成[5-6], 有極強的交互性,即將FM和深度學習整合在一個新的神經網絡體系結構過程。見圖1。

圖1 DeepFM預測模型總體結構
院前急救作為院外對危重癥老年骨質疏松性骨折患者進行急救的最有效的方法之一,其帶有很強的隨機性和流動性,因此對院前急救進行針對的分類處理極有必要。故本文將按Donabedian結構-過程-結果理論[7-8]將文中的院前急救情況分成結構指標、過程指標和結果指標,其中結構指標主要包括物質、人力資源和組織結構3類,過程指標是指醫患、醫護、護患之間相互作用的過程,結果指標則為經過院前急救服務后結果,含危重癥老年骨質疏松性骨折患者滿意度。接著構建DeepFM預測模型,如圖1所示, DeepFM包括FM和DNN 2個部分,所以該模型的初始輸入與最終輸出也只可能由這2個部分構成。其中,該模型的一階線性交互的特征構成情況主要集中在FM組件學習系統,且建模特征之間也存在二階交互現象。與此同時, DNN對特征之間的交互作用主要表現為高階性。故FM和DNN 2個組件的輸出共同構成DeepFM預測模型。
(6)
即將FM的輸出與DNN的輸出結合起來,共同構成最終結果預測,故可得FM、DNN組件的數學公式:

(7)
公式(7)的一階特征權重主要反映在加法單元中,二階特征交互的影響主要反映在內積單元中。第1層的輸出、權重及偏差分別由a(1)、W(1)和b(1)表示,而H表示隱藏層的數量。結合既往研究來看,由于Donabedian結構-過程-結果理論中的3個指標之間有顯著的高階交互性,便可根據上述公式繪制老年骨質疏松性骨折中醫證候要素分類的訓練權重過程圖。
圖2顯示,在老年骨質疏松性骨折中醫證候要素分類的DeepFM預測模型訓練權重過程中,其特征主要表現為由輸入特征向量向輸出特征過度,通過計算實際輸出與理想輸出之間的差距不難發現,老年骨質疏松性骨折院前急救指標的最佳預測結果參數優化結果均在調整層與層之間的權值后方。

圖2 老年骨質疏松性骨折院前急救分類預測模型訓練權重過程
本研究的德爾菲專家函授小組成立原則均滿足代表性、權威性。職稱構成: 主任醫師、護師各1名,副主任醫師、護師各7名,主管護師9名,急診科護士4名,其中三甲、三乙、二甲醫院各21名(72.41%)、5名(17.24%)、3名(10.34%)。專家納入標準: 根據院前急救的研究目的、對象及德菲爾法特點制訂,包括醫院級別、醫院類型各為三甲、三乙、二甲醫院,綜合醫院或專科醫院,且具有主管護師、副主任醫師、護師及以上職稱,對研究有高度積極性和自愿參與函授,護士均滿足5年以上的急診護理工作要求。以專家權威程度[(判斷依據+熟悉程度)/2]表示專家意見權威程度,決定因素由專家打分判斷依據(Ca)和專家對評估內容熟悉程度(Cs)構成,影響程度包括大、中、小3個方面(判斷依據與對專家判斷的影響程度如表2所示),專家系數程度量化值(自評)分為很熟悉、熟悉、一般、不熟悉和很不熟悉5類,量化值分別為1.0、0.8、0.6、0.4、0.2。檢驗水準α=0.05。根據專家入選標準與德爾菲法的相關要求綜合評估后證實,文中各指標條目重要性、數據收集可操作性、計算方法合理性均達標,保留項目的重要度評分均≥4分,且變異系數<0.3(≥0.3則刪除或修改)。

表2 判斷依據對專家判斷的影響程度
建立Excel 2007數據庫后,將所有老年骨質疏松性骨折的各項基線資料與研究數據納入SPSS 21.0軟件處理,專家基本信息采用頻數、構成比等進行描述,指標賦值采用均數、標準差、變異函數等描述。專家提出的意見協調系數用W表示,W>0~<1,W越大,意見協調度越高,檢驗效果越好。
經第1輪函詢篩選(24項,即B01~B24)及修改后最終獲得符合院前急救分類項目(第2輪函詢)21項(B01~B21)。老年骨質疏松性骨折院前急救分類項目的指標類型、權重、編號、指標名稱及指標重要性、計算方法合理性、數據采集可操作性的變異系數(CV)、權重、組合權重、權重排序等見表3。

表3 第2輪函詢及權重計算結果統計
結合表3和圖3來看,將結構指標(B01、B02、B03、B04、B05)、過程指標(B06、B07、B08、B09、B10、B11、B12)和結果指標(B13、B14、B15、B16、B17、B18、B19、B20、B21)作為老年骨質疏松性骨折院前急救分類指標是可行的。其中各指標重要性的CV值在0.05~0.24, 計算方法合理性的CV值在0.07~0.25, 數據采集可操作性的CV值在0.06~0.25, CV值均<0.3。
接著按層次分析法的操作步驟與要求將老年骨質疏松性骨折院前急救分類指標中的結構指標、過程指標、結果指標進行權重矩陣構建。假設某一維度中任意2項指標賦值均數分別為Zij、Zik, 且Saaty標度=3、5、7、9時,依次滿足Zij-Zik≥0.25~≤0.50,Zij-Zik≥0.75~≤1.00,Zij-Zik≥1.25~≤1.50和1.75 圖4顯示,經最后的矩陣分析發現,結構指標、過程指標、結果指標的一級指標中的各維度的權重分別為0.332 4、0.139 5、0.527 6, 各矩陣的一致性檢驗結果(CR)值均<0.1, 專家意見間的協調性好(CV和Kendall協調系數),其中結構、過程、結果指標各為0.034 5、0.039 4和0.039 5, 符合檢驗要求。 圖4 結構、過程、結果指標的判斷矩陣 醫療大數據所涉及的范圍相對寬泛,如疾病患者基本信息、疾病主訴、檢驗數據、影像數據、診斷數據、治療數據等[8]。但由于其尚屬探索階段,針對某種疾病的醫療大數據應用仍有諸多需要完善之處。因此應用現代數理模型提取基于醫療大數據下的老年骨質疏松性骨折院前急救的結構指標、過程指標、結果指標分類要素,并進行多學科交叉分類優化研究,分析其相關特征非常必要。 戴明環(PDCA)管理理論自引入臨床醫學以來,已被廣泛地應用于醫院質量管理的各個領域,但隨著大數據技術的普及化,現代醫院中的醫務人員,尤其是醫生與護士在做決策的過程中,越來越重視“數據”的價值,而數據的運用對避免主治醫生、責任護士對疾病的主觀臆斷幫助極大[9]。因此,本研究在綜合既往研究的基礎上采用K-means算法、DeepFM預測理論與層次分析法,將老年骨質疏松性骨折院前急救過程中存在的結構、過程、結果指標進行了定性、定量處理并最終達到分類優化的目的。首先,結構指標主要包括物質、人力資源和組織結構3類,過程指標是指醫患、醫護、護患之間相互作用的過程,結果指標則為經過院前急救服務后結果,含危重癥老年骨質疏松性骨折患者滿意度;再次,構建DeepFM預測模型,發現老年骨質疏松性骨折院前急救指標的最佳預測結果參數優化結果均在調整層與層之間的權值后方。為進一步優化老年骨質疏松性骨折院前急救過程中各指標的權值大小,進一步采用德爾菲專家函授小組評估各指標條目重要性、數據收集可操作性、計算方法的合理性,并得到意見協調系數,進而得到老年骨質疏松性骨折院前急救分類項目的指標類型、權重、編號、指標名稱及指標重要性、計算方法合理性、數據采集可操作性的變異系數、權重、組合權重、權重排序等,根據相關指標和相關權重系數最終達到分類優化的目的。 本研究最終構建了院前急救的結構-過程-結果3個層級(21項指標,即B01~B05、B06~B12、B13~B21)并對其進行了驗證,其中B01、B02、B03、B04和B05等5項指標均較好地契合了Donabesian結構-過程-結果理論中的人力資源、物質資源和組織結構理論中的相關管理理念,其中B03、B04的組合權重分別為0.121 7、0.084 5, 權重排序分別位于結構指標的前2位,說明專家們認為在老年骨質疏松性骨折院前急救過程中急救儀器和急救藥品的有效性對該病的搶救成功與否有極其重要的影響,能提高院前急救工作效率與搶救成功率,這與郭劍等[10]研究結果相近。而從文中整體結構來看,結構指標中的5個指標的整體權重排高于過程指標,低于結果指標而排在第2位。但考慮到目前中國現代臨床醫學正在向國際醫學邁進并與之接軌的趨勢,故雖然在老年骨質疏松性骨折院前急救全過程中依據強調和注重結果,但結構指標依舊不容忽視,因此需有效監測。同理,本研究中B06、B07、B08、B09、B10、B11、B12這7個過程指標整體的權重為0.139 5, 顯著低于結構指標與結果指標。這種現象出現的根本原因與當前院前急救整體現狀及自身特點密切相關[11-13], 包括老年骨質疏松性骨折在內的危重癥疾病的院前急救全過程,均存在顯著的急救現場情況不穩定、病因復雜、病種呈多樣性及疾病發展速度快等特征,因此導致過程指標并不能實現對院前急救全過程、全方位的監測、檢測覆蓋[14-15]。針對此,本研究在進行過程指標選擇方面,主要以質量控制為重點。而通過比較文中的結果指標來看, B13、B14、B15、B16、B17、B18、B19、B20、B21這9個指標中權重排名第1位的是老年骨質疏松性骨折患者滿意度(B21), 即0.222 5, 矩陣分析中的權重為0.527 6, 顯然這與當前大力推行的“以患者為中心”的院前急救及相關護理理念相吻合。為達到更科學、合理的評估效果,本研究還將患者家屬的滿意度調查也納入其中,效果較好。在結果指標中權重排名第2位的是急救現場靜脈通道建立成功率(B13), 即0.178 5。說明對于危重癥老年骨質疏松性骨折患者而言,其院前急救的重要任務之一就是給患者建立急救現場靜脈通道,最大限度爭取搶救成功率。還需注意,結果指標中數量最多的為不良事件監測,對這些指標進行針對性監測,是制訂和實施院內診療措施的關鍵環節之一,故應將其作為重點監測。另外,從文中模型實際應用來看,在近些年的各項研究中均有所涉及,如慢性心力衰竭臨床護理路徑構建[16]、醫院臨床路徑藥學評價體系構建[14]、腫瘤影像[17]、電子病歷[18]等均證實K-means算法與層次分析法在臨床醫學應用中均有較高的可信度與可行性。同時,鄭帥等[19]發現,與傳統模糊K-means算法和基于減法聚類的FCM算法相比,基于均衡分配法的模糊K-means算法的迭代時間分別降低了26.0%和70.0%, 迭代次數各降33.0%和82.0%, 數據聚類效率與質量提高更明顯。但將K-means算法、DeepFM預測理論與層次分析法應用于醫療大數據下的老年骨質疏松性骨折院前急救的結構、過程、結果指標分類要素的探究乃首次,能更準確地為不平衡數據中的簇類學習[20-22]提供更廣闊的軟子空間,幫助老年骨質疏松性骨折患者提供更好的圍術期決策支持[23-25], 所達效果與預期吻合,有探索與應用價值。但其是否能真正在骨質疏松性骨折院前急救的實際過程中普及與推廣,仍有待更多的研究數據與實踐理論佐證。 綜上所述,隨著數據庫技術和計算機通訊技術的良性發展,醫療大數據在危重癥老年骨質疏松性骨折患者的院前急救過程中必然發揮更大的價值,而對院前急救的結構、過程、結果指標進行分類研究,對科學、合理地制訂院內診斷計劃、治療方案均可提供更系統的大規模、高增速、多結構、高價值和真實準確的的診療數據集合。本研究證實,以醫療大數據為基礎,采用K-means算法、DeepFM預測理論與層次分析法對老年骨質疏松性骨折患者的院前急救指標進行分類處理可行,可為該病后期診療提供理論依據,但將其標準化、格式化、統一性仍是未來研究的重點,是將其價值最大化的前提。
3 討 論