魏學敏,黃 潔,康小強,孟皓宇,胡坤融
(1.景洪市第一人民醫院,云南 景洪 666100;2.云南盛時迪安生物科技有限公司,云南 昆明 650000;3.西南林業大學大數據與智能工程學院,云南 昆明 650000)
在檢驗標本的采集、傳輸、檢驗的過程中,標本質量控制是一個要重點關注的問題。本文主要討論通過對檢驗標本采集、檢驗標本傳輸、檢驗質量控制過程的中形成的數據,應用數據挖掘的分析方法,對檢驗標本質量進行管理。
檢驗標本采集前,病人的飲食情況、運動及情緒、體位、服藥情況等各方面都可能影響檢測結果的準確性;護士崗前技術培訓不到位、無采集規范標準、護士責任心缺乏等原因也會對導致檢驗標本質量不合格。
如圖1所示,在基于互聯網的云檢驗系統中,檢驗標本采集過程需要的數據可以及時錄入系統。在這些錄入系統的數據中,提取一些影響檢驗標本質量的關鍵數據項參與研究。

圖1 云檢驗系統中的檢驗標本采集
基層醫療機構采集標本后裝入智能標本箱,交由專業冷鏈物流運輸。智能標本箱密封性、防震性能好,且能依據檢驗標本目的和保存溫度不同進行設置,能較好地提高標本質量。智能標本箱在血液、疫苗、DNA等生物標本的小批量運送場景下,通過內置傳感器實時采集標本箱內生物標本的溫濕度、密封性、位置等數據,并實時上傳至云平臺。
如圖2所示,在基于互聯網的云檢驗系統中,能實時獲取到檢驗標本傳輸過程的數據,本研究提取在標本傳輸過程中影響檢驗標本質量的關鍵數據項參與研究,主要是標本傳遞時間和溫度。

圖2 云檢驗系統中檢驗標本運輸過程數據監控
在檢驗分析過程中,檢驗機構建立了室內質量控制(IQC)體系,檢驗人員按照一定的頻度連續測定穩定樣品中的特定組分,并采用一系列方法進行分析,按照統計學規律推斷和評價本批次測量結果的可靠程度,以此判斷檢驗報告是否可發出,及時發現并排除質量環節中的不滿意因素。
如圖3所示,在基于互聯網的云檢驗系統中,把檢驗機構的臨床實驗室質量體系運行監控與管理平臺也整合到系統中,本研究提取在檢驗分析中影響檢驗標本質量的關鍵數據項參與研究。

圖3 檢驗分析
作為一種利用患者標本檢測結果進行IQC的方法,其更加符合真實的實驗室情況,因此無基質效應、無互換性等問題;患者標本在不斷地被檢測,因此質控也可以持續地進行下去,甚至可以與患者的臨床狀態直接相關。精心設計的患者數據質控方法可以幫助臨床實驗室了解自己實驗室特定檢測項目的生物學和分析特性以及患者人群情況。
檢驗標本數據的質量控制數據挖掘方法設計的基本思路:通過已有的數據形成數據集,數據集包括兩部分內容,一部分是描述屬性,一個是分類屬性。分類屬性把檢驗數據分成兩類,達標的和不達標的。本研究通過建立樸素貝葉斯分類挖掘模型,然后對新產生的檢驗數據進行分類預測,如果模型分類預測結果為不達標,則對該標本的檢驗過程進行回溯,以達到質量控制的目的。
在檢驗標本采集階段,重點提取檢驗項目名稱、樣本類型、標本存放時間等作為描述屬性。數據項的采集不涉及病人的具體信息,達到了脫敏處理的效果,為了表示每一個檢驗項目,進行檢驗質量追蹤,記錄了檢驗條碼號。
在檢驗標本傳輸階段,重點通過提取標本傳輸時間、標本溫度這兩個數據項作為描述屬性。標本溫度在沒有異常值的情況下,選取傳輸時間段的平均溫度。
在標本檢驗階段,提取檢驗結果、檢驗參考值、異常提示三個數據項作為描述屬性。
通過前期的工作積累,把所有標本的檢驗數據按照上述提取的描述屬性構造一個數據集,同時納入檢驗質量符合要求的數據以及檢驗質量不符合要求的數據,并把數據分為檢驗質量達標和檢驗質量不達標兩類。構成數據集的基本形式如表1所示。

表1 檢驗質量數據集的數據構成
Microsoft Naive Bayes 算法是由 Microsoft SQL Serv er Analysis Services 提供的一種基于貝葉斯定理的分類算法,通過發現輸入列與可預測列之間的關系來進行預測性建模。對于可預測性變量的每個狀態,樸素貝葉斯算法會計算出輸入的每一個可能狀態的概率。然后可以利用這些概率對新的目標進行預測。由于該算法相當簡單,所以它構建模型非常快。
在本項目的研究中,提取的數據保存在SQLServer中,通過SQLServer的分析服務來構建樸素貝葉斯分類模型。操作步驟較多,僅描述主要的步驟如下。
(1)安裝配置好SQLServer的分析服務。
(2)按照3.1節設計的方法準備好的數據集。
(3)在SQL Server Data Tools中建立Microsoft Naiv e Bayes數據挖掘模型。
(4)通過建立的挖掘模型對新產生的檢驗數據進行分類預測。
(5)對分類預測結果為質量不達標的檢驗標本進行回溯處理,以提高檢驗質量。
在分級診療體系中,開展標本云檢驗可以使得農村和社區醫院分享到更先進的檢驗設備,患者也減少了路途的時間和經費開銷。但是檢驗標本需要采樣后保存一段時間,并經過冷鏈長距離運輸,可能會對檢驗質量產生影響,本文提出的基于樸素貝葉斯的檢驗樣本質量分類辦法可以幫助找出那些質量異常的檢驗樣本,可以達到保護患者權益、提高檢驗水平等效果,是一種值得推廣的方法。