巴武龍,楚治良,王 珊,孟曉東,吉 萍,趙 光
醫學實驗室信息管理系統(laboratory information management system,LIS)是利用計算機網絡技術和數據存儲、處理技術,快速高效地對醫學實驗室信息的采集、存貯、處理、傳輸、查詢和分析等全方位管理的計算機軟件系統[1]。近年來,隨著計算機網絡技術的飛速發展,越來越多的實驗室已經建立了自己的LIS 系統[2],并與醫院的醫院信息管理系統(hospital information system,HIS)、臨床信息系統(clinical information system,CIS)進行基于局域網的數據互通,使得檢驗科與臨床科室的信息傳遞更為流暢,并保證了數據的可追溯性,在醫院信息化的建設中發揮了非常重要的作用。
目前, 醫院的檢驗設備自動化程度越來越高,檢驗設備、LIS 系統和HIS 系統之間的信息交互是一個重要環節。 作為目前全球應用最廣泛的醫療信息交換標準——HL7 標準已經得到了醫療領域專家學者的認可[3]。 在 HL7 標準下,檢驗設備和 LIS系統通過LIS 接口實現信息的交互,LIS 系統和HIS系統再通過信息交互,從而實現院內信息資源的共享。 但是在實際工作中發現,有些醫院并不是所有的檢驗項目都實現了院內檢驗報告的在線共享,仍是以紙質版報告發送給患者或醫師。 調查發現,引起這類問題的原因主要有兩類。 一是,有些臨床實驗室, 只有由儀器公司提供的單一的數據處理軟件[4],而沒有LIS 接口。這類項目主要是一些高精新的檢驗項目,往往需手動編輯word 類報告,例如采用流式細胞儀進行白血病免疫分型檢驗等項目。 二是,在醫院信息化建設的過程中,系統之間的設計不可能一步到位,每一次的設備更換或升級都意味著需要設備廠家和軟件公司、 醫院LIS 接口工程師共同協商解決,這就需要三方投入較大的人力物力財力成本[5]。 有些醫院出于各種原因的考慮而沒有將這些檢驗項目接入到LIS 系統,也就無法實現院內數據共享。
針對上述問題,該研究嘗試利用電子文檔提取技術,對檢驗實驗室生成的電子報告進行關鍵信息提取,并以MTV(Model template view)模式構架網站以實現檢驗報告院內局域網在線瀏覽,以期開發出一種技術簡單、開發迅速、人力財力成本低的院內報告在線瀏覽系統。
1.1 服務器端 由于本系統針對的主要是一些沒有接入LIS 系統的報告,此類報告一般占醫院所有報告的比例較小, 并且經過對系統的優化處理,系統所需計算機資源較小,故所需硬件要求不高,CPU i3 及以上處理器、4G 及以上內存即可保證系統運行流暢。 用于存儲的硬盤越大越好,方便以后的報告存檔。 操作系統為Windows 7 及以上版本操作系統。 采用輕量級 Apache 2.4 作為應用服務器,Mysql 5.7 作為后臺數據庫。選擇Pycharm 作為開發工具, 以Bootstrap 作為前端界面主要開發技術,以Django 作為整體框架。 Django 是一種遵循 MVC(Model view controller) 模式的框架, 然而,Django采用的MVC 模式與傳統意義上的MVC 模式有所不同[6]。 Django 整個框架分為模型(Model)、 模板(Template)和視圖(View)三部分。 該研究中模型Model 為數據存取層, 根據不同檢驗項目設置不同的數據庫用于存取數據; 模板Template 為表現層,處理與表現相關的決定,根據不同檢驗項目設置檢驗項目顯示模板;視圖View 為業務邏輯層,用于設計存儲數據及調取適當模板兩種操作之間的邏輯關系。 從而實現以數據庫驅動前端來進行檢驗報告的在線瀏覽。 Bootstrap 是基于 HTML、CSS、JavaScript的前端框架,它簡潔靈活,使得Web 開發更加快捷。系統設計如圖1 所示。

圖1 系統設計
1.2 客戶端 該系統基于B/S 模式,無須安裝特定軟件, 僅需客戶端能夠流暢運行谷歌等瀏覽器即可。
該研究目的在于驗證將未能接入LIS 系統的檢驗報告通過電子文檔提取技術實現院內局域網在線瀏覽這一方案是否可行,故基本業務流程主要設計為四部分:(1)檢驗電子報告生成;(2)電子報告上傳;(3)檢驗報告審核及檢驗報告發布。 實際檢驗工作中仍需遵循醫學檢驗標準。 該研究所述基本業務流程設計圖見圖2。

圖2 基本業務流程設計圖
在利用電子文檔提取技術對醫學檢驗電子報告進行提取的關鍵步驟中,如何簡便正確地提取決定了系統的開發和維護成本。 醫學檢驗項目都有明確的目的性,即要確定某項指標的具體數值或性狀等,從而為疾病的診斷提供依據。 在此基礎上,檢驗技師出具相關的檢驗電子報告通常具有比較嚴謹的邏輯性,這為電子文檔提取技術的應用提供了可能。 例如針對Word 電子報告,可利用Python 第三方庫docx,非常簡便有效地提取出所需數據。 以運用流式細胞儀進行白血病免疫分型檢測為例,檢驗人員所出具的電子報告有如下描述:(1)初篩管。 B系標志:CD19=54.7%和CD10=0.09%;T 細胞標志:CD7=2.13% ; 髓 系 標 志 :CD33=96.28% (+ ) 和CD117=93.24%(++); 早 期 標 志 :CD34=94.98%(++)。 (2) 髓系檢測。 CD9=2.63%(+);HLA-DR=97.82%(+++);CD123=94.87%(+); CD13=95.13%(+);CD16=0.44%;CD38=97.91%(+);CD14=1.29%;CD56=7.6%;CD64=3.26%;CD11b=5.09%; CD2 =0.44%。 (3) 胞內標記。 cCD3=0.3%(T 淋巴細胞);cMPO=98.3%(+)(髓系標志);cCD79a=4.1%(B 淋巴細胞)。(4)參考意見。總體印象(CD45/SSC):幼稚細胞占總細胞數58%, 單核細胞占總細胞數55.1%,其他各系比例降低。 幼稚細胞門細胞大量表達CD13、CD33、HLA-DR、CD123、CD38、cMPO、CD117、CD34;結合骨髓象,考慮AML-M5。
針對上述報告, 可用如下幾行代碼完成提取,見圖3。

圖3 示例代碼
上述代碼分類提取出初篩管、髓系檢測、胞內標記和參考意見四個段落中的內容,下一步可將上述內容存入數據庫以方便醫師調閱報告。 相同方法可根據實際需要分別對前三個段落中對應CD 分子所占比例進行提取, 并將提取內容存入數據庫,方便以后調用或對比。 對于含有圖片和表格的Word報告,也可用類似方式進行提取。
在筆者醫院的實際運行過程中,該系統較好地實現了預期目的, 使個別沒有納入Lis 系統的報告實現了在線瀏覽,解決了信息孤島問題,提高了該院的數據共享程度。
通過該研究的方法和思路,可以實現醫院未接入LIS 系統的檢驗報告在線瀏覽,同時由于該系統所提取出的報告數據, 實時存入數據庫中, 為HIS系統與該系統之間的數據交互提供了可能,進而解決了“信息孤島”問題,有效提升了醫院信息的全面共享程度。 該研究所表述的利用Python 第三方包docx 對Word 版電子報告進行檢驗內容提取, 所需代碼數量少,開發簡單。 以Django 框架架構的網站相比其他系統架構也具有更加簡便快捷的開發形式。 上述便利條件使得該院信息科技術人員可以快速開發并靈活升級系統。
當然,該系統也有不足之處。 Django 框架的并發性有待進一步優化, 如何優化系統的并發性,將是下一步的研究目標。 另外,不同醫院的同一檢驗項目的電子報告模板可能不同,需要針對不同的模板設置不同的提取模塊。 統一報告模板后,將大大增加系統的通用性。
綜上所述, 該系統的開發具有方便快捷的特點, 可快速實現未納入Lis 系統的檢驗報告的院內局域網在線瀏覽,方便臨床同時降低成本,可作為LIS 系統的一種補充。 該研究所述系統《不依賴LIS接口的醫院報告在線瀏覽系統》(軟著登字第5132460 號)已經獲得軟件著作版權,同時部分相關源代碼已經以apache 2.0 協議進行了開源,用以方便其他醫院以此為模板便捷地開發自己醫院的系統,以期發揮更好的社會效益和經濟效益。