張宇 武警北京總隊第二醫院信息科
得益于信息與計算機技術的飛速發展,醫院信息化不斷完善和進步,數字化對于醫院而言已不陌生。各家醫院普遍采用數據庫技術以及網絡技術來處理醫院的日常工作和管理。醫院信息系統(Hospital Information System,簡稱HIS)的采用,使得醫院的業務工作更加高效、快捷、準確,提高了醫院的醫療和管理水平。但隨著醫院信息化技術的深入發展,針對現有的業務和管理工作,HIS的發展遇到了瓶頸。就目前的HIS應用,還限于對日常業務數據的采集、存儲、查詢等初級階段,并沒有實現對歷史數據的篩選、整合和分析,數據中隱含的有價值的信息不能被發現并加以利用。如何讓歷史數據不成為“歷史”,重新發揮作用,是醫院“后信息化時代”要解決的主要問題。
系統分析是根據用戶感興趣的問題確定主題,主題就是需要通過數據倉庫來解決的問題,也是在構建數據倉庫時將數據歸類的基本依據。此處簡單分析兩個主題,以此為例,其他主題均可照此例進行。分別是門診掛號工作量主題和門診費用情況主題。
1.門診掛號工作量
門診掛號是病人來院就診的第一行為,它所產生的信息相對較少,但是信息相對完整。對門診掛號數據進行分析,從門診科室,病人費別,掛號類別,掛號員等不同角度對掛號人次,掛號費用等數據重新歸納總結,可以得到不同科室的接診情況,各種費別患者的就診情況以及掛號員的工作量等數據,從而可以了解醫院門診的運行情況,進而對門診醫療資源的優化調整提供數據參考。
2.門診費用情況
門診收費是門診的主要業務之一,它直接反應醫院門診的收入情況。通過對門診收費數據的分析,從門診科室,病人費別,收費類別,收費員等角度對門診費用進行歸納總結,可以得到門診科室的收入情況,各種費別患者的門診費用統計以及各種收費類別的費用統計等數據。對了解門診各科室的業務開展狀況有指導作用,還可以分析出不同費別病人在醫院的消費情況。
1.概念模型設計
數據倉庫的開發人員可以在數據倉庫開發之前通過數據倉庫的需求分析,了解數據倉庫用戶的大致需求。這樣,就可以界定一個數據倉庫的大致系統邊界,集中精力進行主要部分的開發。因而,界定邊界的工作也可看作是數據倉庫系統的概念模型設計。概念模型設計的主要工作就是確定主題域及其相關內容。本文中我們通過需求分析得到兩個主題域,門診掛號主題域和門診收費主題域。
2.邏輯模型設計
數據倉庫的邏輯模型通常采用星形模型和雪花模型,在本案中我們采用的是星形模型。邏輯模型設計包括維度設計以及度量值設計。
(1)維度設計
維度是描述事實表中數據級別的有組織的層次結構,維度的創建需要根據具體問題進行分析確定。例如:構建病人掛號記錄的多維數據集后,我們可以通過日期維度統計每日就診人次,也可以通過科室維度統計各科室接診人次,再或者通過掛號員維度統計掛號員的工作量。另外,按照使用方式來分,維度可以分為“共享維度”和“專用維度”。“共享維度”可在多個數據集中使用,避免了重復創建,節約了存儲空間和創建時間,專用維度是為個別數據集專門使用的維度。本文涉及的數據倉庫模型的主要維度如下:
①日期維:日期維屬于共享維,是數據倉庫中必備的維度,因為對數據倉庫的操作通常要加入時間段,否則統計數據將失去意義。根據一般使用需要將時間維分為四個層次:年→季度→月→日。
②科室維:屬于共享維,維表中記錄全院科室名稱及代碼。從HIS數據庫中科室字典中獲取。
③費別維:屬于共享維,在統計醫療數據時通常會區分病人的費別,從而有效的對不同類別的病人信息進行分類匯總。費別一般包括“自費”、“免費”、“醫療保險”、“公費”等,從HIS數據庫中費別字典中獲取。
④工作人員維:包括掛號員維和收費員維,因為這兩個維表的數據均取自HIS數據庫中人員字典,所以實際上是一個共享維。
⑤收費分類維:門診收費專用維度,對費用進行分類的依據,數據取自HIS數據庫中收費類別字典。
⑥掛號類別維:門診掛號專用維度,對掛號類別進行分類的依據,數據取自HIS數據庫中號類字典。
(2)度量值設計
度量值是多維數據集事實表中的一列或多列數值,是多維數據集最終要計算并顯示的結果,供用戶瀏覽查詢。數據類型一般為數值型,通常是對數據集中的某一列或幾列求和、計數、取平均值等計算。度量值是用戶通過數據倉庫最終要獲取的信息。例如門診掛號度量值有掛號人次計數和掛號費用求和,門診收費度量值有當日次均費用等。
將HIS數據庫中數據通過ETL導入SQLServer數據庫中。以門診掛號為例,科室、用戶、掛號分類由HIS數據庫導入到SQLServer數據庫中,時間表由SQL語句生成。基礎數據準備完畢后,利用SQLServer的Analysis Services組件,建立Analysis Services項目,設計數據源視圖,以及數據倉庫的維度及度量值。最后設計數據立方體并部署Analysis Services項目,生成可瀏覽的多維數據集。
前面我們通過對數據倉庫的設計與構建,最終得到了關于主題的多維數據集。但是對于用戶而言,多維數據集本身并不適合瀏覽與分析,通過SQLServer的報表服務器可以將數據以友好的形式展示給用戶。報表服務器,是商業智能報表產品的重要組成部分,主要功能是提供報表資源管理,用戶身份與權限管理,任務調度,信息分發等。報表服務器管理的報表資源主要包括數據庫元數據,報表模版,報表輸出結果等。另外報表不僅可以以表格的形式顯示,還可以以圖表的形式進行顯示,如餅狀圖、柱狀圖等形式,在表現方式上更友好、更直觀。
本文主要闡述了數據倉庫技術在醫院管理中的應用。伴隨著大數據時代的來臨,對于陳舊歷史數據的整合與應用越來越多的成為人們關注的焦點,這也是本文的研究背景。通過對數據倉庫技術的研究以及對數據倉庫構建的具體實施,初步掌握了數據倉庫的開發技術與實施方法。結合醫院歷史數據所構建的兩個簡單實例,為以后構建更復雜的數據倉庫,開發決策支持系統奠定了基礎。數據倉庫技術對數據的整合及再利用,提供多維度、多角度、多層次觀察數據的方式,為信息技術帶來了新的革命。以往的業務數據分散零碎,沒有關聯,為了得到某一數據往往需要進行多張數據表的查詢,而且一旦查詢主題改變,又要反復查詢工作,數據倉庫技術極好的解決了這些問題。
[1]Jamie Mac Lennan,Zhao Hui Tang,Bogdan Crivat.董艷,程文俊譯.數據挖掘原理與應用—SQL Server 2008數據庫[M].第2版.北京:清華大學出版社,2012.
[2]Erik Thomasen.朱建秋等譯.OLAP解決方案:創建多維信息系統[M].第2版.北京:電子工業出版社,2004.