趙丹陽/遼寧大學歷史學院
姚 健/沈陽醫學院附屬第二醫院心血管中心
病案是我國檔案資源的重要組成部分,是進行醫療、教學和科研的第一手材料。隨著電子病案的普及和大數據時代的來臨,如何打破病案存儲條塊分割的現狀,實現資源的廣泛整合,使病案大數據成為推動醫學進步的不竭信息源,為檔案學大數據研究提供扎實的落腳點,成為檔案界和醫學界共同面對的重要課題。構建病案大數據信息共享平臺,是實現這一目標的有效途徑。
病案大數據這一概念有廣義和狹義之分,廣義上的概念指大數據中的病案數據,即大數據中具有病案屬性的全部數據,如住院患者每日費用清單等;狹義上的概念指病案中的大數據,即一定時空范圍內所有(不論其來源、保管期限、載體、結構等的差異)病案數據的集合,如同一患者在不同醫院生成的病案集合或有關某種疾病的全部病案集合。病案大數據的概念與新來源觀“將某種職能、目的、活動、形成過程視為來源”[1]的思想具有一致性,也符合大數據時代將某主題相關信息資源最大化整合的要求。對這一概念的理解,有助于打破原先條塊分割式的病案管理體系,也為病案大數據資源共享平臺的建設奠定理論基礎。
傳統的病案指“關于患者在接受醫療期間所有過程情節的書面記錄與文件”[2],如門診記錄、護理記錄、檢驗記錄、復健記錄等。而病案大數據的概念豐富了傳統病案的內涵、擴大了傳統病案的外延,也使得病案大數據的資源類型得到了拓展。首先是病案數據。包括傳統病案所包含的各種數據和信息,此外還要求在大數據環境下對這些信息按照主題(如某種病癥)或來源(如某位病患或某個地區)進行聚類,而非分散孤立地存儲。此類數據構成了病案大數據的主體部分和關鍵內容。
其次是病案利用與管理數據。除了傳統的病案數據外,病案大數據同樣關注醫護人員、醫院管理者、患者、研究人員等利用主體展開病案利用活動或病案管理者在各種管理活動中形成、積累的新數據或信息,此類數據對于病案大數據的科學管理、安全存儲和利用服務至關重要。
再次是病患背景數據。指記錄病患入院前的生活習慣、飲食習慣的數據和治療結束后跟蹤獲取的反映病患健康情況的數據等,對臨床診療、醫學研究極具參考價值。雖然傳統環境下對此類數據的重視程度比較低,但大數據及其相關技術的出現,使得獲取和利用此類數據成為可能,能夠為醫療實踐和醫學研究提供更加精準和全面的信息保障。
平臺的建設必須以需求為導向,才能保證其實踐應用價值。為此,筆者對沈陽醫學院附屬第二醫院的醫護人員、管理人員、病案管理人員等進行了問卷調查與深度訪談,將他們對平臺功能的需求加以匯總,發現需求度最高的為安全存儲(90.2%)、虛擬整合(84.8%)、深度挖掘(81.3%)和無縫互聯(77.6%)。為滿足這些功能需求,大數據資源共享平臺建設可采用如下體系架構(如圖1)。

圖1:大數據資源共享平臺體系架構
本層重點關注病案大數據真實性、保密性和長期可讀性的維持。一是病案大數據的真實性與保密性。保障真實性是檔案管理的普遍要求,由于病案數據包含的個人隱私類信息密度更高,又具有對保密性的重點要求,所以平臺作為可信賴的病案資源管理系統必須綜合運用先進的技術手段,建立分級管理與訪問控制機制,確保病案大數據在進入系統后不被篡改、竊取或遺失。
二是病案大數據的長期可用性。資源的長期可用是共享及開發利用的基礎保障。為了實現長期可用的目標,在物理層面上平臺需制定完備的遷移或仿真策略,防止軟硬件環境發生變化對病案大數據可用性帶來負面影響;在語義層面上需要成熟的封裝策略,使病案大數據信息能夠被正確理解。
對相關資源進行廣泛整合是平臺的首要任務。本層負責對病案大數據的各類異構資源進行虛擬化,以屏蔽底層資源的異構性,并將病案大數據資源進一步抽象為各類服務,從而為用戶利用提供支持。一是病案大數據信息資源的整合。進行臨床診療或是醫學研究都需要病案信息作為支撐和保障,為了將病案的信息保障力度發揮到最大化,需要打破不同醫院的界限,盡可能廣泛地整合醫療活動過程中形成的文字、符號、圖表、影像、切片等資料。
二是高性能設施的整合。隨著醫療信息化、電子化進程的推進,遠程診療已成為可能。共享平臺在整合病案大數據信息資源之外,也需要注重對高性能診療設施進行虛擬整合,如將需檢查的樣本進行數字化加工后發送給擁有專門診察設備的機構進行檢測,以彌合因醫院規模和經濟實力不同造成的診斷能力和治療水平上的差異。
本研究利用OAI-PMH協議完成整合功能[3]。由數據提供者利用元數據整合各類資源,并通過OAI-PMH協議與服務提供者交互,同時注冊資源;再由服務提供者結合資源注冊建立索引分類,通過各類通信協議供本層利用。
病案大數據資源共享平臺可提供有針對性的特色服務,以突出核心競爭力。一是服務醫學研究創新。通過文獻分析完成知識發現與創新,這在醫學界有著傳統和成功經驗,如食用魚油會對雷諾氏癥患者有益、鎂缺乏可引起偏頭痛等結論,都是先通過文獻分析進行假設,再通過臨床試驗加以驗證的[4]。因此在大數據環境下,充分利用數據挖掘軟件,從相關病案信息中挖掘新的醫學知識或診療方法等,無疑是平臺的基礎和核心功能。
二是服務醫院管理決策。服務醫院管理決策是管理人員對平臺的核心訴求,真實準確的一手數據是醫院制定管理決策的基礎。應用可視化軟件對病案大數據進行深度挖掘,可以掌握患者就診的時間分布規律、藥品的庫存與流通情況、床位的利用率、設備的使用率和投入產出比等,從而幫助醫院管理層實時掌控醫院運營情況,并及時做出正確決策。
三是拓展商業應用服務。醫院可利用廣泛集成的病案數據向患者提供增值性、個性化的服務,如在日常保健、起居飲食、健身鍛煉、康復訓練等方面提供有償指導,這樣一方面用醫療知識服務社會公眾獲得社會效益,另一方面能為醫院創造經濟效益。在技術實現方面,本研究擬使用傳統設計模式中的服務工廠模式[5],由其負責服務的注冊、公開各項服務接口以為用戶訪問提供方便,并根據用戶利用需求查找與調用各項服務。需要建立服務工廠利用Web service技術,將平臺內的所有服務分別封裝并設計接口,經描述后注冊到服務目錄中,再對外發布。利用中先查詢服務目錄,確定后通過服務接口獲取服務。
本層主要負責平臺與外界之間或平臺內部的互聯互通。一方面,平臺的最終目的是實現分散異構的病案大數據資源的共享與開發,為此平臺建設不應摒棄現有成果,需要在廣泛匯集各機構電子病案數據庫、醫院管理系統、醫學信息網站、醫學論壇等基礎上,對全社會范圍內的信息資源平臺、信息發布平臺、社交媒體平臺及信息服務平臺等加以擇優整合,充分發揮不同來源的病案信息價值以及不同功能平臺的相對優勢,實現分工協作、無縫互通,達到最優的整體效果。
另一方面,醫療人員所具備的隱性知識,如經驗、直覺等,具有非凡價值,而這種隱性知識必須通過人與人的交流才能轉化為顯性知識,進而實現知識的創新。所以,平臺應為用戶提供一個無縫溝通的虛擬空間,鼓勵用戶就病案利用中的具體問題進行充分溝通交流,激發創新火花。
第一,關注病案大數據間的業務背景聯系。大數據的核心理念之一是通過大量數據間的聯系發現隱藏在數據背后的規律,因此在平臺建設過程中應該摒棄以往按照不同醫院或科室整合病案信息的做法,著重獲取并保存病案大數據信息間的業務聯系。可以應用元數據對來源于同一患者的病案、相同醫生的病案、采用同一療法的病案或同種疾病的病案加以標注,并保證這些元數據與其對應病案間的聯系得到長期妥善保存,以適應大數據知識發現和數據挖掘的要求。
第二,關注病案大數據的全面性。大數據的價值取向并不在于盲目地追求數據擁有量的龐大,而是掌握某一主題下的全部相關數據。所以大數據的本質并不是“大”,而是“全”[6]。因此,實踐中應該借助病案大數據間的業務背景聯系全面收集相關病案數據,以充分發揮大數據的價值,為提供更精確、更準確的信息服務打好基礎。
第三,關注核心病案大數據資源。一般來說,大數據的數據總量大,核心的、真正具有重要價值的數據少,因此具有“價值密度低”的特點。在平臺建設過程中,應優先收集重點的、核心的信息數據,如關鍵人物或典型病例的病案信息、大規模流行性疾病的病案信息等,并重點提供利用,從而在最短時間內最大限度地發揮平臺價值。
平臺的建設和有效運行需要大數據、SOA、云計算、物聯網及移動互聯網等技術的綜合應用。在底層,憑借云存儲技術實現病案大數據的分布式存儲與互聯互通,完成資源的虛擬化整合,同時以PaaS打造公共應用支撐平臺。在數據采集端,以物聯網技術實時感知患者關鍵體征變化,自動完成數據采集。在中間層,以SOA架構構造靈活、動態、隨需應變的服務組配與創建機制。在服務層,以大數據技術作為實現知識發現、疫情預警等核心功能的保證;以移動互聯網技術提高平臺服務的便捷性,并促進其普及與推廣。在加強技術應用的同時,不能忽視技術管理能力的培養。應建立完備的數據存儲政策、訪問控制制度等安全保障策略,切實防止技術濫用等給平臺帶來的危害。
一方面,電子病案的長期形成和積累為病案大數據資源共享平臺的建設提供了有力保障,因此平臺無需“另起爐灶”完成從無到有的過程,只需在現有基礎上依照病案大數據涵蓋的內容,進一步擴大資源的收集與存儲范圍,實現資源建設的全面性。另一方面,可借助醫院網站、報紙、廣播電視等傳統媒體宣傳平臺的功能及建設成就,擴大影響力;還可利用新媒體吸引更多關注,以及提供泛在化、個性化的信息服務。
目前,病案大多存儲在生成機構,格式不一、管理質量參差不齊、利用限制過多等問題嚴重制約了病案信息在大數據時代的價值實現。因此,平臺建設亟需完善當前的病案管理體制,變各自為政的分散管理為集中控制、統一管理,這樣既能掃清病案大數據資源整合的障礙,也有利于實現平臺建設的標準化。具體管理和存儲的職責可由疾控中心承擔,或者在衛生部領導下設置第三方機構負責。在實踐運營過程中,可采取特許經營或外包的方式引入社會力量,既能保證政府掌控敏感數據,又能彌補技術或人員的不足,達到建設效果最優化。
病案大數據的概念相較于傳統病案的概念,其外延得以擴大、內涵更加豐富,所涵蓋的資源類型也更加多樣。關于病案大數據資源共享平臺存儲、整合、挖掘和溝通方面的需求來源于實踐,充分反映了平臺各方參與者的迫切需要。以數據存儲層、資源整合層、應用服務層和交流溝通層4級體系為架構建立病案大數據資源共享平臺,能夠較好地滿足以上需求;而采用轉變理念、應用技術、借助現有基礎和完善保障制度等策略,能夠確保平臺的建設符合大數據的核心理念,保障建設過程中少走彎路,以最小的投入獲取最大的效果。
本文是國家社會科學基金項目“非結構化電子文件管理研究”(16BTQ089)的研究成果。
注釋與參考文獻:
[1]祭鴻雁.“新來源觀”:實質與意義探析[J].檔案學通訊,2003(1):21-25.
[2]劉宏渭,柳硯濤.病歷檔案管理與保護患者隱私權[J].檔案學通訊,2004(4):69-71.
[3]馬海兵.應用OAI-PMH和OAI-ORE進行數據交換的原理與實現[J].情報雜志,2011(8):113-116+119.
[4]榮毅虹,梁戰平.基于文獻的發現[J].情報學報,2002(8):386-390.
[5]趙丹陽.數字環境下科技文獻信息開發利用與服務模式研究[M].遼寧:遼寧大學出版社,2016:167.
[6]涂子沛.數據之巔[M].北京:中信出版社,2014:258.