姚遠,尚國偉,費曉璐
首都醫科大學宣武醫院 a.信息中心;b.科研處,北京 100053
遠程醫療信息系統中數據質量控制的研究
姚遠a,尚國偉b,費曉璐a
首都醫科大學宣武醫院 a.信息中心;b.科研處,北京 100053
本文針對遠程醫療中傳輸和存儲的數據進行分析,發現遠程醫療中涉及數據質量的相關問題,如數據缺失、數據重復、數據格式不一致等等,并將遠程醫療過程中出現的相關數據問題進行分類,針對各個類別的問題嘗試通過歸納計算、聚類、回歸函數或利用模糊動態匹配等技術找出相應的解決方案,提高了遠程醫療的數據質量,使得遠程醫療的有效實施和應用得到了保證。
遠程醫療;數據質量;數據交互;模糊動態匹配
目前,隨著衛計委推廣分級診療的力度逐漸加大,基于網絡的遠程醫療已經成為各大醫院關注的重要業務分支。到醫院看病就醫的傳統醫療模式已經越來越無法滿足人們的醫療需求。受到高水平醫療專家數量的限制,他們不可能為了滿足人們更高水平的醫療護理而離開自身的重要崗位。并且鄉村的醫院和醫生更加缺乏,跑到大城市就醫不僅花費大量的金錢還有寶貴的時間。遠程醫療的建立和應用對于那些不用住院治療的癥狀較輕的患者帶來了極大的方便[1-3]。從長遠來講,遠程醫療模式是一種顛覆性的醫療模式,推動了互聯健康,像現代交通樞紐和高速公路那樣,將醫療、養老、子女關護老人,父母掛念孩子等親情無障礙銜接在了一起[4]。
遠程醫療技術是網絡科技、醫療與多媒體等多項技術相結合的產物,它是一個開放的分布式應用系統。它以計算機網絡通信為基礎,通過多種數字傳輸的方式,實現對醫療技術的共享、遠程診斷以及音頻信息的傳輸、存儲、查詢、比較和顯示。與傳統的臨床醫療相比,遠程醫療會診促進了醫療資源的均衡化。一些地方醫院診療水平有限,在救治過程中往往會遇到一些難題,通過遠程醫療診斷系統,可盡快地解決在救治患者過程中所遇到的困難,既可以在一定程度上提高地方醫院的業務水平,也會提高遠程會診醫院的聲譽及診療水平。在傳統臨床醫療模式下,患者只能等到查房會診時進行充分溝通,病史資料也存在丟失遺漏等問題,而遠程醫療診斷可確保病患者與醫生進行更方便更快捷的溝通,同時病史資料的保存也得到了極大的改善。
1988年,美國提出遠程醫療系統應作為一個開放的分布式系統的概念。美國學者對遠程醫療系統的概念定義如下:遠程醫療系統是一個整體,通過計算機技術和通信技術的特定人群提供醫療服務。該系統包括遠程診斷,信息服務功能,遠程教育等,它是以計算機和網絡通信,多媒體技術在醫學數據,遠程視頻,音頻信息的傳輸,存儲,查詢和顯示[5]。1988年12月,在前蘇聯亞美尼亞共和國發生了強烈地震,在美國和蘇聯太空生理聯合工作組織,在美國的支持下,美國宇航局的第一個遠程醫療國際,實現一家醫院亞美尼亞與美國四家醫院通信聯通和遠程會診。喬治亞州教育醫學系統是目前最廣泛,在世界上最大的遠程教育和遠程醫療網絡,能夠實現有線、無線和衛星通信活動,遠程醫療網是其中的一部分。在歐洲,遠程醫療系統的大規模推廣和歐盟已經組建了3個生物醫學工程實驗室,10個大型公司,20個病理學實驗室和120個終端用戶在推廣應用遠程醫療技術。澳大利亞、南非、日本等國家也進行了各種形式的遠程醫療活動。遠程醫療可以跨越國際的政治、文化、社會和經濟的界限。近年來,遠程醫療模式的發展已突破早期受限于網絡,視頻通信等硬件條件,更多地向系統化、集成化和平臺化頂層設計發展以及精準管理,更是強調資源優化整合應用升級[6]。
以美國退伍軍人保健局為例,2014年完成了兩百萬次遠程醫療服務[7];位于北卡羅萊納州的凱撒醫療機構分部預測,2016年該機構通過遠程模式提供的醫療和健康管理的患者次數將超過患者和醫生面對面看診的人次數[8]。同樣,梅奧醫療中心也預測,到2020年該中心將為全球患者提供超過兩億人次的醫療服務,其中大部分患者來自世界各地,主要通過遠程模式實現診療和隨訪、以及疾病管理[9]。
我國的遠程醫療技術起步較西方發達國家晚,但發展很迅速,可以分為3個階段:
(1)概念實施起步階段。利用遠程通信的方法達到會診咨詢的目的。這是最初的遠程醫療的概念。1986年廣州遠洋航運公司的電報會診,到1988年解放軍總院通過網絡衛星和德國一家醫院進行神經外科遠程病例討論再到北京大學的基于互聯網的鉈中毒的遠程病例討論[10],我國的遠程醫療會診漸漸的發展起來。
(2)建立遠程醫療網絡階段。在我國政府和衛生部直接領導的支持下,金衛醫療網絡在1997年正式開通。網絡開通以來,已經為全國各地幾千例疑難急重患者進行遠程會診,組織國內外醫療學術交流、科研教學、手術觀摩等促進了我國遠程醫療的發展。
(3)利用網絡發展普及階段。近年來,隨著互聯網技術的高速發展,出現了基于瀏覽器工作站的遠程醫療技術產品,利用互聯網向廣大患者提供遠程會診及尋醫問藥的咨詢。這種模式的出現,真正地體現出資源共享的高效,緊急情況能及時處理,提高了醫院的能效和節省患者的開支。
我院作為國家腦防委遠程卒中會診中心的架構,見圖1。該中心主要包括:遠程卒中救治指導、遠程疑難病會診、遠程康復會診、遠程影像會診、遠程教育培訓、遠程手術示教、國際交流、學科建設等。全國對接醫院2000余家,其中三甲醫院365家、二甲醫院1821家。全國已對接省份包括:河北、河南、山西、陜西、內蒙古、黑龍江等17個地區。參與會診專家80余名,包括:神內、神外、介入、功能神外、康復、疼痛、胸外科、心臟科、骨科、血液科等17個科室。開展了千余例遠程疑難病會診,數十例遠程靜脈溶栓會診及遠程介入手術指導及遠程手術示教。此外該中心與美國匹茲堡大學遠程醫學中心、南卡萊羅那醫學中心均有合作,現每月至少進行兩次國際間的學術交流及病例討論。

圖1 腦卒中會診中心網絡架構
隨著網絡技術的發展,支持遠程醫療的產品越來越多,雖然從技術上來講,無論是文字,還是圖片、視頻的傳輸都已經不是障礙,但是真正能夠體現醫療管理特色,能夠把遠程醫療相關數據妥善管理起來,幫助醫生方便快捷的進行診斷以及后續的研究,還有一定的距離。
總體來說,遠程醫療中數據主要以4種方式進行交互,見圖2。本文針對我院在建設遠程醫療系統過程中在數據質量控制方面積累的一些經驗教訓進行探討。

圖2 遠程診療數據交換的形式
2.1 影像數據的管理與質控
醫學影像文件對于診斷具有非常重要的意義,但是對圖像質量有很高要求,理想狀態下應該采用申請端發送原始DICOM文件傳輸入會診端的PACS系統,再由會診端本地的DICOM瀏覽器打開這種模式。
由于種種原因,很多的醫學影像會診系統對DICOM影像的支持力度有限,很多是以JPEG圖像壓縮打包,FTP上傳等形式進行影像數據的交換。而這種醫學影像交互的形式,可能會影響遠程診斷的質量。同時,JPEG圖像沒有附帶任何患者、檢查、序列、影像級別的醫學信息,無法加入到會診端當地的PACS系統,影響會診數據檔案的完整性,造成關鍵影像數據的保存缺失。
即使雙方醫療機構都采用DICOM格式的原始影像進行信息交互,由于醫療機構采用的PACS系統不同,對一些DICOM影像私有的屬性以及加密處理方式可能有差異,雖然影像文件有標準的格式,可還是很有可能出現DICOM文件不能打開的問題。這種情況下需要雙方協商,共同使用對雙方機構PACS系統導出文件兼容性均較好的第三方瀏覽器,而且導出DICOM文件時需要注意,一定要導出經過解密的文件。
2.2 文本形式數據的準確性、完整性及一致性
目前,隨著國家對分級診療的大力推動,醫院對遠程醫療過程中的患者人口學信息以及診療信息的重視程度越來越高,部分醫院將遠程醫療的患者信息也等同于醫院診療患者信息進行歸檔,這也是未來區域醫聯體借助遠程醫療系統開展分級診療必備的信息支撐。然而,目前遠程系統建設缺乏統一的醫療規范和技術標準。參與遠程醫療的各個醫療部門的軟硬件條件各異,部門、單位特點不同,勢必造成多種關系數據庫共存的局面。多種系統及異構數據庫的存在嚴重限制了數據共享和交互的范圍。現階段遠程醫療缺乏統一的技術標準和醫療規范。由于參與遠程醫療的各家醫療機構的規模不同,使用的醫院信息系統不一樣,加之各地區網絡傳輸的信息通道的差異,造成醫療信息不能及時有效的共享,實現醫療單位全方位、多元化聯網比較困難[11]。同時,遠程醫療各區域及各系統比較分散,數據集成中可能會牽涉到HIS、RIS、PACS、LIS等各個方面,此外,由于醫院信息系統建設的時間跨度較長,各應用及軟件且沒有可以參照的統一的建設標準和數據標準,部分系統沒有采取機構化的方式存儲數據,個別系統甚至還在使用文件方式存儲數據。多年的數據維護、搬遷,輸入時的缺乏經驗,再加上系統功能模塊是逐步上線,這都導致了遠程醫療數據會出現數據的缺失和不完整等一系列問題。
(1)在醫療信息系統中數據中會發生“缺失”的情況,若缺失的為遠程醫療相關的關鍵數據,則數據缺失情況會直接影響到遠程醫療的效果。如果多個數據段的屬性值空缺時,我們可以選擇忽略該數據。對于重要的不能被忽視的數據,盡量用具體的數值來填補空缺。對于年代的空缺可能會嘗試按相應的記錄年份來填補空缺,或者可以用平均值來填補[12]。
(2)因為時間各系統的數據進行集成,所以會出現數據重復的現象。造成數據重復的原因有拼寫錯誤,如“李四”姓名被錯寫成“L四”,比如“北京大學”和“北大”。這些重復數據的記錄可能導致建立錯誤的數據挖掘模型,會對遠程醫療后期數據的決策分析產生很大的影響。所以,檢測和消除重復數據是提高數據質量要解決的主要問題之一。我們可以嘗試采用模糊動態匹配技術讓系統自動發現重復數據,在分析原因后可采用剔除某數據源記錄單一信賴單數據源數據,或采用合并匯總記錄的方式進行處理[13]。
(3)遠程醫療往往銜接的是兩個不同的院端系統,各系統的數據很可能會存在數據格式不一致的現象,如系統內日期數據的格式,假設我們認為正確的日期格式為1996/5-1997/6,錯誤的類型有1996/5.1997/6符號輸入錯誤、1997/6-1996/5順序顛倒等。我們要為該類數據制定統一的規則,將所有的日期修改為統一的格式。如果程序提供了規則庫,可以從規則庫中調用模板如替換、抽取、字符串比較大小等[14]。當然,最理想的狀態時各個醫療機構都遵從同一類數據格式和規范。美國退伍軍人保健局就明確要求各個相關醫療機構盡量可能按照HL7標準提供數據元素,認為這些可以協助改善他們內部的電子病歷數據的完整性、準確性和一致性[15]。
(4)各醫療機構可能使用了不同的基礎字典,導致診斷等核心數據無法歸類。如不加處理,將影響數據質量。針對此類數據問題,后處理的方法只能是對既往數據進行分布分析,請相關專家對詞頻較高的詞匯進行歸類,建立后臺對照的知識庫。可以嘗試使用查找表的方法,按各系統的數據字典、數據標準格式建立查找表,并在數據清洗中將數據對應相應的表進行匹配[13]。也有一種方式是由區域診療的中心醫院發布一套比較權威的基礎數據字典,各個會診發起端自行于本院的字典進行匹配后再進行數據交互。
2.3 視頻的連續性和實時性
會診中視頻信號是非常重要的環節,有經驗的醫生需要通過視頻與患者互動,查看患者的反應,因此視頻的連續性和實時性非常重要。視頻會議的整體是基于網絡構建的,通信質量的好壞嚴重影響著視頻會議的效果。網絡質量不好的情況下,視頻會出現大量的馬賽克或者聲音有很大延遲且不清晰,這直接影響著對病人進行問答和查體等操作。所以一般都采用專線的方式來保證會議的清晰度和流暢度。除了網絡之外還有輔流的問題,雙方通過發送雙流,是雙方可以共享某臺電腦或者設備的桌面,這樣可以使得有一些不太方便傳輸的文件可以讓雙方同時進行瀏覽,已進行討論,但是輔流的清晰度以及顯示輔流的顯示器是需要注意的,如果雙方共享的是DICOM影像,就要考慮清晰度以及顯示器是否為診斷級別。
總之,隨著衛計委大力推動區域醫聯體和分級診療,遠程會診系統必將成為醫院重點發展的業務系統之一。從功能上來講,遠程會診系統的軟硬件功能應該無縫融合,就像手術機器人能夠充當醫生在手術間內的手一樣,遠端的視頻設備也應該能夠在配合醫生在會診系統中的操作,充當醫生在遠端的眼睛。從數據角度來講,遠程會診系統中的患者就診記錄也將成為醫聯體中患者健康檔案中的重要組成部分,因此其數據的標準性、規范性、完整性、真實性、一致性應該按照醫院內的業務系統數據同樣要求。因此,遠程醫療系統中的數據質量控制,也將成為醫院數據集成與數據利用的必要前提工作。
2.4 家用可穿戴醫療設備產生數據的準確及可用性
隨著便攜式及可穿戴醫療設備技術的發展和產品的普及,未來可穿戴設備一定是遠程醫療的重要數據來源之一。但是這些家用設備所提供的心率、血氧濃度、舒張壓、收縮壓、肺活量等數據,比起傳統醫院檢查所采集的數據,其數據采樣頻率要大得多,如果其質量不能進行合理的控制和篩查,就有可能作為錯誤數據誤導遠端的醫師,對患者身體狀況做出錯誤的判斷。例如,肺活量數據采集,就應該參考美國胸科協會(ATS)和歐洲呼吸協會(ERS)頒布的肺功能測量的強制標準,一旦用戶在使用肺活量測量設備時采用了不正當的技術,設備就應該拒絕采納這個測量結果,并把拒絕提示發給用戶。
總之,作為一個新興的診療模式,遠程醫療具有顯著的合理調配醫療資源,為偏遠地區提高診療水平等優勢,作為必要的技術支撐手段,遠程醫療信息系統是不可獲取的一部分[16]。我們在重視建立診療過程的規范的同時,不應該簡單的認為遠程醫療信息系統就是簡單的醫生使用的視頻會議系統,應該從醫療和研究角度出發,尊重患者全生命周期的診療紀錄,妥善保管并記錄遠程醫療中的信息數據,把控數據質量,為未來的相關數據分析和利用打下堅實的基礎。
[1] 諸強,王學兵,胡賓,等.無線遠程醫療系統[J].北京生物醫學工程,2004,23(3):225-227.
[2] 廉世俊,胡大可.遠程醫療中的通信問題[J].國外醫學生物醫學工程分冊,1999,22(5):263-269.
[3] 白凈,張永紅.遠程醫療概論[M].北京:清華大學出版社,2000.
[4] Dorsey ER,Topol EJ.State of telehealth[J].N Engl J Med,2016, 375(2):154-161.
[5] 龍志波.DICOM標準下醫學影像數據庫的建立與研究[D].吉林:吉林大學,2009.
[6] 葉志前,唐保昌,劉進,等.基于B/S模式的遠程影像會診系統設計和開發[J].中國醫療器械雜志,2008,(11):99-102.
[7] VA poised to ramp up telehealth in 2015[EB/OL].(2014-12-23).http://www.mhealthnews.com/news/va-poised-ramptelehealth-2015.
[8] Pearl R.Kaiser Permanente Northern California: current experiences with internet, mobile, and video technologies[J]. Health Aff(Millwood),2014,(33):251-257.
[9] Larsen E,Diamond D.Why Mayo Clinic's CEO wants to serve 200 million patients — and how he plans to do it. The Advisory Board Company[EB/OL].(2014-07-23).https://www.advisory.com/dailybrie fi ng/2014/07/23/lessons-from-the-c-suite-mayo-clinic.
[10] 農智紅,劉酈,覃麗群.我國遠程醫療技術演變過程及其發展趨勢淺析[J].沿海企業與科技,2007,(4):47-48.
[11] 張睿,羅緋,童林.我院遠程醫療工作的現狀與發展[J].西南軍醫, 2007,9(3):122-123.
[12] 熊侃霞,宋濤,張亮,等.市場在醫療服務資源配置中的缺陷分析[J].中國衛生事業管理,2010,27(5):313-315.
[13] 趙霞.基于數據挖掘技術的電子病歷數據質量分析系統的研究與實現[D].廣州:華南理工大學,2010.
[14] 劉靜,劉麗紅,張竹綠,等.使用數據清洗技術進行中醫藥數據倉庫質量控制研究[J].中國數字醫學,2012,7(4):81-82.
[15] Christine Sweeny.Data Quality: Demographic Data Accuracy and Completeness[EB/OL].(2016-04-29).https://www.vitl.net/ blogs/ehealth/data-quality.
[16] 劉清發,孫瑞玲.遠程醫療在醫養結合中的應用探討[J].中國醫療設備,2015,30(5):70-72.
本文編輯 王博潔
Research on Data Quality Control in Telemedicine Information System
Y A O Y u a na, S H A N G G u o-w e ib, F E I X i a o-l ua
a.Information Center; b.Department of Scientific and Research, Xuanwu Hospital, Capital Medical University, Beijing 100053, China
This paper analyzed the data of telemedicine, and some issues related to data quality were found, such as the lack of data, repetitive data, inconsistent data format and so on. Then these issues were classi fi ed. In view of each category of issues, we attempted to fi nd solutions by inductive calculation, clustering, regression function or the fuzzy dynamic matching techniques, which improved the data quality and ensured the effective implementation and application of telemedicine.
telemedicine; data quality; data interaction; fuzzy dynamic matching
R197.324
C
10.3969/j.issn.1674-1633.2017.07.035
1674-1633(2017)07-0126-04
2016-10-08
2016-10-17
費曉璐,高級工程師,主要研究方向為醫學信息化。
通訊作者郵箱:feixiaolu@tsinghua.org.cn