陳惠芳 徐衛國
摘要:大數據時代的到來,給醫療行業帶來了機遇和挑戰。文章首先梳理了大數據的內涵和理念,在此基礎上分析了現今醫療行業面臨的挑戰,包括大數據處理技術、決策分析、隱私安全及人才緊缺等問題。最后嘗試從大數據新思維意識、數據共享、信息安全、人才團隊建設等幾個方面探討大數據時代醫療行業的重點應對策略。
關鍵詞:大數據;醫療;新思維
一、 引言
在21世紀,對海量信息的采集和分析能力將成為最重要的能力之一。世界各國已經行動起來,從政府、研究機構到企業“嘗鮮”大數據技術。美國奧巴馬政府宣布推出“大數據的研究和發展計劃”;國際頂級學術期刊Nature和Science均出專刊來探討大數據;國內人大經濟論壇隨后也推出了大數據專題討論頁面。可見大數據在經濟社會各層面、各領域都開始受到重視。
與此同時,醫療行業也遇到了海量數據和非結構化數據的挑戰,尤其是物聯網和傳感網的發展進一步推動了醫療行業數據的極大增長;而隨著近年來很多國家都在積極推進醫療信息化發展,這從戰略上和資金上使得很多醫療機構能夠進行大數據分析和研究。醫療行業將首先邁入大數據時代,成為讓大數據分析最先發揚光大的傳統行業之一。
然而,究竟什么是大數據?大數據給個人患者和醫療機構帶來怎樣的沖擊和轉變?大數據時代醫療行業又將面臨怎樣的機遇和挑戰?本文即從對大數據的內涵進行梳理入手,結合分析醫療行業面臨的機遇和挑戰,提出大數據視角下醫療行業發展的新思維,以促進我國醫療行業的健康發展。
二、 大數據概述
大數據是近幾年被各界熱議的焦點與話題,學術界與企業屆紛紛發表了對大數據的理解。權威IT咨詢公司Gartner認為大數據是一種信息資產,其特征是海量、高增長率和多樣化,使用新的大數據處理模式才能使其具有更強的優化流程能力、決策創新能力及洞察發現力。維基百科將大數據定義為使用手頭的數據庫管理工具或傳統的數據處理應用變得難以處理的龐大而復雜的數據集合設置。IBM公司認為大數據來自于任何地方的多維數據,并認為可以用“4V”來歸納總結,即數據體量大(Volume)、數據類型多樣(Variety)、數據價值密度低(Value)及數據處理速度快(Velocity)。
雖然目前未形成對大數據一致公認的理解,對大數據的定義也存在不同的表述,但較為一致的認為大數據已不再局限于技術領域、不是簡單的數量多少問題,大數據隱藏著背后變革思維、變革決策及變革組織的力量。具體而言:①從思維上改變對數據的態度(Viktor et al.,2013)——一是收集和使用大量數據,分析全部數據,而不是依靠少量的樣本數據;二是不再執著于數據的精確性,接受半結構化數據和非結構化數據的混雜;三是在大數據背景下,通過相關關系將更容易快捷的分析事物,而不是通過揭示事物內部運作的因果關系。②數據驅動決策(Foster & Tom,2013)。決策的驅動因素來自于對數據的分析而不是純粹來自直覺。決策的科學性是我們追求的目標,但科學性的追求是為了保證決策的效能和效率。數據驅動決策的益處:在其他因素得以控制的情況下,一個企業的決策越是通過數據驅動則效益和產出越好。③數據驅使組織進行變革。從大數據中發掘大洞察、發現潛在知識和機會將成組織競爭力的來源,從而推動組織結構的改變;而大數據成為組織變革的力量源于其可以變革組織的盈利模式和傳統交流方式;如亞馬遜擁有大數據和轉換數據價值的能力使其占有行業領先地位,如各種去中心化的維基、博客等交流方式改變傳統的交流方式。
綜上可見,當數據和黃金一樣成為一種新的經濟資產,當數據和石油一樣成為一種戰略資源(世界經濟論壇,2012),當大數據科研從第三范式(計算機模擬)中分離出來單獨作為一種科研范式(Jim,2009),我們已然進入大數據時代。經濟社會各個層面、各個領域都面臨著如何有效利用和挖掘大數據的價值。
三、 大數據環境下醫療行業新機遇
大數據給醫療行業帶來的健康意識和社會效益要超越其獲取與管理的成本。如全面數據用于分析病人信息,能更好的提高醫療診斷的準確性和精確性,甚至預測疾病發展,及早提出有針對性的應對措施。因此,大數據時代的思維和態度必然給醫療行業帶來新的創意。下文從大數據時代的數據特征:全面、即時、社會化三個方面探討大數據給醫療行業帶來的機遇。
1. 數據全面,有利于提高醫療決策的可靠性。信息的全面性是影響決策可靠性的主要因素。醫療決策用于分析的數據越全面,其決策分析的結果越接近真實。傳統的醫療決策由于信息的不完整主要依靠自身判斷作決策,存在著直覺判斷、依靠經驗辦事等弊端。在大數據時代,醫療信息孤島將逐步消失,同時,社交網絡的普及也將增進信息的知識共享和信息的交互,醫療決策支持系統將可以獲取多樣性、高速性和和規模性的數據,可立足于更大、更完整的數據集,通過全面的數據分析,為醫療決策者提供全局性的決策支持。同時,伴隨著數據挖掘、數據可視化、數據處理和人工智能等“大數據”處理技術的進步,醫療決策者也可以從中挖掘更多支持決策的有價值的信息。因此,基于大數據全面數據的驅動,將使醫療決策更加精確、更加科學,極大提高醫療決策的可靠性。
2. 數據傳播即時,有利于加強醫療應急管理。隨著互聯網的重心向著移動互聯轉移,目前移動醫療正逐步成為醫療行業的規劃重點。根據CNNIC第34次調查數據顯示我國手機網民數量為5.27億人,占總體網民比例高達83.4%,手機網民的數量第一次超過了PC網民。目前互聯網上相當大一部分的數據來自平板電腦、智能手機等泛互聯網設備,如能利用好大數據環境中的傳播即時的數據,醫療應急管理的反應能力及實時效果將會得到極大的提高。如Google利用傳播即時的大數據和疾控中心一樣判斷疾病來源,預測的相關性高達97%,并且判斷相當及時,而不像疾控中心需要在疾病爆發一兩周后才可發現。因此美國在2009年甲型HINI流感爆發時,Google成為了一個更為及時和有效的指示標。
3. 數據社會化,有利于改善醫患關系。長期以來,患者和醫生的矛盾主要源于患者和醫生之間存在著信息的不對稱,甚至由于信息孤島的存在醫療工作者在大部分時候無法真正了解患者病情。數據的社會化趨勢使每個人在互聯網進入到大數據時代,都將是透明性存在著。這將逐步消除患者與醫療機構間的信息不對稱,同時由于信息孤島的消失將極大改善和提高醫療診斷的準確性和速度。而這些都將有效的改善患者健康狀態、提高患者的健康理念和知識,有利于改善和緩解醫患關系。
四、 大數據環境下醫療行業面臨的挑戰
大數據時代的理念和技術給醫療行業既帶來了機遇也帶來了挑戰。
1. 處理醫療大數據的技術困境。醫療大數據的處理首先面臨技術上的困境。醫療數據體量大,如一個社區醫院累積的結構化和非結構化數據就可以達到數個TB甚至PB級別;其次是我國醫療機構信息系統建設缺少統一的規劃和標準,形成眾多的“信息孤島”,甚至在單體機構部門之間都存在信息割裂。因此醫療數據的數量大、非結構化、種類多及資源的不夠開放將對醫療行業的數據挖掘和信息共享造成一定的困境。有估計稱企業相關數據有80%都是基于文本的非結構化數據(Grimes,2008),醫療數據的大部分也是基于文本的非結構化數據。大數據革命已成為關鍵因素,傳統處理數據的分析技術已無法滿足大數據處理,尤其是在機器學習和處理海量信息集。因此,構建良性發展的共享數據系統的大數據處理技術將成為醫療機構面臨的一大難題。
2. 大數據時代醫療的決策分析問題。決策分析已經逐步從數據驅動代替傳統的經驗直覺決策。對于醫療行業來說,大數據的有效利用與否已經成為提高醫療服務質量、增強核心競爭力的關鍵策略。然而問題是醫院數據的一大部分是基于文本的非結構化數據,而且非結構化數據的增長率遠遠大于結構化數據;因此,基于結構化數據的傳統數據挖掘策略對于大量非結構化的醫療數據已顯無力。數據挖掘的傳統策略不僅對醫療決策的時效性造成影響,同時在處理結構化過程中丟失了半結構數據與非結構化數據的隱含關系,進而增加了醫療決策的不確定性和不準確性。而這些隱含關系實際上有可能是非常重要的信息,比如找出一些潛在疾病的相關關系。因此,如何有效地將數據存儲、處理和保護成本降至最低,通過大數據挖掘把醫療大數據轉換為支持臨床決策需要的信息,從而達到高效的醫療數據社會效益與經濟效益并行,又是醫療行業面臨大數據時代的一大難題。
3. 大數據時代醫療隱私的安全問題。目前,醫療機構在隱私保護和安全風險應對方面準備明顯不足,在一些醫療機構內部缺乏高層管理人員對患者信息的控制,而過時的隱私意識和數據策略、政策程序有法不依和人員培訓不足等現象也十分突出。大數據時代無疑會提高醫療過程數據的透明度,醫療行業正在過渡并開始大規模廣泛應用電子健康記錄,而臨床數據庫、家庭監控和遠程醫療都有很大的概率發生數據泄露、數據欺詐、身份盜竊而造成醫療欺詐和糾紛案件,從而抬高醫療總費用并產生重大負面影響。同時,由于社交媒介如Twitter、移動APP端等在醫療組織、醫師和患者間的廣泛應用,一旦利用不當將造成患者隱私安全泄露的風險。如何在大數據時代的數據收集上獲得巨大進步的同時確保病人敏感信息和隱私安全再一次引起了人們對于隱私問題的擔憂,這一問題至關重要,它很有可能使“大數據”無法實現重大突破。因此,防止泄露敏感病人的數據、提高數據安全保護、維護醫療機構的品牌價值,通過技術和法律等正當手段積極維護患者信息的安全,將是醫療行業面臨大數據時代的又一難題
4. 醫療行業大數據人才落地問題。人才是企業發展的核心競爭力,醫療行業也不例外。醫療機構面對如此數據量巨大、非結構性強、數據來源龐雜的數據需要存儲、處理和分析,更需要有別于傳統數據分析的新人才進行管理和分析處理。然而目前,大數據人才缺口巨大,供不應求。根據麥肯錫全球研究院(MGI)2012年的預測,未來6年,僅美國本土就可能面臨14萬~19萬的大數據能力人才的缺口。因此,如何找到應對大數據挑戰和機遇所需要的人才,培養和造就一支懂管理、懂指揮、懂技術的大數據專業隊伍又是醫療機構面臨的一大難題。
五、 大數據視角下醫療行業發展新思維
1. 建立面向大數據的創新思維。盡管有人認為大數據其實僅僅是“信息爆炸”所帶來的一種現象,是一些數據商家用來吸引眼球的一個噱頭。但現實的實例也告訴我們大數據正在創造價值,新的創新模式和新的價值隨著大數據的驅動不斷產生。根據MGI研究預測,通過有效利用急速增長的大數據,美國醫療行業如果能夠以此提高服務質量和經濟效率,則可能創造每年超過三千億美元的超額價值。“數據權”正成為各國、各領域爭奪的新資源;大數據的不斷滲透對經濟發展模式、公共服務模式甚至國家戰略規劃等提出了新的要求。同時,大數據又是一種資源和工具,我們必須以認可其巨大力量的同時看到其局限的辯證觀點來接納大數據時代的新思維。因此,醫療機構應該正視大數據帶來的機遇與挑戰,轉變思路,積極有效地將數據轉換為可用的資源,從而改善醫療服務的質量、提高醫療服務的效率、提升競爭力,從最根本上實現醫療數據的最佳經濟效益和社會效益。
2. 搭建智慧醫療數據共享綜合平臺。數據只有充分流動和共享才是有生命力的數據。而多種數據源的整合能力及新型數據源的分析能力成為搭建綜合共享平臺的關鍵能力。綜合利用多種數據的全資源分析(All-source Analysis)正是從問題出發,系統化地整合所有相關信息資源來支持醫療決策與研究,利用不同數據資源來評估、揭示、解釋事物的發展,最終發現新知識。同時,大數據時代隨著網絡應用的深入,不斷涌現出各種不同的新型媒體形式,而且可以預見隨著經濟社會的發展和科學技術的不斷進步,新型資源將不斷涌現,應注重新型數據源的分析,持續加入數據共享平臺,不斷促進醫療決策與研究的發展。
3. 加強完善醫療信息安全制度建設。完善醫療安全不僅是技術問題,更是管理問題,應該從管理角度和技術上杜絕醫療核心數據和隱私被泄露的漏洞。下文主要從管理角度探討安全隱私問題,核心是患者隱私(Privacy)保護和信息安全(Security)規劃。①法律制度的強制。完善醫療相關的安全條例以保護信息系統的保密性、一致性和可用性:包括管理上的防護,建立和落實安全的管理策略,物理設施上的保護等。建立完善隱私條例涉及個人健康信息的內容可被組織機構所使用的信息標準,并規定個人可以了解和控制他們的信息是如何被使用和披露的。②規章制度約束。對信息系統和機房設備日常維護工作的建立。包括監控網絡(內部信息平臺)運行安全、信息的變更管理規定、容災數據備份方案及各種應急方案等。③人員的遵守。對相關從業人員進行持續的安全防范意識和規范操作的培訓;對內部從業人員進行安全評估和認證,并加以強化合法和非法披露意識的培訓;最后核心人員應該簽訂相關保密協議,并完善相關的激勵機制制度,防止涉密人員和高級管理人員離職后泄密。
4. 醫療大數據人才隊伍的組建與培養。人才是數據價值得以體現的前提,大數據建設的各個環節都需要有專業人員才能完成。因此需要組建與培養一支懂管理、懂指揮、懂技術的大數據專業建設人才隊伍。
在大數據時代下盡早開始組建具有大數據分析能力的團隊,將有利于提升醫療機構的核心競爭力和品牌價值。組建具有大數據分析能力的團隊應包含以下人員:①數據科學家(Data Scientist)。數據科學家是能創造新的數據服務運用,具有從海量數據中提取出簡單易懂、有價值的信息并傳遞給決策者的人才。數據科學家大多應具有統計分析、數據挖掘等技能且擁有計算機科學背景的人才,同時具有溝通能力、創新精神和好奇心等素質。②數據專員。數據專員收集與匯總所有進入醫療行業的高質量數據,并編成目錄,最終確定上游數據模型。因此,數據專員需要具備數據抽取及數據建模等技能的基本素質。③系統維護員。負責數據系統、信息平臺等的常規維護工作。包括日常軟件和硬件的管理與維護工作,同時需要確定軟硬件的額外需求并實際落實。④開發人員。負責搭建平臺、開發分析應用程序。這部分人員可以采用雇傭外包的方式給專業的大數據公司完成。
六、 結束語
“數據為王”的時代已經到來,先行者機遇與挑戰共存,關鍵在于能否創新并找到相應的發展模式。大數據視角的思維和理念給醫療領域既帶來了機遇也帶來了挑戰,解決大數據所帶來的挑戰將不是易事。醫療工作在未來的發展過程中必須要面對這些機遇和挑戰,只有將大數據作為一種資源和工具來運用才能形成可持續競爭優勢。本文分析了大數據視角下醫療領域的若干機遇和挑戰,同時本文提到的大數據新思維意識、數據共享、信息安全、人才隊伍建設等幾個方面也是大數據環境中醫療領域未來的發展趨勢。本文以期能為促進醫院管理的理論和實踐的發展添磚加瓦,使其能更全面深入地洞察行業競爭態勢,做出更好的規劃與決策。
參考文獻:
1. Kenneth Cukier, Viktor MS.The Rise of Big Data.Foreign Affairs,2013.
2.鄧仲華,李志芳.科學研究范式的演化——大數據時代的科學研究第四范式.情報資料工作,2013,(4):19-23.
3.Gantz J, Reinsel D.Digital Universe Stu- dy: Extracting Value from Chaos.IDC Go-to-Market Services,2011.
4.Travis B, Allan S.The Inevitable Appli- cation of Big Data to Health Care.JAMA,2013,309(13):1351-1352.
5.李國杰,程學旗.大數據研究:未來科技及經濟社會發展的重大戰略領域——大數據的研究現狀與科學思考.中國科學院院刊,2012,(6):647-657.
基金項目:上海市科技委員會科研計劃項目(項目號:09dz1500306);上海市信息化發展專項資金項目(項目號:201302011)。
作者簡介:徐衛國(1952-),男,漢族,上海市人,上海交通大學安泰經濟與管理學院教授、博士生導師,研究方向為醫院管理;陳惠芳(1982-),女,漢族,福建省武夷山市人,上海交通大學安泰經濟與管理學院工商管理專業博士生,研究方向為醫院管理。
收稿日期:2015-02-12。