閆妍,劉旭,王繼釗,屈航英,張佳,王健生 段小藝
(1.西安交通大學第一附屬醫院,西安市 710061; 2.陜西中醫藥大學第二附屬醫院,陜西省咸陽市 712000)
?
大數據時代背景下單病種協作模式發展的探討
閆妍1,劉旭1,王繼釗1,屈航英2,張佳1,王健生1段小藝1
(1.西安交通大學第一附屬醫院,西安市 710061; 2.陜西中醫藥大學第二附屬醫院,陜西省咸陽市 712000)
【摘要】隨著數據的爆炸與信息技術的發展,如何挖掘與利用大數據的價值成為當今社會關注的焦點。單病種協作網絡中不斷積累的數據具有大數據的4V特點,單病種協作體系應當順應大數據時代的客觀背景需求進行發展。在數據安全、個人隱私和數據產權等諸多難題的挑戰下,如何完成體系內海量數據的收集、存儲、質控、挖掘與利用,并將體系大數據價值充分作用于臨床決策與科研和醫療服務兩大領域是值得我們思考的問題。
【關鍵詞】單病種協作;大數據;數據挖掘;安全與隱私;質量控制
數據科學正在成為一個新興的領域,大數據是信息時代發展所必須面對的問題與挑戰。近年來,各領域數據量成幾何增長,大數據多種價值在各種領域,特別是醫學生物學領域被不斷證明。大數據掙脫了小樣本理論的束縛,能直白地解釋與預測科學與社會發展規律,在未來社會的發展與規劃中起到革命性的作用。已經開展11年的單病種協作體系積累的數據具有大數據的特點,如何充分挖掘、利用體系平臺中大量醫療數據的價值,使單病種協作體系愈加完善是順應數據時代要求、更好促進單病種防治協作的有效舉措。
1大數據時代來自數據的挑戰
1.1大數據時代的必然性
隨著信息技術的不斷發展,計算機與互聯網逐漸滲透到人類生活的各個角落,為了方便信息的處理與記錄,加強環境探索與自我探索,社會環境與每一個個體都盡可能地被數字化。此時,結構化數據已不能滿足人類的需要,占人類信息總量的80%,以全文文本、圖像、聲音、影視、超媒體為代表的,邏輯性更強的非結構化數據領域飛速發展,并開始被記錄。很小一部分人類活動信息得以記錄與保存,成為人類探索環境與自我探索的寶貴財富。僅這一部分數據量之大已超乎想象,只能以估算的方式加以統計[1-2]。
1.2大數據的概念及特性
大數據這一概念的專業化最早可以追溯到《自然》雜志2008年9月專刊中發表的文章BigData:scienceinthePetabyteEra,文章中探討了科研形式在大數據產生時發生的變化[3]。其后Science、麥肯錫、IDC相繼發表了關于大數據的期刊文章和調查報告,闡釋了全球數據量的飛速增長的背景,肯定了大數據的高生產價值與創新價值(用于美國醫療保險僅一年可產生約3 000億美元的價值),強調大數據是下一個創新、競爭與發展并存的前沿科學,從包括生物醫藥的多個方面介紹了大數據所帶來的機遇和技術挑戰,以美國為代表的發達國家紛紛開展大數據的開發、利用工作,作為新一輪國際競爭的重要突破點[4-6]。之后IBM提出大數據的4V特性“數量(Volume)、多樣性(Variety)、速度(Velocity)和價值(Value)” ,全面地推進了全球大數據戰略,2013年在4V的基礎上增加了第5V真實性(Veracity)。現在,大數據這一名詞有了較為統一的認識,即一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合,具有4V特點的數據集[7]。
由上可見,大數據是人類進入信息時代,伴隨科學技術發展而自然產生的重要資料與科學問題,在各領域如何正確認識與利用大數據的價值是值得認真思考的問題。
2單病種協作平臺的數據屬于大數據范疇
2.1單病種協作模式的基本概念
單病種協作體系是由相關專業知名專家組成,以某一疾病防治為目的的協作網絡體系,主要以某一種疾病的防治為切入點,在協作醫院和高校附屬醫院之間建立區域化協作平臺,通過預防為主、防治結合的協作模式,幫助基層醫院建立并完善該疾病的防治體系,更好地為區域內的人群提供優質高效的醫療服務,同時建立疾病數據庫,最終實現大型醫院、協作醫院和患者三方的互利共贏[8]。
陜西省抗癌協會于2004年實施單病種協作模式,已在全省初步建立乳腺疾病的單病種協作網絡體系,由國內、省內乳腺疾病及相關領域知名專家為指導團,并選擇省內10個行政區內具有代表性的基層醫療機構為協作單位,試點將村醫群體納入協作團隊,展開乳腺疾病特別是乳腺癌防止與響應的密切合作[9-10]。
2.2單病種協作體系中的數據符合大數據的特點與要求
2.2.1體系數據樣本量大,種類多樣。單病種協作體系團隊擁有4 000多名成員,基本覆蓋陜西省86個縣內所有單病種病人,建立了完善的區域單病種醫療數據庫,除了傳統的關系數據類型,也包括以圖像、網頁、視頻、音頻、電子郵件、文檔等形式存在的未加工的、半結構化的和非結構化的數據,并隨病人的健康狀況而不斷累積,符合大數據數據量大、數據多樣的特點[11]。
2.2.2實時響應與高速轉診。 單病種協作平臺以強大的專業團隊成員為依托,要求通過協作網絡,以三級轉診為依托,實時響應病人的就診信息,根據病情與病人的要求進行分診處理。不僅使病人迅速得到治療,還能確保各類病人都能得到符合預期的服務。
2.2.3數據價值高,價值密度低。單信息在以綜合判斷為主的傳統醫療健康領域價值很低,和直面病人收集到的數據相比較,單病種協作網絡平臺上面對的病人數據更存在內容無關、重復、不準確甚至錯誤,類型復雜、多樣的特點,這樣的數據價值密度更低,需要通過多種數據的整合來提煉大數據價值。
3大數據時代背景下單病種協作模式的發展方向
雖然大數據的價值已被各個領域不斷證實,作為一門新興學科,大數據在各領域的普遍利用仍不夠成熟,單病種協作體系還需要不斷發展與完善。
3.1數據的收集、存儲
首先,在數據收集方面,患者與醫生信息的天然不對等,使得患者借助網絡傳遞的疾病與檢查信息可能存在片面甚至錯誤的問題。醫學生命科學是一門嚴謹的科學,為了避免錯誤信息對診斷和治療的干擾,單病種協作平臺必須根據相關疾病特征設計相應的問診流程與復查制度,方便網絡患者的表述并對數據進行多角度的完善,盡可能地去偽存真,確保數據的全面性和可信性。
其次,生物醫療數據是大數據的重要組成部分和起源之一。僅一個病人的影像學數據就可達十多GB,在實現低成本、高保真、易檢索、易提取的目標,在冗余配置、云計算等相關技術的基礎上,仍需要針對平臺數據的特點,進一步對數據進行過濾和去重,減少存儲量[1]。
3.2數據質量控制
單病種協作平臺數據的來源廣、數量大、種類多,低質量的數據會極大地浪費傳輸和存儲資源,降低處理效率,錯誤的數據甚至會產生錯誤的結論。單病種協作體系應當建立統一的數據處理標準、檢驗標準和科學的抽樣檢查方案,以便剔除冗余數據,保證數據準確性[12]。從而方便各類數據的挖掘分析,有效地找出疾病成因,進而提供有針對性的預防、診斷和治療措施。
3.3數據挖掘
醫學生命科學是一門經驗科學,僅單個病種就涉及高達上百個檢驗相關參數,還有難以應用傳統方法表述的影像學信息。同時,隨著醫院級別的不同,相關參數的可信度也不一致。這些都對數據的挖掘造成了很大的困難。除了保證數據的收集和質控環節外,單病種協作體系應當加強對影像資料描述信息的動態分析和管理,并制定針對不同來源的數據可信度評價,以便于醫療數據的挖掘。
3.4數據利用
數據利用是大數據時代背景下單病種協作模式發展的最終目的。單病種協作體系致力于利用協作體系內的大數據價值升級臨床決策與科研和醫療服務兩大領域的運行模式。通過對協作體系內大數據的挖掘,可以建立公共健康檔案與預警系統,完成疾病的監控與響應,并根據疾病發病前的特征預測疾病相關風險因素,做好疾病預防,減少醫療支出;匯總臨床治療結果,獲取最佳性價比的臨床決策,降低臨床研究成本,提高臨床研究結果的價值;提高醫療數據透明度,優化三級轉診服務與醫院就診流程,降低國家醫療支出與醫院管理成本,降低醫、患、社會三方的醫療壓力。
3.5人才培養
隨著醫療信息化的深入與互聯網醫療平臺的發展,如何收集、處理、分析數據日益成為醫學大數據發展的重中之重。培養數據挖掘、機器學習等高級數據分析技術人才是促進醫學數據向知識轉化,將理論知識應用于臨床的關鍵[13]。大數據量、高速增長、多樣化、高價值的數據庫的管理過程中,涉及醫學、管理學、信息學、數理統計學等多學科知識。數據管理人員必須強化數據向知識的轉化、數據收集、數據隱私保護、數據聯機分析、數據挖掘、數據可視化知識與技能[14-15]。目前,這種貫通多學科的綜合人才還比較少,單病種協作體系需要大力培養跨專業人才,滿足在大數據時代背景下醫療數據分析、處理方面的需求。
4大數據背景下單病種協作模式面臨的挑戰
大數據浪潮的飛速發展遠超社會預期,相關理論、標準、模式與法規仍顯稚嫩,需要隨著問題的出現被不斷完善。因此,在相對陌生的大數據領域,單病種協作模式也面臨一些挑戰。
4.1數據安全與隱私保護
在數據的價值被逐步認可的今天,更大的數據量意味著更高的價值,大數據已然成為不法分子利用與竊取的對象。近年來,互聯網廠商頻發用戶隱私被泄露的事件,反映了我國在數據保護方面存在的安全隱患[16-17]。不同于社交網絡資料,醫療資料特別是病例、醫保等資料涉及的內容更敏感也更為隱私,在互聯網背景下,面對多級協作單位,如何保證單病種協作平臺的數據安全是我們應該重視并加以解決的問題。
4.2數據產權
國際上一直關注有關數據的立法問題,我國目前還沒有一部關于數據方面的正式法律問世。單病種協作平臺數據來源十分廣泛,區分好公共數據與專有數據,平衡好數據開發者、原始數據擁有者、社會公眾等各方利益有利于單病種協作模式的發展壯大與維護數據安全[18]。
大數據為單病種協作模式的發展提出了巨大的挑戰和新的機遇,單病種協作模式與大數據的結合具有極高的理論價值與實踐意義。大數據時代背景下單病種協作模式的發展是大數據在醫學領域的嶄新探索:以構建實時、便捷、全方位的協作平臺為基礎,充分發掘數據價值,為個體化診療服務,改變醫療研究、研發、診療模式。
參考文獻
[1]繆其浩.大數據時代來臨,你準備好了嗎[J],科技潮,2012,(9):54-55.
[2]鄔賀銓.大數據時代的機遇與挑戰[J].信息安全與通信保密,2013,(3):9-10.
[3]Graham-Rowe D,Goldston D,Doctorow C,et al.Big data:Science in the petabyte era[J].Nature,2008,455(7209):8-9.
[4]Science Staff.Dealing with data.Challenges and opportunities.Introduction[J].Science,2011,331(6018):692-693.
[5]于艷華,宋美娜.大數據[J].中興通訊技術,2013,19(1):57-60.
[6]李昆陽.云存儲技術理論研究[J].計算機光盤軟件與應用,2014,(9):47-48.
[7]Margolis R,Derr L,Dunn M,et al.The National Institutes of Health′s Big Data to Knowledge (BD2K) initiative:capitalizing on biomedical big data[J].Journal of the American Medical Informatics Association,2014,21(6):957-958.
[8]范炳文,王昌燕,郭生平,等.單病種協作在構建協調統一的衛生服務體系中的作用探討[J].中國初級衛生保健,2011,25(9):1-2.
[9]吳宏培,葉爾買克·唐沙哈爾,李松,等.基于單病種協作防治體系的胃癌區域化合作防治策略探討[J].中國農村衛生事業管理,2012,32(5):507-508.
[10]魯鳴,葉爾買克·唐沙哈爾,王健生,等.單病種協作對腫瘤綜合治療促進作用探討[J].中國腫瘤,2012,21(1):48-50.
[11]趙屹,卜德超.當生物醫學遇上大數據[J].北大商業評論,2015,(3):74-79.
[12]陶雪嬌,胡曉峰,劉洋.大數據研究綜述[J].系統仿真學報,2013,Suppl(25):142-146.
[13]左建安,陳雅.基于大數據環境的科學數據共享模式研究[J].情報雜志,2013,32(12):151-154.
[14]涂子沛.大數據:正在到來的數據革命[M].桂林:廣西師范大學出版社,2013.
[15]王曉東,吳雅琴.大數據時代醫學信息管理專業人才培養[J].醫學信息學雜志,2014,35(01):83-85.
[16]馮登國,張敏,李昊,等.大數據安全與隱私保護[J].計算機學報,2014,37(1):246-258.
[17]劉雅輝,張鐵贏,靳小龍,等.大數據時代的個人隱私保護[J].計算機研究與發展,2015,52(1):229-247.
[18]黃立芳.大數據時代呼喚數據產權[J].法制博覽,2014,(12):50-51.
修回日期:2016-05-04
(編輯曹曉蕓)
【中圖分類號】R197
【文獻標識碼】A
【文章編號】1672-4232(2016)03-0086-03
【DOI編碼】10.3969/j.issn.1672-4232.2016.03.027
通信作者:段小藝(1974-),女,博士,副教授;研究方向:重大疾病影像學診斷。
收稿日期:2016-01-08
Discussion of Single-disease Cooperation Mode under the Background of Big Data
YAN Yan1,LIU Xu1,WANG Ji-zhao1,QU Hang-ying2,ZHANG Jia1,WANG Jian-sheng1,DUAN Xiao-yi1
(1.The First Affiliated Hospital of Xi′an Jiaotong University,Xi′an 710061,China; 2.The Second Affiliated Hospital of Shaanxi University of Chinese Medicine,Xianyang,Shaanxi 712000,China)
【Abstract】With the explosion of data and the development of information technology,the value of data mining and data exploitation has become the concern of the society.The gradually accumulated online data on single-disease cooperation has 4V characteristics,and the single-disease cooperation system should comply with the objective background of big data and develop.With the challenges of data safety,personal privacy,and data property right,we should consider the way to collect,store,mine,exploit and control the quality of huge amount of data within the system and apply the value of big data into clinical decision,scientific research,and medical service.
【Key words】single-disease cooperation; big data; data mining; safety and privacy; quality monitoring