
《醫療革命:醫學數據挖掘的理論與實踐》
作 者:邵學杰
出 版 社:電子工業出版社
出版時間:2016年9月
近幾年,“大數據”一詞突然變得很火,不僅納入阿里、谷歌等互聯網公司的戰略規劃中,同時也在政府工作報告中多次被提及,大數據無疑成為當今互聯網世界的寵兒。管仲曾說過:“不明于數欲舉大事,如舟之無楫而欲行于大海也。”意思是說,在不清楚相關數據的情況下想做大事,無疑是沒有槳的船想航行于汪洋大海中一樣。也就是說,在醫療大數據的時代下,“dry lab”的醫療數據研究將會是協助醫學領域快速進步的一大重要關鍵點。
然而在醫學領域,雖然醫學數據技術帶來了臨床醫學科研的革命性進步,但是目前大多數醫院對數據庫的處理有限。如何利用大量數據信息來為疾病的診斷和治療提供科學的決策,總結各種更有效的治療方案?如何更好地為醫院的決策管理、醫療、科研和教學服務?已越來越為人民所關注。基于此,醫學數據需要挖掘,但是如何挖掘醫學數據呢?
我國醫學大數據概念提出的實踐者與先行者邵學杰在他的《醫療革命:醫學數據挖掘的理論與實踐》一書中給出了答案。該書以數據挖掘與模式識別的七大原理在臨床醫學中的運用案例為切入點,系統而全面地介紹了醫學數據挖掘的基本方法與原理,對數據分析的常用算法進行了通俗易懂的講解。該書最大的特色是采用了案例分析與實證的方法,每一個原理、算法都在案例講解中生動地體現出來。更重要的是,該書對臨床醫學的數據挖掘與模式識別技術進行了開創性、系統性的討論,用案例展示了數據挖掘技術如何與臨床醫學相結合。醫學數據模式識別的七大原理與案例講解是本書具有獨創性的對醫學數據技術的全面概括與總結,七大原理的首次提出也是醫學數據挖掘技術上升到系統理論的重要實踐與創新。無論是預測性建模、解釋性建模、知識性建模與描述性建模,抑或是序列模式建模、依賴關系建模、異常模式建模,模式識別的類型規律躍然紙上,為讀者厘清了數據挖掘與模式識別的基本類型特征。
不僅如此,該書所有概念的講解基本結構為原理講解與案例實操的二元結構,重點探討了數據挖掘技術如何與臨床醫學深度融合,如何運用現代的數據挖掘理念、模式識別與機器學習的基本方法解決臨床科研中的應用問題,為廣大的醫學數據分析人員找到了行業應用的范例。凡認真閱讀該書的讀者都會從理論與實操兩個層面全面、系統、實用地了解醫學數據挖掘的原理與方法。