駱夏草
摘 要 伴隨著信息技術高速發展,信息的提取和利用技術逐漸占據重要地位。本文首先介紹了數據挖掘的概況,其次基于挖掘技術提取某市級三甲醫院上報的肝炎病例,通過細致研究和探討,分析該醫院服務范圍內2008-2016年肝炎的流行趨勢,對本地區做好肝炎的防控工作提供數據依據和支持,以發揮數據挖掘的最大價值。
【關鍵詞】數據挖掘 流行趨勢 防控措施
本研究基于挖掘技術對市某三級甲等醫院信息系統中的數據進行提取與處理,以2008年1月~2016年12月時間段內診斷并上報的肝炎臨床資料為例,深入研究肝炎的發病規律和流行趨勢,為更好地預防和控制該地區肝炎的流行提供科學依據。
1 數據挖掘的概述
1.1 數據挖掘的概念
數據挖掘也稱數掘庫中的知識發現(Knowledge Discovery in Databases),簡稱:知識發現(KDD)。就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中,提取隱含在其中的、人們事先不知道的、但又是潛在有用的信息和知識的過程。數據挖掘與傳統的查詢、報表等數據分析方法具有本質的區別,主要表現在數據挖掘在對業務信息進行挖掘時并沒有明確的目標。
1.2 醫療信息數據的挖掘過程
數據挖掘是一個交互,反復的過程,鑒于醫療信息數據的特點,對它的挖掘不同于常規的數據挖掘,但依然有規則可循,一般分為以下幾個過程進行(如圖1)。
2 原始數據的特征和提取方法
醫院業務生產中產生的數據與其它行業生產積累的數據相比,有其自身的獨特性。醫生在診治過程中產生的數據,包括與病人的交談記錄,各種醫學儀器拍攝的圖片,主觀的觀察說明等,這些醫療信息數據基本具有多樣化、非標準化、低數學性、私密性、不完整性、冗余性、時效性等特點。
本文將研究的數據為某三甲醫院運營中所產生的業務數據,多個數據表存儲有相同字段,病人信息表,病案主頁表,病人診斷記錄是各自獨立的,三個表之間通過病人id進行關聯,提取本次研究所用到的字段。2008年~2016年,該院共報告肝炎病例12910例,大大高于其他傳染病種,故選取肝炎病例作為本次挖掘的資料來源。
3 挖掘實例分析
3.1 某三級甲等醫院肝炎上報病例流行趨勢
其中男性病例為8075例(62.55%),女性病例為4835例(37.45%),男女性別比:1.67:1;平均發病年齡(43.86±13.48)歲,未發現死亡病例;從肝炎的型別看,乙肝病例11300例(87.53%),丙肝1583例(12.26%),其他肝炎27例(0.21%)。
該院2008~2012年肝炎上報病例的變化趨勢如圖2所示,乙肝上報病例數呈明顯上升趨勢,至2013年達到高峰后又逐年下降;丙肝上報病例也呈明顯上升趨勢,但上升速度慢于乙肝。
3.2 某三級甲等醫院肝炎上報病例的年齡分布
該院上報的肝炎病例發病年齡為1~92歲,乙肝病例的平均發病年齡為(42.61±13.46)歲,男性(41.12±12.40)歲,女性(45.39±13.46)歲,該院上報的男性乙肝病例年齡低于女性乙肝病例。丙肝病例的平均發病年齡為(52.78±13.83)歲,男性(51.71±15.60)歲,女性(53.65±12.68)歲,男性丙肝病例的年齡也低于女性乙肝病例。
該院上報的肝炎病例的年齡變化趨勢見圖3,可見,乙肝病例以31~45歲組最多,丙肝以46~65歲組最多。
3.3 討論與分析
本研究的結果顯示乙肝病例占該院上報肝炎病例的87.53%,是名副其實的肝炎優勢病種,這提示:在該院服務半徑內,肝炎(特別是乙型肝炎)仍需要廣大居民采用主動、積極的預防措施。該院上報的肝炎發病年齡集中在31~66歲的青壯年,男性病例遠多于女性;目前,接種肝炎疫苗是有效防控肝炎流行的最為有效、最為經濟的預防措施之一。有研究報道:隨著乙肝疫苗及時接種率提高及高危人群疫苗接種的加強,乙肝病毒攜帶人數將逐漸下降,從而引起總體發病率的下降。2013~2016年,該院上報的乙肝病例呈現明顯的下降趨勢,提示:這可能是本地區采取的加強乙肝疫苗的接種政策取得了積極有效的防治效果,與上述報道一致。另有研究表明,丙肝疾病的自然過程和感染機率的增加是老年齡組人群丙肝發病率增加的原因,丙肝發病率在30歲以下年齡組人群發病率較低,發病高峰向老年齡組轉移;該流行特征與本研究結果基本一致。
4 結果與建議
通過數據挖掘技術,對現有數據進行再利用,提出以下建議,以期達到提高工作針對性的目的。
(1)在加強<15歲兒童肝炎疫苗查漏補種工作的同時,針對成年人群(尤其是30~60隨年齡組)進行乙肝和丙肝疫苗的強化接種,提高全人群的肝炎抗體水平,在高危人群中建立有效的免疫屏障。
(2)加強對≥40歲年齡組人群加強血源及不安全注射的管理,強化該年齡段人群的衛生意識,并開展針對流動人口的丙肝抗體監測與管理,及時查漏補種丙肝疫苗,強化免疫。
(3)對廣大居民加強健康宣傳教育,加大肝炎防控知識的宣傳,特別是針對重點人群普及乙肝傳播途徑的知曉面;同時積極引導廣大居民培養良好的衛生習慣,提高主動預防各類肝炎的意識,減緩肝炎病毒的傳播。
參考文獻
[1]John Satzinger,Robert Jackson,Stephen Burd.系統分析與設計(第四版)[M].北京:機械工業出版社,2009:275-480.
[2]彭統乾.教學管理決策支持系統中數據倉庫的設計與實現[D].西安:西安電子科技大學,2011:22-37.
[3]Lin TY.Data Miningand Machine Oriented Modeling:Agranular Computing Approach[J].Applied Intelligence,2000,13(02):113-124.
[4]洪弘.醫療數據挖掘的特點_過程及方法[J].價值工程,2011,32-0166-02.
[5]張萬軍,張瑾,袁兆虎等.江蘇省鎮江市2004-2015年病毒性肝炎流行特征分析[J].中國衛生統計,2017,34(02):240-242,246.
[6]張麗,劉甲野,呂靜靜等.2014年山東省育齡期婦女乙型肝炎流行現狀分析[J].中華預防醫學雜志,2017,51(06):475-479.
[7]黃麗芳,周勇,鄭金鳳等.福建省乙型肝炎高流行區急性乙型肝炎發病影響因素研究[J].中華預防醫學雜志,2016,50(12):1102-1104.
[8]嵇瑋嘉,顏學兵.2016年與2015年歐洲肝病學會丙型肝炎治療指南關于直接抗病毒藥及藥物間相互作用的比較[J].臨床肝膽病雜志,2017,33(06):1033-1039.
[9]中華醫學會肝病學分會,中華醫學會感染病學分會.丙型肝炎防治指南(2015年更新版)[J].中華實驗和臨床感染病雜志(電子版),2015,9(05):590-607.
作者單位
西安市中醫醫院 陜西省西安市 710021