



摘要:本文探討了大數據背景下疾控中心檔案信息化建設與應用的策略。文章指出,隨著大數據技術的快速發展,疾控中心應拓展數據采集渠道,全面掌握疾病特征與傳播規律;通過深度挖掘數據價值和實現信息資源共享,提升數據的應用效能;并通過規范化建設管理、數據化歸檔及智能化分析預測,拓寬檔案的利用領域。這些措施將有助于疾控中心更高效地應對公共衛生挑戰,全面提升疾病防控能力。
關鍵詞:大數據;疾控中心;檔案信息化;規范化管理;智能化分析
中圖分類號:TP391文獻標識碼:A
文章編號:1009-3044(2024)34-0070-04開放科學(資源服務)標識碼(OSID):
0引言
大數據技術引發了當代社會經濟結構的重大變革,并廣泛應用于各個領域。疾控中心的檔案管理不應僅限于紙質檔案的延伸和備份,而應順應大數據發展的趨勢,加快信息化和數字化進程。通過獲取海量數據、挖掘潛在信息、應用數據預測等手段,探索疾控中心檔案管理的新路徑,以更好地支撐疫情防控工作[1]。
1獲取海量數據,擴充檔案信息容量
目前,疾控中心的紙質檔案信息及信息系統中的數據信息,雖然看似種類繁多、數量龐大,但實際上還只是“海量”數據中的“一滴水”。21世紀初,全球數字存儲的信息僅占全球數據量的1/4,其余3/4的信息仍存儲在報紙、膠片、盒式磁帶等模擬媒介中。然而,到2007年,所有數據中僅有7%仍存儲于報紙、書籍、圖片等媒介上的模擬數據,其余全部轉化為數字數據。到2013年,非數字數據的比例進一步下降到不到2%。
特別是,隨著谷歌公司將書籍數據化構建數字圖書館,GPS將地理方位數據化發明全球定位系統,微信、QQ將人類溝通交流數據化構建新型社交網絡,數字化的范圍和深度不斷擴展。如今,數字、文字、圖片,甚至方位、溝通、情感等都已經或即將被數據化??梢哉f,每個用戶個體都成為一個“海量信息數據庫”。
面對這些海量數據,疾控中心的檔案管理工作需要引入“大數據”理念,積極研究創新管理手段,以適應時代需求(如圖1)。
1.1擴大獲取數據范圍
為了全面收集個體疾病的海量數據并確保其覆蓋全域全維,疾控中心需要采用系統化的方法擴大數據的獲取范圍。這不僅意味著要全面收集各種疾病類型的數據,還需要詳細記錄每次疾病處置的效果。同時,對于個體信息,如個人體質、感染程度和抗病能力等,也須進行細致地收集[2]。
在疾病數據方面,疾控中心應注意鑒別由病毒或細菌變異亞種引起的疾病,如H1N1流感、中東呼吸綜合征(MERS)等,并記錄每次疾病應對方案的實施情況及最終效果,包括評估治療方案、預防措施、隔離政策等的實施效果,并從中總結經驗教訓。這將有助于疾控中心在未來采取更有效的疾病防治措施。
在個體信息方面,疾控中心需整合個人體質、感染狀況和免疫力等數據。這些數據可通過對接健康碼、行程碼及醫療健康檔案等獲取。同時,與保健機構和大健康產業的協作也將助力收集更多健康和疾病風險信息。
拓寬疾病數據采集范圍,疾控中心能夠更深入理解疾病特性和傳播趨勢,進而制定精準的防治策略。同時,詳盡的個體信息有助于識別疾病差異,實現醫療服務的個性化。這將提高疫情防控的效率和效果,保護公眾健康和安全[3]。
1.2拓寬獲取數據途徑
為了豐富疾控中心的數據來源并提高數據質量,疾控中心應與醫療機構和疫情防控機構建立合作機制。這種合作不僅能有效收集基礎數據,還能通過協同工作提升數據的準確性和完整性。通過合作,疾控中心能獲取個體體質、疾病預防、發病風險和可控性等關鍵信息,對疾病預防和控制至關重要。此策略不僅提升了信息化水平,還增強了對公共衛生事件的響應能力和決策支持能力。多元化的數據獲取手段使疾控中心能提供精準、個性化的健康服務,支持疫情防控。
疾控中心還應與相關單位建立定期交流和數據共享機制,以及緊急事件快速響應機制,以便疫情發生時迅速交換信息。如利用健康碼、行程碼和醫療健康檔案等數據庫,通過技術手段實現數據的有效對接,提升收集效率。同時,與保健機構和大健康產業緊密合作,共建健康信息平臺,服務公共衛生。
最后,疾控中心應廣泛覆蓋醫療保健機構、大數據平臺的健康檢測信息、媒體網絡信息等領域,進行綜合分析和數據驗證。這不僅需要技術支持,還需跨部門、跨機構之間的協同合作[4]。
1.3設定獲取數據時限
為確保疾控中心能夠全面并及時地獲取檔案信息,設立數據獲取時限至關重要。此舉有助于疾控中心在緊張的工作中保持秩序,同時保證數據的時效性與準確性。設立時限的目的是確保檔案信息的連貫性與完整性。考慮到時間和資源的限制,實現數據的實時、全時獲取存在一定困難。通過設定上報周期,如每月、每季、每半年或每年,疾控中心能夠有序地收集和更新數據,實時掌握疫情動態和防控進展。
具體操作步驟包括:制定數據收集時間表,明確不同上報周期;提前通知相關部門準備數據;在收集和整理數據時,確保其準確性與完整性;將數據上報至檔案管理部門,由專人負責審核歸檔;利用最新數據進行分析,及時更新檔案,指導疫情防控。在疫情處置前后,疾控中心需采取靈活、及時的策略收集和更新數據,包括通過監測預警系統收集疫情前信息;啟動緊急收集程序,實時追蹤疫情;疫情控制后總結評估,優化防控策略。
通過時限設置與數據策略,疾控中心能夠準確掌握疫情動態,為防控工作提供及時、精準的信息,促進科學決策,提高應對突發公共衛生事件的能力。
2挖掘潛在數據,萃取檔案信息精華
獲取疾控海量數據只是完成了第一步,還需要根據疾控信息的不同需求,挖掘數據的潛在價值并加以利用。例如,沃爾瑪作為世界最大的零售商,擁有超過2000萬員工,年銷售額約4500億美元。2004年,沃爾瑪對其歷史交易記錄這一龐大數據庫進行了觀察分析。該數據庫不僅記錄了每位顧客的購物清單及消費金額,還包括購物籃中的具體物品、購買時間,甚至購買當日的天氣。他們發現,每當季節性颶風來臨之前,不僅手電筒的銷售量會增加,POP-Tarts蛋撻的銷量也會顯著上升。因此,在季節性風暴來臨時,沃爾瑪會將庫存蛋撻放置在靠近颶風用品的位置,以方便顧客購買,從而增加銷量。沃爾瑪的成功在于發現了手電筒、蛋撻與颶風之間的潛在數據價值,并分析它們的關聯性,將其轉化為商業行為以獲取利益。
同樣,如何準確挖掘并利用疾控信息數據,為有效預防和處置疫情提供有價值的信息和真實可靠的參考依據,是疾控中心的重點關注事項,同時也是用戶關心的問題。疾控中心需要善于從看似毫不相關的雜亂、無序、重復的信息中找出關聯性,挖掘出潛在價值(如圖2)。
2.1數據深度挖掘
從效率的角度來看,傳統信息獲取方式存在明顯的局限性。這種方法主要依賴于官方通告、內部資源以及開源信息,導致所收集的信息零散且缺乏深度。為了提升信息獲取的效率與質量,拓寬信息特征并豐富搜索關鍵詞至關重要,以捕獲更有價值的信息。
傳統的信息搜集手段過于依賴有限的信息源,例如政府公告、學術期刊和公共數據庫。這些來源的信息可能存在更新延遲、涵蓋范圍有限以及缺乏深入分析的問題。此外,信息來源的單一性容易導致信息偏差和局限性。
為克服這些障礙,疾控中心需擴展信息維度并增加搜索關鍵詞。這包括應用網絡爬蟲技術廣泛收集互聯網數據,利用自然語言處理技術深入分析文本數據,以及采用機器學習算法進行智能化分析。通過這些先進技術,疾控中心能夠獲取更廣泛、更深入的信息,從而提高決策的精確性和效率。
此外,采用基于聯盟鏈技術的檔案系統及疾控電子檔案模塊,對于提升信息獲取效率尤為重要。聯盟鏈技術確保了數據的安全性和可信度,促進了跨部門間的數據共享與協作。而疾控電子檔案模塊則允許專業人員查閱和更新數據,同時由業務部門負責監督和確認數據內容。通過這種方式,可構建一個動態更新、全程記錄、客觀可信、全面監督的電子檔案管理系統,實現數據在物理上的分散與邏輯上的統一。
通過深度挖掘數據并采納先進的檔案管理系統,疾控中心能夠更好地應對信息獲取的挑戰,提高數據分析的準確性,為疫情防控和公共衛生決策提供更有力的支持。這不僅有助于提升疾控中心的工作效率,也能增強其在公共衛生領域的專業性和權威性[5]。
2.2實現信息資源交互共享
在疾病防控工作中,各業務系統往往局限于特定領域,形成了信息“孤島”與“數據壁壘”。這些系統普遍缺乏數據共享和智能分析的機制。為破解這一難題,采用聯盟鏈技術促進信息共享與分析顯得尤為關鍵。
信息“孤島”和“數據壁壘”意味著系統間獨立運作,數據共享與整合困難重重。系統之間各自為戰,缺乏有效的數據交換與整合手段,進而引發數據隔離,影響了綜合分析和決策的效率。
針對這一問題,聯盟鏈技術能夠分布式整合不同業務系統。作為一種多中心化的區塊鏈技術,聯盟鏈支持多個組織共同維護賬本,確保數據安全、高效地共享與協作。通過公私密鑰機制和訪問控制,聯盟鏈為數據安全和隱私保護提供了堅實保障。
在此基礎上,引入大數據分析工具,為不同部門設置公私密鑰,以保障數據的維護與監管。這些工具能夠跨越層級和部門界限,促進數據的交互、共建和共享,有效打破信息障礙。借助機器學習、數據挖掘和人工智能算法,大數據分析工具能夠深入挖掘數據間的復雜關聯,提供全面而精確的決策支持,進一步增強疾控中心的專業能力。
利用聯盟鏈技術和大數據分析工具,疾控中心能夠實現業務系統間的信息共享與協同分析。這種集成式數據管理模式有助于提高疾控中心的決策能力和疾病防控成效,促進跨部門、跨領域的合作與創新。此外,信息共享還能夠提升公共衛生系統的運作效率和應急響應速度,更好地應對突發公共衛生事件。
3運用數據預測,拓寬檔案利用領域
2009年,甲型H1N1流感暴發的幾周前,互聯網巨頭谷歌在《自然》雜志上發表了一篇引人矚目的論文,解釋了谷歌為何能夠預測冬季流感傳播,并且可以具體到特定地區。谷歌公司將5000萬條美國人最頻繁檢索的詞條與美國疾控中心在2003年到2008年間季節性流感傳播時期的數據進行了比較。通過處理4.5億個不同數學模型,并將結果與2007年、2008年美國疾控中心記錄的實際流感病例比對后,谷歌找到了一組包含45條檢索詞條的組合。將這些詞條用于一個特定的數學模型后,谷歌的預測與官方數據的相關性高達97%,預測結果非常準確且及時。這充分展示了“大數據”在流感傳播預測中的強大能力。
要將“大數據”理念應用于疾控中心檔案管理,就需要不斷拓展檔案服務和利用領域(如圖3)。
3.1規范化建設管理
規范化建設管理對疾控中心檔案信息化建設起著關鍵作用。它涵蓋電子文件歸檔管理以及檔案信息資源的獲取、存儲、查詢和利用等多個環節。建立健全科學、嚴密、安全的疾控檔案信息化管理制度,對于防止信息失真、確保檔案安全具有重要意義。
首先,電子文件的歸檔和管理至關重要。隨著數字化進程的加速,越來越多的檔案以電子文件形式存在。對這些電子文件進行有效歸檔和管理,不僅能夠提高工作效率,還能確保信息的長期保存和可追溯性。因此,疾控中心需建立一套完整的電子文件管理制度,涵蓋文件的分類、命名、存儲、備份、檢索和銷毀等方面。
其次,建立安全的疾控檔案信息化管理制度是保障檔案安全的關鍵。這包括制定嚴格的檔案數據集管理統一標準,對檔案材料和其他信息資源的收集積累、歸檔驗收、安全保密等環節進行規范。此外,還需建立信息安全防護措施,如數據加密、訪問控制和網絡安全等,以防止檔案數據被非法訪問、篡改和泄露。
最后,擴大疾控電子檔案的應用范圍是在確保信息安全的前提下提高檔案利用效率的重要措施??梢酝ㄟ^設置查閱權限,允許相關單位調閱電子檔案,以便核實相關信息。這不僅能夠解決當前與信息化管理不相適應的問題,還能促進信息的共享和利用,從而提高疾控中心的工作效率。
綜上所述,規范化建設管理是確保疾控中心檔案信息化建設順利進行的重要保障。通過建立完善的電子文件歸檔和管理制度,制定安全的檔案信息化管理制度,以及擴大電子檔案的應用范圍,疾控中心能夠更好地應對公共衛生挑戰,提高疾病防控能力[6]。
3.2數據化歸檔建檔
疾控中心的檔案電子化和數據化是實現檔案管理信息化的基礎。這種轉換不僅能夠提高檔案管理效率,還能確保檔案材料的真實性和原始性。通過構建電子檔案與紙質材料的對應關系,疾控中心確保了檔案信息的準確性和完整性[7]。
利用電子掃描技術,將紙質檔案逐件轉換為電子圖片,建立電子檔案與紙質材料的對應關系。這種轉換既保留了檔案的原貌,又便于存儲和檢索。轉換后的電子檔案按照統一的排序和標準格式進行存儲,既保持了檔案的原始性,又提高了檔案管理效率。
信息系統的使用是檔案管理信息化的關鍵。疾控中心通過信息技術從源頭上規范化管理檔案材料,例如將病癥表現、疫情特點和防控要點等信息納入信息系統,使檔案在形成初期就實現數據化和信息化,有效避免了檔案材料失實和信息不準確的問題。
通過數據化歸檔建檔,疾控中心不僅提升了檔案管理效率,還確保了檔案的真實性和原始性,為檔案的長期保存和高效利用奠定了基礎。同時,數據化歸檔建檔也助力疾控中心更好地應對公共衛生事件,提高疾病防控能力。
3.3智能化分析預測
疾控中心檔案信息化管理系統的功能設計應全面且智能化。系統應包括組織機構信息、人員信息、檔案目錄、轉遞查詢(借閱)、材料收集、整理記錄、缺失登記和統計查詢等功能。這樣的設計將使疾控檔案材料的管理和使用更加智能化。
通過標準化的管理軟件,疾控中心能夠快速查閱材料、統計數據、分析情況、提出處置意見并打印報表。這種功能設計有助于疾控中心充分挖掘檔案信息資源的價值,為疫情防控和預測工作提供決策支持。此外,標準化的管理軟件還能幫助管理人員快速、準確地處理大量數據,提高工作效率。
在疫情分析和預測方面,利用計算機永久保存疫情特征和病例的電子檔案,為歷史事實和未來情況預測提供重要依據。在工作調整時,留存電子檔案以備查閱,并復制一份隨紙質材料轉遞。這種方式確保檔案資料的安全性和可靠性,并為決策者提供準確的歷史數據和趨勢分析,以便更好地應對未來可能出現的情況。
智能化分析預測是疾控中心檔案信息化管理系統的重要功能之一。通過使用標準化的管理軟件和計算機技術,不僅能夠提升檔案管理的效率和準確性,還能夠為疫情防控和預測工作提供有力的決策支持。這種智能化的管理方式有助于疾控中心更好地應對公共衛生挑戰,提高疾病防控能力。
4結束語
隨著時代的發展,利用大數據、區塊鏈、人工智能等現代信息技術推進檔案工作信息化轉型已成為大勢所趨。疾控中心的工作涵蓋海量數據處理任務,更應緊跟時代步伐。信息化、數據化和智能化密不可分,只有在大數據背景下做好疾病防控海量數據的收集整理、識別歸檔和智能分析,才能應對復雜多變的疫情形勢,處理突發情況,預測未知風險,將疫情防控工作做到最前沿、做到根本[8]。
參考文獻:
[1]張斌,楊文.關于做好新冠肺炎疫情防控工作檔案資料管理的思考[J].秘書工作,2020(2):23-24.
[2]王羽佳.基層單位檔案收集精準化管控探析[J].北京檔案,2020(2):23-25.
[3]田明.黑龍江省檔案館全力防控新型冠狀病毒肺炎疫情[DB/OL].(2020-02-12)[2023-02-20].http://www.chinaarchives.cn/home/category/detail/id/7374.html.
[4]葉修斌.江西省部署做好新冠肺炎疫情防控建檔工作[DB/OL].(2020-02-12)[2023-02-20].http://www.chinaarchives.cn/home/category/detail/id/15736.html.
[5]楊靜.內蒙古自治區檔案館收第一份抗疫檔案資料[DB/OL].(2020-03-20)[2023-02-20].http://www.chinaarchives.cn/home/category/detail/id/6250.html.
[6]樓俐.H7N9禽流感文件材料的前端控制和過程管理[A].王茂法.檔案管理理論與實踐:浙江省基層檔案工作者論文集:2013[C].杭州:浙江工商大學出版社,2013:179-181.
[7]尚建芳.疾控中心檔案管理工作現狀以及改進思想[J].臨床醫藥文獻電子雜志,2017,4(8):1573.
[8]趙進華.疾控中心檔案管理質量提升對策研究[J].辦公室業務,2019(1):83.
【通聯編輯:唐一東】