陳禹霏 攸小瑾
(廣州市疾病預防控制中心 廣東 廣州 510440)
世界各地疾病分布復雜,我國缺少針對社會公眾提供目的地旅行、差旅等疾病信息查詢的平臺。近年來,隨著醫學的不斷發展,人們的健康意識不斷提高,但全球范圍爆發的傳染病仍時有發生,如埃博拉、寨卡、中東呼吸綜合征、新冠肺炎等。另外,因世界各地發展的不均衡性,許多相對落后的地區疾病仍一直存在,如瘧疾等。在我國,隨著與世界各國政治、經濟間的往來愈發頻密,人民生活水平的不斷提高,商務、旅游等出境的人員激增,因此受目的地疾病影響的可能性隨之增加。一些學者的研究顯示,相當部分的旅行者在旅行途中或者旅行后會出現健康問題??梢娔康牡氐募膊“l生狀況與旅行者的健康息息相關,公眾迫切需要一個本地化的目的地疾病狀況檢索工具。
在互聯網大數據時代,通過大數據、人工智能(AI)、數據檢索與分析技術對信息進行數據化處理是未來趨勢所在。
通過建立數據自動化的方法,只需要通過對關鍵詞語的搜索、監控、分析、整理、再加工,就能實現在公用數據庫或一些付費數據庫中獲取同類信息的整合、分析,提取實用信息??梢酝ㄟ^對全球各威權門戶網站數據與相關領域權威網站的信息抓取,整合成適合在我國使用的目的地疾病狀況信息平臺。
本研究通過初步探求人工智能與大數據時代病風險溝通平臺體系搭建的可行性,為疾控工作者與公眾建立高效溝通的信息化數據平臺提供建議,為實施風險溝通精準傳播策略提供實踐與科學依據。
1.1.1 網站的選擇
世界衛生組織、中華人民共和國健康計生委員會、中國疾病預防控制中心、香港衛生防護中心以及美國疾病控制與預防中心(CDC)、歐洲疾病控制與預防中心(ECDC)門戶網站等,數據源可靈活變動,隨時添加與修改。
1.1.2 內容版塊的選定
世界衛生組織“Emergency”版塊、中華人民共和國健康計生委員會“頭條”版塊、美國疾病預防控制中心“CDC health alert”版塊、“U.S.State Department travel warnings”版塊以及“U.S.State Department travel alerts”版塊。
寨卡(Zika)、登革熱(Dengue Fever)、埃博拉(Ebola)、中東呼吸綜合征(Mers)、萊姆病(Lyme)、瘧疾(Heloprya)、食源性疾?。‵ood-borne diseases)、新冠肺炎(Covid-19)、小兒麻痹癥、白喉、猴痘、麻疹 、瘧疾 、黃熱病、MERS-CoV、尼帕病毒。
此項目是基于CentOS 7.6.1810 系統開發的,后臺整體架構都是基于此系統部署。項目編程是基本PHP 7.1(開發語言)、MySQL 5.6.47(數據層)、NGINX 1.16.1(運行環境)開發的。實現了高并發連接、內存消耗少、配置文件簡單、支持Rewrite重寫、內置的健康檢查功能、穩定性高、熱部署等。
常用的抓取技術為curl 方式、fsockopen、file_get_contents 和插件。此項目主要抓取為curl方式,它支持多種的網絡協議,目前支持HTTP、HTTPS、FTP、GOPHER、TELNET、DICT、FILE 和LDAP 協議。libcurl同時也支持HTTPS 認證、HTTP POST、HTTP PUT、FTP上傳(這個也能通過PHP的FTP擴展完成)、HTTP基于表單的上傳、代理、cookies 和“用戶名+密碼”的認證。提供多線程并發的網頁抓取服務。抓取的實例包括指定url 的網頁抓取、指定站點的全站抓取、指定板塊的增量抓取等。
從“U.S.State Department travel warnings”“U.S.State Department travel alerts”“CDC health alerts”“WHO Emergency”香港衛生防護中心旅游警告、中國疾病預防控制中心公告網頁抓取數據,獲得目標信息后,用Google翻譯器進行初譯,然后進行人工校驗。
前端使用了微信提供的小程序應用開發框架,此框架結構清晰(邏輯層、視圖層)、對于微信的訪問更友好。簡單、高效和豐富的組件與API,使項目加載速度更快,讓用戶在使用的過程中得到更好的體驗。
1.7.1 模塊設定
“目的地”:選擇要去的國家查詢當地爆發的疾病和最新的資訊。
“警告”:展示當地的疾病和最新的資訊。
“信息指南”:包括新冠指引(新冠爆發的重點地區最新資訊和預防)、疾病列表(全球疾病匯總、介紹和預防)、駐外使館(全球大 使館的簡介和聯系方式)。
“我的”:包括個人信息、預防接種點(搜索有關目的地的建議。查找有關疫苗和藥物的建議信息)、目的地疾病預防(出境旅游防病攻略)、預防接種指南、我的收藏(收藏的資訊和預防的方法)、關于我們。
1.7.2 輸出界面
分模塊,使用者可根據需求,按模塊查找相關資訊信息。
1.7.3 總體流程
用戶進入小程序授權獲取用戶信息(昵稱、地區、頭像等)—選擇旅游目的地—關鍵詞查詢相關健康資訊和預防知識—專業機構提供指引。
小程序運行流程圖如圖1所示。

圖1 小程序運行流程圖
上線時間:2020年11月2日。
輸出界面:具體見圖2至圖5。

圖2 目的地搜索界面

圖3 警告提示界面

圖4 信息指南界面

圖5 用戶賬號界面
收集信息的數量:中華人民共和國國家衛生健康委員會(300)、美國CDC(370)、世界衛生組織(170)、新冠指引(79)、加拿大旅游網(27)。
檢索的數量:1 134。
檢索用戶畫像:商旅人群、出國游人群、公共衛生從業人員、關注旅行健康相關人員。
據項目組了解,本項目在我國尚屬首創,并已申請相關專利兩項。
世界各地疾病分布復雜,我國缺少針對公眾提供目的地疾病信息的平臺。近年來,隨著醫學的不斷發展,人們的衛生意識不斷提高,但全球范圍爆發的新發傳染病仍時有發生,如埃博拉、寨卡、中東呼吸綜合征等。另外,因世界各地發展的不均衡性,許多相對落后的地區仍一直存在的疾病,如瘧疾等[1]。
隨著我國與世界各國在政治、經濟間的往來愈發頻密,使得人們的生活水平不斷提高,促進了商務、旅游等出境的人員激增,這種情況在世界的其他國家地區也很普遍。1950—2017 年,世界人口增長了2.9 倍,旅行者的數量增加了53倍,因此受目的地疾病影響的可能性隨之增加[2]。2020年新冠肺炎疫情也說明了這一點。就筆者所在的廣州市來說,登革熱和瘧疾是主要的旅行相關傳染病。而通過適當的防蚊措施、藥物預防是能有效地防止這些疾病的發生。公眾亟須有一個權威的出發目的地疾病狀況發布與防治指引來安排自己的出行計劃,有效防控疾病,健康出行,并在歸國后自我監測健康狀況,及早發現問題,盡快就醫。這樣亦有助于發現、控制早期病例,防止國外的疫情擴散至我國[3-4]。但我國目前缺乏此類健康教育、促進的機制與軟硬件開發。同時,人們在旅行前進行健康咨詢方面的意識也相對薄弱。據調查顯示,在監測系統報告有癥狀出現的旅行者中,僅有40.5%進行了旅行前健康咨詢。事實上,旅行前健康咨詢是預防旅行相關疾病非常重要的手段。有學者建議,旅行前健康咨詢應在計劃旅行前的6 周進行,以便有足夠的時間進行預防接種以及藥物預防。所以,作為專業機構,CDC應該為公眾提供這方面的資訊平臺,供公眾使用,并獲得建議。
在人工智能(AI)時代,通過大數據對信息進行分析是趨勢所在。通過建立自動化的方法,只需要通過對關鍵詞語的搜索,就能實現在公用數據庫或一些付費數據庫中獲取同類信息的整合、分析,提取實用信息[5]。人工智能在健康產業得以迅速應用和發展的關鍵,是大數據的積累和數據庫的發展[6],谷歌基線研究項目就是一個很好的案例[7]。從中可見,結合大數據和互聯網技術,我國目前大力發展人工智能,人工智能在公共衛生領域的應用,將為新發傳染病防控工作提供先機[8]。可以通過對全球各威權門戶網站數據的抓取,整合成適合在我國使用的目的地疾病狀況信息平臺[9]。
發達國家、地區在目的地疾病分布的研究上可以為我們提供借鑒[10]。WHO網站開設“Emergency”版塊,對全球各地的新發疾病進行監測,實時更新報道,并每周發布疫情分析。ECDC 網站開設“Active threats and outbreaks”版塊,對全球各地的新發疾病進行監測,并發布疫情評估報告。美國CDC網站開設“Travelers' Health”專題網頁,同時開發App,供準備出游的公眾查詢包括目的地疾病狀況、醫療機構、疫苗接種等資訊。在小程序中,也開設了相應的版塊,除了提供旅行目的地疾病狀況查詢外,還為公眾提供了疫苗接種點信息的查詢,以及我國在各個國家大使館的聯系方式。
隨著人民生活水平的提高,公眾外出旅游的需求越來越大,特別是境外旅游的人數逐年增加[9-10]。與此同時,感染出游目的地流行疾病的風險,造成回國后傳播的隱患也逐漸增大[11]。所以在出游前對公眾進行行為干預顯得尤為重要,使旅行者牢固樹立預防觀念,順利、健康地完成旅行生活[12]。
課題組研發的這一款小程序,順應當前新媒體數據時代,人們的使用習慣,直接面向公眾,讓公眾了解旅游目的地的疾病發生狀況,獲取權威的防治防范指引;為公眾提供了資訊與便利,具有很好的實際應用前景。