
在美國,食源性疾病是個頑固的禍害,每六個美國人當中就有一人正在受影響。
食源性疾病是指通過攝食而進入人體的有毒有害物質(包括生物性病原體)等致病因子所造成的疾病。一般可分為感染性和中毒性,包括常見的食物中毒、腸道傳染病、人畜共患傳染病、寄生蟲病以及化學性有毒有害物質所引起的疾病。
疾病控制和預防中心(CDC)一直在不知疲倦地了解疾病的發展趨勢。美國食品和藥物管理局(FDA)也已經繪制出了與疾病相關危險因素的清晰圖表。
建立一個大規模的數據庫
從流行病學的角度看,這些信息是不錯的,但不是最好的。大多數這些報告所依據的數據都來自急診室,只記錄了前去就醫的人當中出現腹瀉、嘔吐、胃痛、發燒或器官功能障礙等癥狀的人數。這些雖然有助于建立一個大規模的數據庫、掌握整體態勢,但在個體層面,相關數據經常是稀缺的,無法滿足需求。對于流行病學家來說,如果要更準確地掌握疫情,他們必須明確每個個體出現癥狀前后的經歷。不幸的是,這些通常未被報道或記錄。
美國疾控中心一直在努力尋找新途徑以解決個人信息不完善問題,他們希望找到一種最好的方法,既能完整地收集數據,同時又能保護個人隱私。早在1999年的一份報告中就闡明了獲得數據在調查食源性疫情中的重要性。然而,時至今日所需數據依然是嚴重缺失的。一些研究人員也在嘗試用別的方式在匿名的情況下獲取信息。其中一個例子是2004年的RUsick2論壇利用互聯網來從訪客那里收集數據。該程序聚焦于有關癥狀的信息而非引起疾病的微生物。識別引發疾病的微生物是個艱難而細致的過程,而記錄個體的感覺則同樣復雜。RUsick2程序的結果很好,但受限于個人必須決定坐下來并進行注冊。
雖然RUsick2可能并不完美,但它的嘗試為之后利用社交網站尋求改善食品安全的可行性方法設定了基線。一些旨在更好地理解健康問題的新方法隨后陸續接受測試,重點都是看看它們駕馭信息的能力。例如,2008年BioCaster網站試圖通過分析網上媒體文章以確定疫情。此外,豐富站點摘要(RSS)也為食源性疫情研究者提供了大量的、公開的信息,而且可以通過關鍵詞檢索。這些關鍵詞可以非常簡單:病毒、疾病、暴發、發燒、感染、損傷、風險、病。當信息聚合并結合地理空間分析后,就可以確定感染的潛在熱點。
大數據需要和人的聯系
到了2010年,大量數字疾病映射資源已經陸續出現,例如谷歌趨勢(Google Trends)、健康地圖(HealthMap)和ProMED郵件等。它們都在扮演著同樣的角色,即提供有新聞價值的文章,幫助追蹤疫情暴發地或哪些地方存在暴發疫情的可能性。這些分析結果對疾控中心和世界衛生組織來說價值巨大,有助于縮短反應時間,及時采取干預措施。
然而仍有一個因素是缺失的:個人。
雖然新聞為研究者和公民個人提供了一些聯系,但它也僅僅是收集一些信息而已。幾乎沒有食源性疾病或其他溫和疾病個例出現在新聞頭條。因此必須尋找更好的個人信息收集途徑,但同時也不會干擾到個人的正常生活。
今年6月,美國紐約市的一個研究團隊找到了前進的方向。但是,他們無法單獨做到這一點,他們需要Yelp的幫助。
Yelp是一個為美國人提供在線點評服務的網站,尤其是點評餐廳(類似中國的“大眾點評”網)。在過去十年里,這個網站累積了超過1.32億名粉絲,每月發表的評論超過5700萬條。這是一種免費服務,意味著任何人都可以加入。而對科學團隊來說,這是一個實現其想法的完美網站。
社交媒體的力量
Yelpidemiology的流程非常簡單。紐約市的這個研究團隊查看了Yelp網站過去9個月中大約29.4萬條評論,統計了那些可能與食源性感染相關的單詞和短語。雖然他們的研究是廣泛而沒有預設目標的,但令人驚訝的是他們發現了893條符合食源性疾病的評論。通過進一步調查,他們發現其中499例是真正的感染事件,但公共衛生部門只記錄了15例。
在掌握了這些數據后,該研究團隊希望利用這些信息追溯病源。他們聯系了其中的27人,詳細詢問了他們出現癥狀前后的經歷,然后確定了24家餐廳為食源性疾病的來源,另有3人的情況難以確定。雖然目前的數據還比較有限,但已經能夠證明Yelpidemiology的效果和價值。
毫無疑問,社交媒體的力量將繼續幫助公共衛生官員提高迅速識別和應對疫情的能力。因為社交媒體是公共的,其用戶個人在發表信息的時候也已經確定了哪些信息是可以公開的,因此不會涉及到個人隱私問題。
對于疾控中心和其他研究者來說,Yelpidemiology進行的試驗性分析,為今后的食源性疾病研究和應對提供了明確的前進路線,可能會因此而衍生出更強大的信息聚合和分析技術。而對于普通美國人來說,這可能意味著某一天人們能夠在去新餐廳嘗試美食之前先通過Yelp或其他網站了解其是否存在醫療衛生風險。