劉愛玲,馬冠生
(1中國疾病預防控制中心營養與健康所,北京 100050;2北京大學公共衛生學院,北京 100191)
大數據(big data),或稱巨量資料,指的是所涉及的資料量規模巨大到無法通過目前主流軟件工具,在合理時間內達到攝取、管理、處理、并整理成為幫助決策更積極目的的資訊。從某種程度上講,大數據是是從各種各樣的海量數據中快速獲得有價值信息的能力。隨著谷歌在2008年成功地預測了美國大西洋沿岸中部地區的流感疫情,大數據被越來越多的大眾所認知,也得到更廣泛的應用,包括安全領域,例如藥品安全和海洋安全[1],但在營養領域還未有大量的應用。
隨著我國經濟的快速發展,我國居民的營養健康狀況有了明顯的改善,營養不良、貧血等呈逐年下降的趨勢,但隨著生活方式的變化,也出現了新的營養問題。一方面,農村地區,特別是貧困地區,流動人群以及留守兒童,營養不良依然普遍存在;另一方面,城市地區,營養過剩造成的肥胖、糖尿病、冠心病等慢性疾病呈快速上升的趨勢,并且低齡化現象日趨明顯[2-4]。這些營養問題,制約了個人、家庭和全社會的發展。如何推動營養工作的開展,是我們公共衛生事業面臨的一個重大挑戰,而大數據的出現和應用,為我們開拓了更多工作思路。
國民營養與健康狀況是反映一個國家或地區經濟與社會發展、衛生保健水平和人口素質的重要指標,也是公共衛生及疾病預防工作不可缺少的信息基礎。我國于1959年、1982年、1992年開展了三次全國性的營養調查工作,2002年將全國高血壓、糖尿病和營養調查三項合并,開展了“中國居民營養于健康狀況調查”,2010—2014年期間開展了中國居民營養與健康狀況監測,并從2015年后,將每隔3年開展一次中國居民慢性病與營養狀況調查。我國還開展了全國學生體質與健康狀況調查、農村義務教育學生營養改善計劃學生膳食營養和健康狀況監測評估、貧困地區兒童營養改善項目營養狀況監測等專項調查。另外,許多省、地市也開展了省級或地市級的營養調查。大數據的出現,使得我們對這些歷屆全國性、專項及地方性的營養和健康狀況調查的數據得以匯總,并進行深度系統的挖掘,可以全面描述我國城鄉居民、重點人群(孕婦乳母、嬰幼兒、老年人、留守兒童、流動人口等)、重點地區(貧困地區兒童、新型城鎮化地區等)的膳食結構和營養水平及其相關慢性疾病的流行病學特點及變化規律、找出我國居民不同時期存在的營養健康問題,發現營養缺乏和營養過剩的高危人群,為政府部門制定營養與健康相關政策和疾病防控措施提供了基礎數據,如中國營養改善行動計劃、《九十年代中國食物結構改革與發展綱要》、《中國食物與營養發展綱要(2000—2010)》、《中國食物與營養發展綱要(2014—2020)》、《營養改善工作管理辦法》、《衛生事業發展“十一五”規劃綱要》、《中國食物與營養發展綱要(2014—2020年)》、“2020 健康中國”戰略、農村義務教育學生營養改善計劃、《中共中央國務院關于深化醫藥衛生體制改革的意見》以及《2007年中國居民膳食指南》等。
為解決我國居民的營養健康問題,改善居民營養健康狀況,《中國食物與營養發展綱要 (2014—2020年)》[5]中提出,要“堅持生產與消費協調發展”,“逐步形成以營養需求為導向的現代食物產業體系”?!吨袊y計年鑒》、《中國農業年鑒》以及中國統計局、農業部等政府網站等提供了大量的食物生產、消費數據[6],可綜合利用全國食物生產和加工數據以及零售業(超市、零售門店等)、餐飲業(飯店、快餐等)、食品加工業(飲料冷飲企業、方便食品企業等)的企業數量、銷售額等數據,綜合分析不同食物(原料和不同加工程度產品)的產量、消費量的現狀及變化趨勢,以及食物環境的變化(食物可及性、食物價格、食品廣告投入等)等信息,結合我國居民膳食營養問題,及時發現食物生產加工和居民營養需求的矛盾,找出差距,通過市場經濟的杠桿作用及時進行調整,促進食品生產、消費、營養、健康協調發展。
大數據的使用可以推動營養相關慢性疾病的管理。衛生部門可以通過患者電子病歷數據庫,及時對營養相關疾病及其他疾病患者的數據進行綜合分析,將分析結果及指導通過移動網絡等及時反饋給醫生、社區衛生服務人員以及患者。一方面,可以使得醫務人員全面掌握病人的病情發生、發展進程以及治療情況,以便給出有針對性的治療和指導。另一方面,還可以給患者適時的提醒及予適當的指導。兩方面相結合,更有助于疾病的管理和控制。
此外,隨著電子技術和移動網絡的快速發展,營養健康相關類的手機應用程序(APP)的不斷出現,許多居民利用這些應用程序來監測或管理自己的營養、運動、健康等。大數據的出現,一方面可以實現個人監測數據和醫療機構的電子健康檔案互通,使醫生更能了解病人的膳食、運動等情況,既可以監測病人的依從性,也可以及時或隨時給予更針對性指導。另一方面,可以對這些大量的個人的數據進行匯總分析,是對定期開展的全國性營養健康調查數據的很好補充。此外,還可以對居民活動(就餐、出行、運動等)的時間、地點進行匯總分析,研究環境因素對居民生活方式和飲食行為等的影響,據此提出城市規劃建設的建議,為居民提供支持性的社會環境,促進居民養成良好的生活方式和飲食習慣等。
大數據的出現,為開展營養相關科研工作提供了重要的途徑。例如,由孕期保健檔案、學生體測檔案、居民電子健康檔案、職工定期體檢檔案等多源電子檔案集成整合的包括生命早期在內的一生健康檔案,為我們開展營養相關隊列研究提供了可能。我們可以利用這一集成的電子健康檔案,進行數據的深入挖掘和分析,獲得孕婦孕期的營養和健康狀況、新生兒情況(低出生體重兒、巨大兒等),以及成年期的營養健康狀況,全面研究孕期營養(包括食物攝入、營養補充劑攝入、孕期疾病等)對人一生健康的影響;也可以研究營養、運動、生活方式等在營養相關疾病的發生、發展中的作用,建立我國居民營養相關慢性疾病的風險預測模型。
大數據的數據挖掘和處理技術,可以使營養傳播更有針對性、更有效。通過對互聯網和移動網絡上來自網站、論壇、報紙、微博、博客等營養相關內容(視頻、文字、圖片等)以及公眾在搜索引擎查詢的營養熱點詞匯的抓取、匯總和分析,確認大眾所關注的營養的問題,及時發現營養相關突發事件、營養謠言和誤區等,并通過分析公眾獲取相關信息的途徑喜好(視頻還是文字?是專家微博,還是健康網站?……),從而確定傳播策略,及時組織專家,通過媒體、機構/專家的微博、微信等發布相關知識,引導輿論,將謠言消滅在萌芽中,不給偽科學以可乘之機。
另外,大數據技術也可以用來評估國家營養相關工作、活動等的社會影響力。通過對公眾這些工作和活動的查詢、查看、轉發、評論,協助評估這些活動的社會影響力,及時發現影響這些工作和活動的不利因素,保證各種活動切實取得好的效果。
總之,隨著信息化的不斷發展,大數據會愈來愈廣泛地滲透到營養領域,如何利用大數據,推動我國營養事業的發展,是我們需要認真考慮的事情。當然,在大數據的應用中,也會存在一些問題和挑戰,如數據質量如何、數據是否標準化、數據能否共享等,這就需要國家的政策支持,需要政府和各專業機構進行科學嚴謹的頂層設計。
[1]吳嘉瑞,張冰.試論數據挖掘技術在藥品不良反應評價領域的應用[J].中藥新藥與臨床藥理,2007,6:485-487.
[2]王隴德主編.中國居民營養與健康狀況調查報告之一2002 綜合報告[M].北京:人民衛生出版社,2005.
[3]中國學生體質與健康研究組編.2010年中國學生體質與健康調研報告[M].北京:高等教育出版社,2012.
[4]中國疾病預防控制中心慢性非傳染性疾病預防控制中心編著.中國慢性病及其危險因素監測報告(2010)[M].北京:軍事醫學科學出版社,2012.
[5]國務院辦公廳印發.中國食物與營養發展綱要(2014—2020年) [EB/OL].[2014-3-23].http://www.gov.cn/xxgk/pub/govpublic/mrlm/201402/t20140208_ 66624.html.
[6]中華人民共和國國家統計局[EB/OL].[2014-10-09].http://data.stats.gov.cn/index.