徐曉巍,郭 臻,王 舉,侯 麗,李 姣
(中國醫學科學院醫學信息研究所,北京 100020)
面向健康管理的食物營養成分數據表達方法研究
徐曉巍,郭 臻,王 舉,侯 麗,李 姣
(中國醫學科學院醫學信息研究所,北京 100020)
目的:設計一種食物營養成分數據表達結構,為開發面向健康管理的膳食營養計算方法奠定基礎。方法:參考國家衛生計生委發布的《食物成分數據表達規范》,以及當前常見的食物營養成分計算流程,基于關系型數據庫對營養計算中涉及到的數據進行組織,詳細定義了食物營養成分的數據對象和數據對象之間的關系。結果:對5類數據對象進行了計算機可讀的描述,具體包括成品菜、基本食材、食材分類、烹飪方式、營養元素,并且建立了數據之間的關系。結論:該數據表達結構具有較好的計算機可讀性、計算機算法可操作性以及可擴展型,有助于數據的共享、傳播與利用,支持食物營養成分計算相關應用。
食物營養成分;健康管理;膳食管理;數據表達;營養計算
個人健康管理是提高生活質量的重要部分,其中營養管理是健康管理的重要方面[1,2]。對具有特定健康狀況人群進行日常飲食和營養追蹤對提高健康管理水平和生活質量具有重要意義[3,4]。將現有的食物營養成分數據轉換為計算機所能理解的數據格式進行存儲,為上層各種應用的實現提供數據支撐是完成計算的前提與必要條件。對食物營養成分數據進行有效的表達及存儲能夠提高運算效率,有助于增強營養數據的可移植性。然而,在食物成分數據庫建設過程中面臨著命名標準不統一、規則不一致以及數據自動化水平薄弱等問題[5,6]。本文借鑒國內外在食物營養成分計算方面的研究進展,并結合中國膳食習慣,設計中國食物營養成分的數據表達方法。
長期以來,許多國家投入大量精力建設食物成分數據庫(Food Composition Databases,FCD),為食物成分數據領域內的應用研究奠定了重要基礎。美國農業部自1992年發布《營養標準數據庫》,至今已經發展到擁有8 789條食物數據和150種營養成分[7];英國公共衛生部(Public Health England)于2015年發布的食品數據庫中包含將近1 200種食物條目及在英國飲食中最關注的食品數據[8];日本計劃發布的第七版《日本食品標準成分表》,與2000年發布的第六版相比,食品品種由1 878種擴增到2 191種,并充實了收載營養成分[9]。
以食物營養數據庫為支撐數據,對特定人群營養攝入的研究已經成為當前研究熱點之一。以色列科學家David Zeevi等基于以色列衛生部的食品數據庫數據建立了一個含有6 401種食物的營養成分數據庫,并以此為基準數據對800名志愿者進行為期1周的飲食記錄跟蹤來研究飲食和血糖變化之間的關系[10]。密歇根州立大學的Debra R.Keast 等人[11]以食物成分數據庫為支撐數據,采用24h膳食回顧法確定美國兒童攝入能量及28種營養素的來源。
公眾對食物中營養成分的日益關注也創造了市場機會,許多企業開始探索面向健康飲食消費的數據服務。食譜搜索網站Yummly[12]使用美國農業部發布的《營養標準數據庫》[7](NDSR)為基準數據庫,對其從網絡上搜集的菜譜進行營養成分的計算,只要用戶按照菜譜中的食材及相應重量進行菜肴的烹制,那么就可得知用戶從這道菜中獲取的各項營養成分含量;體重管理軟件MyFitnessPal[13]將來自各種渠道的食物成分數據進行整合,目前該公司有超過由500萬種食物組成的食物營養成分數據庫。
中國疾病預防控制中心發布的《中國食物營養成分表》從食物所含有一般營養成分、食物氨基酸、脂肪酸、膽固醇含量等方面對食物營養成分進行了描述[14,15]。國家衛生和計劃生育委員會于2015年4月28日發布了《食物成分數據表達規范》[16],為我國食物成分數據標準化、統一化和電子化奠定了基礎,有助于食物成分的數據得到共享和利用最大化[17]。何宇納等對中國膳食平衡指數進行修訂,該修訂將膳食指南和平衡膳食寶塔的內容進行了量化,有助于人們根據膳食指南對日常飲食進行評價[18]。
綜合如上國內外的研究現狀,可以發現我國膳食營養成分的數據表達存在如下問題:其一,中國食物營養成分數據未建立可供查詢、方便利用的電子版或網絡版數據庫;其二,飲食營養數據服務提供方便使用的成分庫缺乏統一數據規范標準,數據的計算機可讀性和計算機可操作性低。
2.1 膳食營養成分計算方法及流程
膳食營養成分計算主要有兩種方法:化學分析法和稱重法[19]。相較于化學分析法,稱重法的優點是方便快捷,若已知食材的名稱、重量,結合食物成分表就能估算出個體攝入的營養成分,能夠在日常膳食營養計算中廣泛應用。借鑒稱重法的計算思路,本文設計膳食營養成分計算流程(圖1)。根據菜肴名稱確定原材料和相應重量;考慮原材料烹飪過程中重量變化和營養素變化,根據食物營養成分表計算出菜肴的營養含量。

圖1 膳食營養成分計算流程
2.2 膳食營養成分數據表達方法設計
參考衛計委制定的 《食物成分數據表達規范》,以及當前常見的食物營養成分計算流程,設計了膳食營養成分計算的數據表達方法。采用關系型數據庫對營養成分計算中涉及到的各類數據進行組織,從數據表結構、字段定義、字段類型及表之間的關系等方面進行設計。下面分別對成品菜、基本食材、食材分類、烹飪方式、營養元素等5類數據對象和數據對象之間的關系進行了說明。
2.2.1 成品菜數據表 該表用于存儲中國菜肴數據,分別定義菜肴名稱(cookfood_name)、菜肴做法(cookfood_desc)等與菜肴基礎描述信息相關的數據內容(表1)。
2.2.2 基本食材表 該表用于存儲中國居民經常食用的基本食材數據,數據主要來源為《中國食物成分表》[14,15]中的基本食物,分別定義食材名稱(food_name)、對食材的基本描述信息(food_desc)、食材可食用部分(food_edible)等與食材相關的數據內容(表2)。

表1 成品菜數據表(COOK_FOOD)字段描述

表2 基本食材表(FOOD)字段描述
2.2.3 食物分類表 該表用于存儲食物分類數據,數據主要來源于《中國食物成分表》[14,15]基本食材劃分的21種食物類,分別定義每種食材類別的唯一編碼(food_group_id),每種類別的名稱(food_group_name),以及每類食物的詳盡描述信息(group_desc)(表3)。
2.2.4 烹飪方式定義表 該表用于存儲中國的烹飪方式[20]數據,分別定義每種烹飪方式的名稱(cooktype_name)及其具體描述信息(cooktype_desc)(表4)。
2.2.5 營養元素定義表 該表用于存儲食物中所含有的營養素信息,數據來源為《中國食物成分表》[14,15]中定義的食物一般營養元素。分別定義每種營養元素的名稱(nutrition_name)、該營養元素相關的信息(nutrition_desc)及該種營養元素常用的計量單位(nutrition_unit)(表5)。
2.2.6 食材—營養—烹飪方法關聯表 該表用于存儲每種食材所包含的營養元素信息在不同的烹飪方式下所對應的營養留存因子[21]信息,將來自基本食材表(FOOD表)中的food_id、來自營養元素定義表(NUTRITION_DATA)中的nutrition_id和烹飪方式定義表(COOK_TYPE_DEF)中的cooktype_id進行關聯,定義了一種食材所含有的營養成分在某種烹飪方式下所對應的營養留存因子信息(nutrition_retention_factor)(表6)。

表3 食物分類表(FOOD_GROUP)字段描述

表4 烹飪方式定義表(COOK_TYPE_DEF)字段描述

表5 營養元素定義表(NUTRITION_DATA)字段描述

表6 食材—營養—烹飪方法關聯表(NUTRITION_
2.2.7 重量轉換表 該表用于存儲常用計量單位與標準克重的轉換數據,分別定義每種食材常用計量方式(weight_measure)、計量方式描述(measure_desc)、及轉換為克重對應的數據信息(weight_gram)(表7)。
2.2.8 生—熟品關聯表 該表用于存儲成品菜所使用基本食材及相應重量的信息,定義成品菜所使用每種食材的計量信息(weight_num)(表8)。
2.2.9 食材—營養關聯表 該表用于存儲每種食材含有的營養元素信息,數據來源為《中國食物成分表》[14,15]中定義的每種食物所含有的營養元素信息。定義某food_id 100g可食部對應的nutrition_id的營養元素的含量(nutrition_weight)(表9)。
2.2.10 食材—烹飪方法關聯表 該表用于存儲基本食材經過烹飪后的重量變化信息,當前數據來源為美國農業部發布的USDA Table of Cooking Yields for Meat and Poultry[22 ],該數據表定義了food_id對應的基本食材在cooktype_id對應的烹飪方法下的重量變化(cooking_yield_factor)(表10)。

表7 重量轉換表(WEIGHT_CONVERT)字段描述

表8 生—熟品關聯表(COOK_FOOD_ASSOCIATION)字段描述

表9 食材—營養關聯表(FOOD_NUTRITION)字段描述

表10 食材—烹飪方法關聯表(YIELD_FACTOR)字段描述
2.3 膳食營養成分數據關聯關系設計
為了方便各類數據在膳食營養計算過程中的靈活調用,及新增數據的擴展性,本文設計了不同數據表之間的關聯關系的構建模式(圖2)。

圖2 膳食營養成分數據庫關系
2.3.1 成品菜數據表與生—熟品關聯表的關聯關系實現 由于成品菜所含有的營養成分主要來自于食材,而食材的營養成分又與用量有很大關系,所以本文設計了成品菜數據表和生—熟品關聯表,2個表通過cookfood_id字段連接,從而確定每道菜中用到的食材及相應常用計量重量。
2.3.2 烹飪方式定義表與食材—營養—烹飪方法關聯表的關聯關系實現 由于食材中所含有的營養元素含量與具體的烹飪關系有關,所以本文設計了食材—營養—烹飪方法關聯表與烹飪方式定義表,兩表通過cooktype_id字段連接,從而確定某種食材在某種烹飪方式作用下其中的營養元素含量變化。
2.3.3 基本食材數據表與食材—烹飪方法關聯表的關聯關系實現 由于食材的重量在具體的烹飪過程中會發生變化,而該變化也會直接影響到成品菜的營養素含量,所以本文設計基本食材數據表與食材-烹飪方法關聯表通過food_id字段連接,從而確定某種食材在不同烹飪方式作用下其重量變化。
2.3.4 重量轉換表與生—熟品關聯表的關聯關系實現 由于中國烹飪過程中所使用的計量單位通常不是按照克重計量,而在營養成分計算過程中都要轉換成以克重計量,所以本文設計了重量轉換表和生—熟品關聯表通過weight_measure關聯,以將食材的常用計量單位轉化為按克重計數。
為了能夠實現計算機對膳食營養成分進行智能計算,本文設計了可支持通用計算流程的食物營養成分數據表達模型,然而,本研究提出的數據表達方法需在實際應用中進一步完善,后期可通過食物制造商、用戶上傳等眾包方式對食材數據表進行擴充完善。另外,權威數據庫 《中國食物成分表》[14,15]中的數據并未對原材料和烹飪過的菜肴進行區分,所以在計算每一道菜譜的營養成分之前都應該在《中國食物成分表》[14,15]中對其進行查詢,若表中已有該數據,則不需要再進行計算。而對于表中不存在的菜肴,將其原材料分解到什么程度也是后續對知識庫的完善過程需要考慮的問題。此外,中國菜譜中往往出現大量的“少許”、“適量”等作為食材用量的度量表達,因此本研究設計了重量轉換表WEIGHT_CONVERT來處理度量器具的不統一的問題。而針對具體的應用場景,需要專門設定重量轉換表中的具體數值。針對食物的加工過程產生的營養流失問題構建了“食材—營養—烹飪方法關聯表”(NUTRITION_FACTOR)。鑒于中國食材加工方法的多樣性和“營養留存因子”計算的復雜性,目前還沒有較為完善的數據支撐,也是本研究后續需要進一步研究和探索的方向。◇
[1]趙霖,鮑善芬.膳食營養在健康管理中的作用和地位[J]. 中華健康管理學雜志,2008,2(1):12-14.
[2]Nutrition therapy recommendations for the management of adults with diabetes[J].Diabetes Care,2014,37 Suppl 1:S120-43.doi:10:2337/dc14-S120.
[3]Xu X,et al.Assessing Dietary Quality of Older Chinese People,Using the Chinese Diet Balance Index (DBI).PLoS ONE,2015.10(3):e0121618.doi:10:1371/journal.pone. 0121618
[4]Xu X,et al.Dietary Pattern Is Associated with Obesity in Older People in China:Data from China Health and Nutrition Survey (CHNS)[J]. Nutrients,2015,7:8170-8188.
[5]楊月欣.食物成分分析數據的表達——問題和挑戰[J]. 營養學報,2003,25(2):130-134.
[6]趙洪靜,等.澳大利亞營養健康聲稱和管理對我國相關工作的啟示[J]. 中國食品衛生雜志,2015,27(4):423-426.
[7]US Department of Agriculture,Agricultural Research Service,Nutrient Data Laboratory.USDA National Nutrient Database for Standard Reference,Release 28.Version Current:September 2015.Internet:http://www.ars.usda.gov/ba/bhnrc/ndl.
[8]Finglas P.M,Roe M.A.,Pinchen H.M,et al.McCance and Widdowson’s The Composition of Foods,7th summary edition.The Royal Society of Chemistry,Cambridge.2015.
[9]http://trb.mofcom.gov.cn/article/zuixindt/201510/2015100113
1348.shtml
[10]David,et al.Personalized Nutrition by Prediction of Glycemic Responses[J]. Cell,2015,163:1079-1094.
[11]Keast DR,et al. Food sources of energy and nutrients among children in the United States:National Health and Nutrition Examination Survey 2003-2006.Nutrients,2013,5:283-301.
[12]http://www.yummly.com/
[13]https://www.myfitnesspal.com/
[14]楊月欣,等.中國食物成分表(第二版)[M]. 北京:北京大學醫學出版社,2009.
[15]楊月欣.中國食物成分表(2004)[M]. 北京:北京大學醫學出版社,2005.
[16]WS/T464—2015,食物成分數據表達規范[S].
[17]http://www.moh.gov.cn/fzs/s3582h/201505/3cc87bebca6a4ab8a6b2bb6cc2a9cc8d.shtml
[18]何宇納,翟鳳英,楊曉光,葛可佑.修訂中國膳食平衡指數[J]. 營養學報,2009,31(6):532-536.
[19]焦廣宇.臨床營養學[M]. 北京:人民衛生出版社,2001.
[20]韓楓.烹調技術(第二版)[M]. 北京:中國勞動社會保障出版社,2007.
[21]Matthews R,Garrison Y.Agriculture handbook No.102:Food yields summarized by different stages of preparation.Washington,DC:USDA Agricultural Research Service,1975.
[22]U.S.Department of Agriculture,Agricultural Research Service. 2014.USDA Table of Cooking Yields for Meat and Poultry,Release 2.Nutrient Data Laboratory Home Page:http://www.ars.usda.gov/nutrientdata
(責任編輯 李婷婷)
Data Representation for Food Nutritional Composition in Health Management
XU Xiao-wei,GUO Zhen,WANG Ju,HOU Li,LI Jiao
(Institute of Medical Information & Library,Chinese Academy of Medical Sciences,Beijing 100020,China)
【Objective】To design a data representation structure for food nutritional composition,through which the dietary nutrition calculation can be applied in health management.【Method】 According to theRegulationofFoodCompositionDataExpressionpublished by the National Health and Family Planning Commission and the current calculation flow,based on relational database,a data representation structure for food nutritional composition was designed in terms of data objects and relationships between data objects.【Result】The data representation was capable to formulize five objects including completed dishes,food ingredient,food classification,cook step,and nutrition composition.In addition,we built up the relationships between the above five data objects.【Conclusion】The data representation proposed was computer readable and operatable,and was extendable for computation model application,which enriched nutrient related data sharing and dissemination.
food nutritional composition;health management;dietary management;data representation;nutrition calculation
國家社科基金“面向知識服務的公眾健康知識組織體系構建研究”;北京協和青年基金“多元自我量化在健康促進中的應用研究”。
徐曉巍(1990— ),女,碩士,研究實習員,研究方向:醫學信息學、營養信息學、移動醫療。
李姣(1981— ),女,博士,副研究員,研究方向:醫學信息學、數據挖掘、數據整合。