黃澤穎
(農業農村部食物與營養發展研究所,北京 100081)
營養素參考值(Nutrient Reference Values,NRV)作為食品標簽營養標示規范化的措施,于1985年被國際食品法典委員會(Codex Alimentarius Commission,CAC)提出專門用作食品營養標簽標示營養素日需要量的參考值[1]。營養素參考值表示的是在一份食物中含有的營養成分,可以給人體(特殊人群除外)1 d提供的營養百分比,例如,100 mL的牛奶中蛋白質的營養素參考值為6%,則意味著可以提供給人體1 d所需要蛋白質的6%[2]。不同國家的營養素參考值根據各國居民的營養素需要量而定,在中國,營養素參考值主要依據中國居民膳食營養素推薦攝入量(RNI)和適宜攝入量(AI)制定。作為中國首個預包裝食品營養標簽國家標準——《預包裝食品營養標簽通則》(GB 28050—2011)規定營養成分表由營養成分及其含量、營養素參考值百分比構成,于2013年1月1日起在預包裝食品上強制性實施,主要用于標示食品的能量和4種核心營養素(蛋白質、脂肪、碳水化合物、鈉)。這意味著,營養素參考值以量化的方式在食品外包裝袋上標示,能幫助中國居民購買和食用時方便快捷地判斷自己攝入的營養素是否足夠或超標,以及為選擇低熱量、低脂肪、低鈉的健康食品提供參考依據,對緩和當前中國居民肥胖發生率與營養性疾病增長的凸顯矛盾[3]有重要意義。
營養素參考值已強制實施8年,學術界關注主要集中在營養素參考值標示現狀[4-6]、存在的問題[7-8]、居民的KAP(知識、態度、行為)調查[9-11]等方面。然而,中國居民如何使用與評論,有多大的關注程度,未來關注趨勢等問題有待研究。
第45次《中國互聯網絡發展狀況統計報告》[12]指出,截至2020年3月,中國網民規模達9.04 億,即時通信與搜索引擎的用戶分別占99.2%和83.0%,從中獲取居民的輿情監測和網絡關注度等數據全面且客觀,具有數據獲取渠道的創新性。新浪微博作為中國最大的及時信息分享和傳播平臺之一,用戶的評論數據豐富,而百度是全球最大的中文搜索引擎,其推出的百度指數能客觀地反映網民的主動搜索需求和網民對網絡信息的關注程度。因此,在大數據時代,文章擬利用互聯網大數據開展中國居民對營養素參考值的輿情監測(使用情況與評論)、網絡關注度及其趨勢分析,對真正發揮營養素參考值的效用,引導食品工業良性發展,保障居民均衡膳食具有重要意義。
文章使用的數據:① 輿情監測數據來自新浪微博上用戶對營養素參考值的評論數據。文章以營養素參考值為關鍵詞,網絡爬蟲收集2013年1月1日—2019年11月27日的評論數據1 531條。② 網絡關注度數據來自百度指數平臺(http://index.baidu.com),以“PC端+移動端”指數(基于中國居民越來越多使用電腦和智能手機搜索信息的趨勢)作為搜索指數來源,地區范圍設為全國,為提高查全率,以“營養素參考值”為關鍵詞采集2013年1月1日—2020年1月31日每日數據,共2 587個。
文章運用R統計軟件,結合營養素參考值數據開展詞云分析、文本情感分析與ARIMA-SVM模型預測。
1.2.1 詞云分析 詞云是一種特殊的文本可視化,頻率更高的詞通過占據突出的位置有效地表示出來[13]。文章抽取營養素參考值評論文本的關鍵詞進行詞頻統計,然后利用R軟件的Wordcloud包繪制詞頻云圖,且根據Wordcloud函數自行調節關鍵詞、詞頻、字號、顏色、角度、詞頻量和關鍵詞個數,字體越大代表頻率越高,顏色相同代表頻率相同。
1.2.2 文本情感分析 文本情感分析又稱情感挖掘、傾向性分析,是對帶有情感色彩(如贊成、反對、表揚、批評、喜、怒、哀、樂等)的評論文本內容進行處理、歸納和推理的過程,從而發現評論者對研究對象的態度和意見[14]。文章通過對營養素參考值的評論文本進行拆句,從中抽取情感詞,匹配情感詞典,分類合并每條評論ID,對每條文本進行情感傾向性分析,最終根據劃分規則,將情感值>0表示為正面情感,情感值=0表示為中性情感,情感值<0表示為負面情感,從而計算正面情感詞、中性情感詞、負面情感詞的個數,獲取整體情感傾向。

營養素參考值詞云圖(圖1)中,要求被標識的“4+1”營養成分中,出現頻率從高到低依次是能量、蛋白質、脂肪、維生素、碳水化合物,可見,中國居民在選購預包裝食品時,主要關注食品的能量占每天推薦攝入量的比重;食品方面,月餅、醬油、元宵、牛奶的營養素參考值被提及的次數較多,而且,營養素參考值被多數人用于選購兒童食品。

圖1 營養素參考值詞云圖[17]Figure 1 Word cloud of nutrient reference values
中國居民對營養素參考值分別持有中性、負面和正面情感(見表1),在1 531個評論中,正面情感和中性情感的比重約35%,正面情感略微高,但持負面情感的評論數比重不低(接近28%),居民較多認為營養素參考值難懂,不易理解含義,沒有起到判斷食品健康與否的效果,可以判斷,居民對營養素參考值的態度是復雜的,既有一定程度的好評,但也存在不好的評價。

表1 營養素參考值文本情感分析結果[17]
中國對營養素參考值的網絡關注度見圖2。8年來中國每日百度指數基本在200上下浮動,日均為232,最低為12,最高達到993(2017年8月30日),可見,2013年1月1日起中國實施《預包裝食品營養標簽通則》以來,居民持續在關注營養素參考值,但關注度不高,也沒有隨著國民經濟水平、教育水平、健康意識的提高而同步增長,可見,中國實施的營養參考值沒有引起居民較大的關注。

圖2 2013年1月1日—2020年1月31日中國的營養素參考值百度指數變化趨勢Figure 2 The trend change of the baidu index of nutrient reference values in China from January 1, 2013 to January 31, 2020
中國居民對營養素參考值網絡關注度有性別差異,男性占43.68%,而女性占56.32%。同樣,也存在年齡分布差異(見圖3),20~29歲的比重最高,接近44%,其次是19歲及以下和30~39歲(均占比25.29%),但40~49歲的居民比重不到5%,特別是50歲及以上(1.15%)。

圖3 營養素參考值網絡關注度的年齡分布圖Figure 3 The residents’age distribution of network attention of nutrition reference values
省份方面,中國居民對營養素參考值的日均網絡關注度存在差異性(見圖4),廣東省最高,超過100,其次是北京(95)、江蘇(95)、浙江(85)、山東(79)、上海(78),總體上是來自發達省市的居民比較關注營養素參考值。

圖4 2013年1月1日—2020年1月31日日均各省營養素參考值百度指數Figure 4 Dailybaidu index of nutrient reference values in each province from January 1, 2013 to January 31, 2020

由ARIMA模型、SVM模型和ARIMA-SVM模型對2019年1月—2020年1月每月首日的預測值與實際值的比較(見表3)發現,ARIMA-SVM模型的預測接近程度不如其他兩個模型的時間,僅是2019年4月、11月的首日,而其他時間的預測效果不差。在一定程度上,ARIMA-SVM模型的預測效果較佳。

表2 ARIMA-SVM模型預測結果[18]
通過3個指標的比較(見表4),ARIMA-SVM模型比單個ARIMA模型與SVM模型的預測精度要高,故采用ARIMA-SVM模型對營養素參考值網絡關注度進行預測。

表4 3種模型預測效果的比較[18]
基于ARIMA-SVM模型對2020年2月—2022年12月每月首日營養素參考值百度指數的預測發現(見圖5),未來3年,中國居民對營養素參考值的網絡關注度仍比較低迷,百度指數在144~179范圍波動,平均值為162,比過去8年的均值(232)低。

圖5 2020年2月—2022年12月每月首日的營養素參考值百度指數的預測值Figure 5 The predicted value of baidu index of nutrient reference value on the first day of each month from February 2020 to December 2022
為了解食品標簽營養素參考值實施8年來中國居民的使用情況、評論、網絡關注度,以及預測未來3年網絡關注度的變化情況,文章采用2013年以來的新浪微博評論數據和百度指數,基于詞云分析、文本情感分析以及ARIMA-SVM預測模型,得出的研究結論是,營養素參考值在中國實施沒有獲得廣泛的好評和關注,居民提及最多的是能量、月餅、醬油、兒童食品的營養素參考值,然而表示出復雜的情感,雖然有較高的好評,但也持有不滿意的態度;8年以來,中國居民對營養素參考值的網絡關注度平平,百度指數不隨時間顯著增長;營養素參考值網絡關注度存在性別、年齡與省份差異,以女性、20~29歲、來自發達省市的群體為主;基于預測精準度高的ARIMA-SVM模型,2020—2022年營養素參考值的網絡關注度預計仍較低迷。營養素參考值作為國際上常見的食品標簽,在中國推行的情況不夠樂觀。在健康中國建設時期,要使營養素參考值發揮顯著的作用,需要一些促進營養素參考值發揮應有作用的配套措施,擬提出如下幾點政策建議。
要使營養素參考值產生最大的影響,科普宣傳是關鍵[19]。在中國,健康飲食看營養標簽的科普宣傳開展不少,主要圍繞如何看懂營養素參考值主題,大概介紹了營養素參考值的概念、用途及使用方法。這樣的科普固然必要,但斷章取義式的科普方式缺少介紹營養素參考值的科學依據、推行的原因以及如何與日常飲食有效結合,使多數人只知其一不知其二,無法真正理解營養素參考值,更別說科學指導日常飲食。
因此,改進營養素參考值的科普宣傳極為重要,建議在科普類文章或者常識解說中,以講故事或舉身邊老百姓的例子,少用學術用語,改用通俗說法,少用長篇大論,改用詼諧有趣的卡通動漫,少用文字,改用聲頻與視頻,達到簡潔明了闡述營養素參考值來龍去脈的目的。此外,建議借鑒美國1990年發布的營養標簽和教育法(Nutrition Labeling and Education Act,NLEA),確立中國的營養標簽教育法,為營養素參考值的科普宣傳提供法律依據。
能量+4種核心營養素是包裝食品強制性標示的營養成分,比較常見,但其他營養成分如膳食纖維、優質蛋白、維生素、礦物質等由于非強制要求,僅在個別食品顯示。為滿足消費者對更多營養成分的關注需求,提高營養素參考值的利用率,支撐更多食品的健康選購以及適應更廣泛的人群,建議修改《預包裝食品營養標簽通則》,添加糖(單糖與雙糖)、膳食纖維、飽和脂肪、反式脂肪等營養成分,顯示其營養素參考值,為消費者選擇合適、健康的食品提供更多的判斷依據。
片面顯示單個或數個營養成分的營養素參考值難以適應大健康時代需求,食品包裝正面(Front of Package,FOP)標簽通過營養素度量法(Nutrient Profile,NP)向消費者直觀易懂地評價食品整體營養價值,克服了營養素參考值認知度低且位置不醒目等問題。一些發達國家在FOP標簽中融入營養素參考值,例如英國的交通燈信號標簽顯示營養素參考值,當某一種營養物質的營養素參考值超過30%(食品)及超過15%(飲料)時,則會顯示紅色,警告消費者慎重選購[20]。在中國,《健康中國行動(2019—2030年)》已將推動FOP標簽列入國家行動計劃,在改進標簽設計與落地實施之前,建議總結英國等國的經驗做法與存在的不足,嘗試將FOP標簽與營養素參考值相結合,根據國民營養健康狀況與發展目標,對重要的營養素含量根據營養素參考值劃分健康等級,并采用顏色編碼、圖形、文字、數字其中的一種方法標示。