999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

我國食品安全與數(shù)據(jù)科學交叉研究的科學計量學分析

2020-07-23 04:23:34宋英華李墨瀟雷生姣庫任俊夏亞瓊
食品科學 2020年13期
關(guān)鍵詞:科學研究

邵 航,宋英華,*,李墨瀟,*,邵 偉,雷生姣,庫任俊,夏亞瓊

(1.武漢理工大學中國應(yīng)急管理研究中心,湖北 武漢 430070;2.安全預警與應(yīng)急聯(lián)動技術(shù)湖北省協(xié)同創(chuàng)新中心,湖北 武漢 430070;3.武漢理工大學安全科學與應(yīng)急管理學院,湖北 武漢 430070;4.三峽大學生物與制藥學院,湖北 宜昌 443001)

食品安全關(guān)系人民群眾身體健康和生命安全,關(guān)系中華民族未來[1]。以食品安全突發(fā)事件為研究對象,深入開展演化機理、檢測技術(shù)和預警方法等方面的研究,能夠幫助政府及時采取有利的措施,預防食品安全問題的再次發(fā)生,已經(jīng)得到黨和國家的高度重視[2]。

數(shù)據(jù)科學是基于傳統(tǒng)的數(shù)學、統(tǒng)計學的理論和方法,運用計算機技術(shù)進行大規(guī)模數(shù)據(jù)計算、分析和應(yīng)用的一門學科[3]。它是一門既古老又年輕的科學,其淵源可以追溯至1749年起源于瑞典的統(tǒng)計學[4];隨著計算機技術(shù)的發(fā)展與大數(shù)據(jù)概念的興起,數(shù)據(jù)科學又逐漸成為大數(shù)據(jù)技術(shù)的代名詞。大數(shù)據(jù)時代的到來使得數(shù)據(jù)科學逐步演變成了一門“立足現(xiàn)代、面向未來”的顯學;而公共安全領(lǐng)域?qū)Υ髷?shù)據(jù)挖掘與利用的迫切需求加劇了全社會對數(shù)據(jù)科學人才的需要;同時,這種社會需求導向又反向顯著地提升了數(shù)據(jù)科學在公共安全各個子領(lǐng)域中的學科地位。

隨著社會信息化程度的提升與信息儲存方式的變革,食品生產(chǎn)與消費的各個環(huán)節(jié)已經(jīng)積累了海量異構(gòu)的食品安全歷史數(shù)據(jù),且仍在源源不斷地產(chǎn)生著新的食品安全大數(shù)據(jù)。在大數(shù)據(jù)時代的背景下,大數(shù)據(jù)技術(shù)方法相比起傳統(tǒng)的研究方法,在處理海量的食品安全數(shù)據(jù)時顯得更加對口和有效。

已發(fā)表的科技論文是經(jīng)過同行評議,且其主題被認為是隸屬于該領(lǐng)域的論文[5]。因此,從已發(fā)表的學術(shù)論文中識別并探測某一特定研究主題是被實踐證明的可靠方法[5]。基于此種假設(shè),本文選取中國知網(wǎng)(China National Knowledge Infrastructure,CNKI)數(shù)據(jù)庫中食品安全研究與數(shù)據(jù)科學存在交集的科技文獻作為我國食品安全與數(shù)據(jù)科學交叉研究的樣本數(shù)據(jù)集,運用科學計量學理論,主要使用科技文本挖掘軟件Citespace對文獻數(shù)據(jù)進行深度挖掘。

本文將從所收集的文獻數(shù)據(jù)的特征出發(fā),開展本交叉研究的研究主體分析與研究主題分析,以期從文獻數(shù)據(jù)空間中發(fā)現(xiàn)本領(lǐng)域重要的研究機構(gòu)、期刊和作者,并進一步地發(fā)現(xiàn)本領(lǐng)域當前的研究熱點與未來的發(fā)展趨勢。

1 數(shù)據(jù)與方法

1.1 數(shù)據(jù)采集與預處理

本文所收集的數(shù)據(jù)全部來源于CNKI。考慮到文獻題錄數(shù)據(jù)的更新會有遲滯,本研究以2019年5月20日0時為截止時間,以“主題 = 食品安全 AND 數(shù)據(jù)”為檢索條件,收集了1996年1月至2019年5月跨度約23 年的3 375 條文獻數(shù)據(jù),文獻類型包括期刊論文、學位論文、會議論文和報紙圖書等。文獻數(shù)據(jù)以Refworks格式(包含文獻類型、作者、作者單位、標題等主要科學計量字段)存儲為UTF-8編碼的.txt文件到本地路徑備用。同時,使用Python爬取檢索頁面分年數(shù)據(jù)的完整信息,并寫入Excel文件。

1.2 科學計量學方法與科技文本挖掘軟件

科學計量學是運用數(shù)學等定量方法對科學的整體及其各個方面進行定量化研究,以解釋科學發(fā)展規(guī)律的一門新興學科[6]。傳統(tǒng)的科學計量學研究方法主要有出版物統(tǒng)計、著者統(tǒng)計、引文分析、詞頻分析等[7]。

Citespace是由美國德雷塞爾大學信息科學與技術(shù)學院的Chen Chaomei教授應(yīng)用Java語言開發(fā)的一款信息可視化軟件[8],本研究使用的是該軟件的5.1.R8.SE.版本。它主要基于共引分析理論和尋徑網(wǎng)絡(luò)算法等,對特定領(lǐng)域文獻(集合)進行計量,以探尋出科學領(lǐng)域演化的關(guān)鍵路徑及知識轉(zhuǎn)折點,并通過一系列可視化圖譜的繪制,來形成對科學演化潛在動力機制的分析和學科發(fā)展前沿的探測[9]。

2 結(jié)果與分析

2.1 交叉研究的研究主體分析

2.1.1 文獻年代分布

對數(shù)據(jù)集進行分類檢索可知:其中期刊論文記錄1 604 條,博、碩士學位論文記錄1 599 條,會議論文記錄71 條,這3 類文獻體例占總體文獻的97.01%。進一步地對期刊和博、碩士學位論文的年累計量進行多項式回歸預測,發(fā)現(xiàn)當多項式階數(shù)由2階增加到4階時,預測精度不再隨著方程階數(shù)的增加而增加,故采用4階多項式預測。

文獻累計量的分年統(tǒng)計及回歸預測見圖1,期刊論文、學位論文累計數(shù)量預測曲線的R2均達到99%以上,證明回歸模型的擬合優(yōu)度很高。曲線數(shù)值的增長具備某種指數(shù)型趨勢,而此處依據(jù)泰勒公式原理,以多項式函數(shù)來近似計算指數(shù)函數(shù)值,通過設(shè)置預測點,可以推測:本領(lǐng)域期刊論文總量有望在2019年達到1 940 篇左右,在2020年達到2 340 篇左右;本領(lǐng)域?qū)W位論文總量有望在2019年達到1 810 篇左右,在2020年達到1 950 篇左右。在2007年以前,期刊論文的累計量高于學位論文的累計量,這表明1996—2007年交叉研究還處于討論與積累的萌芽階段,尚未形成較完備的學科形態(tài);2007—2019年學位論文的累計量高于期刊論文的累計量,這表明從事交叉研究的人越來越多,交叉研究的熱度在不斷提高,社會的重視程度也在不斷提高;預計2019年會成為期刊論文數(shù)量第二次超過學位論文數(shù)量的轉(zhuǎn)折點,這將標志著交叉研究會逐步形成新的學科增長點,推動新一階段的交叉研究發(fā)展。

圖1 我國食品安全與數(shù)據(jù)科學交叉研究的文獻累計量分年統(tǒng)計與預測Fig. 1 Accumulated annual statistics and prediction of literature on cross-disciplinary studies on food safety and data science in China

2.1.2 重要機構(gòu)分布

使用CNKI數(shù)據(jù)庫的“分組瀏覽-機構(gòu)”功能,可以查詢到當前學科領(lǐng)域中重要機構(gòu)的信息(以發(fā)文量統(tǒng)計,列表機構(gòu)最低發(fā)文量為14 篇)。由表1可知,發(fā)表論文30 篇及以上的機構(gòu)有18 家,所發(fā)表的論文占全部3 375篇文獻的26.93%,屬于引領(lǐng)本領(lǐng)域研究的核心機構(gòu)群體。

表1 1996—2019年我國食品安全與數(shù)據(jù)科學交叉研究領(lǐng)域文獻產(chǎn)出量前18的機構(gòu)Table 1 Top 18 most prolific research institutions in terms of crossdisciplinary studies on food safety and data science in China (1996-2019)

在本領(lǐng)域發(fā)表論文的數(shù)量與該機構(gòu)研究人員的數(shù)量、獲得相關(guān)科研項目的數(shù)量密切相關(guān)。例如:在南京農(nóng)業(yè)大學所發(fā)表的論文中,李太平教授團隊的研究成果最多,共有6 篇論文,主要受到國家自然科學基金面上項目“生鮮農(nóng)產(chǎn)品質(zhì)量安全的監(jiān)管機制研究”(71173114)的資助;在浙江大學所發(fā)表的論文中,杜樹新副研究員及其團隊的論文數(shù)量最多,共有5 篇,主要受到國家科技攻關(guān)計劃資助項目(2001BA804A34)的資金支持。

2.1.3 重要期刊與學位授予單位分布

使用Excel 2016軟件的數(shù)據(jù)透視表功能,對所收集的3 375 條題錄數(shù)據(jù)的“期刊名稱”或“學位授予單位”字段進行數(shù)據(jù)透視,可以得到期刊論文文獻的來源期刊或?qū)W位論文的學位授予單位的統(tǒng)計信息。共有1 611 篇與本主題相關(guān)的期刊論文被刊載在684 種學術(shù)期刊上,平均載文量為2.36 篇/刊。由表2可知,集中刊載本領(lǐng)域論文10 篇及以上的期刊有18 種,載文數(shù)量達438 篇,占全部期刊論文的27.19%,在期刊分類[10]上分屬于4大類,其中“食品科學技術(shù)”和“農(nóng)業(yè)綜合”分類占大多數(shù)。

共有1 598 篇與本主題相關(guān)的學位論文來自248 個不同的學位授予單位,平均載文量為6.44 篇/機構(gòu)。由表3可知,學位論文數(shù)量在20 篇及以上的機構(gòu)有17 家,論文數(shù)量達到650 篇,占本領(lǐng)域?qū)W位論文總量的40.68%。其中,農(nóng)林類與綜合類高校涉足食品安全與數(shù)據(jù)科學交叉研究領(lǐng)域的數(shù)量相較于其他類別更多。

表2 交叉研究期刊論文的來源期刊分布Table 2 Journal distribution of published papers on cross-disciplinary studies on food safety and data science

表3 交叉研究學位論文的學位授予單位分布Table 3 Degree conferring institution distribution of dissertations on cross-disciplinary studies on food safety and data science

本文通過文獻[11]的方法,統(tǒng)計載文數(shù)量、載文數(shù)量的出現(xiàn)頻數(shù)、出現(xiàn)概率和累計概率,得到了期刊論文和學位論文的頻數(shù)與概率分布表。使用Origin Pro 9.1軟件對上述數(shù)據(jù)進行概率分布模型的擬合檢驗,得到圖2。

圖2A、B分別表示本領(lǐng)域期刊論文載文數(shù)量和學位論文載文數(shù)量的概率分布擬合曲線,決定系數(shù)分別為0.999 9、0.999 6,具有很高的擬合優(yōu)度。所以兩種文獻的載文數(shù)量的概率分布都服從異速生長指數(shù)(Allometric)分布。這表明我國食品安全與數(shù)據(jù)科學交叉研究領(lǐng)域經(jīng)過萌芽與積累,研究規(guī)模正在高速增長。根據(jù)異速生長尺度規(guī)律[12]的特點,我國食品安全與數(shù)據(jù)科學交叉研究所形成的這個特定的食品安全子領(lǐng)域,可以看作是一種廣義的生態(tài)系統(tǒng),而本主題新科技論文的產(chǎn)生則是這個生態(tài)系統(tǒng)中最重要的信息流之一。自身的主題與偏好適合這個子領(lǐng)域的優(yōu)質(zhì)文獻被刊載的期刊,或者重視這個新興子領(lǐng)域發(fā)展的研究機構(gòu),會在這個新興子領(lǐng)域里快速生長,顯得愈發(fā)重要。

圖2 期刊論文(A)和學位論文(B)載文數(shù)量的概率分布擬合Fig. 2 Fitted probability distribution of the number of papers published in journals (A) and degree papers (B)

2.1.4 重要作者分布

關(guān)于論文合著情況,共有3 619 人次的作者參與撰寫了這1 611 篇期刊論文,平均作者為2.24 位/篇,即作者合作度[6]為2.24。使用CNKI數(shù)據(jù)庫的“分組瀏覽-作者”功能,可以查詢到當前學科領(lǐng)域中高產(chǎn)作者的信息,本文將所述高產(chǎn)作者中發(fā)文數(shù)量大于5 篇的作者信息進行整理。同時,為了客觀地評價各位高產(chǎn)作者在論文合著中對其論文的貢獻度,本文引入了Du Yongping等2015年提出的基于作者順序的影響力計算方法,該方法適用于大數(shù)據(jù)環(huán)境下具備統(tǒng)計意義的計算[13]。該方法的算理實質(zhì)是:先計算除第一作者以外其他作者的分配得分(以百分數(shù)計),再反向用總貢獻值倒減出第一作者的得分,其計算見下式。

式中:paij表示論文署名次序為i(即Order(i))的作者對其論文j的規(guī)范化貢獻值;M表示該論文的作者總數(shù)。

本文使用pa鏈來記錄作者的署名和排位情況,如:5(2)表示該作者的某一篇論文共有5 位作者,其為第2作者(若為通信作者,則視為第一作者;若存在并列一作,也視為第一作者;特殊情形(比如通信作者)將以“*”標記,如:5(2*),計分為5(1))。根據(jù)公式(1)進一步計算累計pa和平均pa,并將以上字段信息合并為表4。

表4 本領(lǐng)域發(fā)文數(shù)量大于5 篇的高產(chǎn)作者和pa鏈Table 4 Productive authors publishing more than 5 papers and their pa chain in this field

由表4可知,這些高產(chǎn)作者中,平均pa前5 名分別是:李太平、唐曉純、李麗、鄂旭、肖革新,他們應(yīng)該是本領(lǐng)域研究合作的優(yōu)秀候選人。從累計pa來看,王竹天、王志剛也是本領(lǐng)域具備合作潛質(zhì)的優(yōu)秀候選人。

2.2 交叉研究的研究主題分析

2.2.1 關(guān)鍵詞共現(xiàn)分析

本文使用對數(shù)似然率(log-likelihood rate,LLR)算法對關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)進行聚類分析,得到了具有11 個主要聚類的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜(圖3),這些聚類的輪廓值(Silhouette)均大于0.5,且部分大于0.7,說明這些聚類合理且令人信服[14]。這11 個聚類可以進一步歸納為3大類(表5),即:食品安全領(lǐng)域的新型數(shù)據(jù)采集技術(shù)(類I)、食品安全領(lǐng)域的新型數(shù)據(jù)分析技術(shù)(類II)、食品安全領(lǐng)域的新型數(shù)據(jù)科學應(yīng)用(類III)。

由圖3可知,1996—2019年我國食品安全與數(shù)據(jù)科學交叉研究領(lǐng)域形成了內(nèi)部邊界聚合且外部邊界分明的復雜關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜。該圖譜有405 個節(jié)點和1 543 條連線,是一個由大量高頻關(guān)鍵詞形成的廣闊知識空間。以下將根據(jù)引文空間聚類成員的歸屬和食品安全意義上的類別界定,以大類(I、II、III)劃分為展開順序,對所得到的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜進行深入的分析。

表5 關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)的聚類信息Table 5 Clustering information of keyword co-occurrence network

圖3 我國食品安全與數(shù)據(jù)科學交叉研究的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜Fig. 3 Keyword co-occurrence network map of cross-disciplinary studies on food safety and data science in China

2.2.1.1 食品安全領(lǐng)域的新型數(shù)據(jù)采集技術(shù)

在大數(shù)據(jù)時代的背景下,物聯(lián)網(wǎng)、區(qū)塊鏈和電子標簽等技術(shù)成為了采集新型食品安全數(shù)據(jù)的重要支撐技術(shù)。將網(wǎng)絡(luò)嵌入食品生產(chǎn)流通各環(huán)節(jié)的物理設(shè)備,有利于提升食品供應(yīng)鏈的智能化,完善食品溯源體系。尚培培等[15]研究了具備感知層、網(wǎng)絡(luò)層和應(yīng)用層3 層架構(gòu)的產(chǎn)品電子代碼(elctronic product code,EPC)物聯(lián)網(wǎng)在牛肉供應(yīng)鏈安全中的應(yīng)用,實現(xiàn)了牛肉產(chǎn)品標準化唯一標識、不合格牛肉溯源追蹤、全程信息共享3 個層面的食品安全保障。區(qū)塊鏈技術(shù)的數(shù)據(jù)分布式儲存與數(shù)據(jù)不可刪改的特性將對食品從生產(chǎn)到零售的整個商業(yè)過程起到某種監(jiān)督與凈化作用。顏波等[16]設(shè)計并開發(fā)了基于RFID和EPC技術(shù)的具有企業(yè)、政府部門和消費者3 個追溯主體的羅非魚供應(yīng)鏈可追溯平臺,在羅非魚上架銷售前一直使用可循環(huán)RFID標簽,實現(xiàn)了銷售前的全程追溯;而零售端顧客則可以通過獨立包裝外的條形碼標簽溯源,提升了生鮮食品安全監(jiān)管的效率,滿足了顧客的食品安全需求。

2.2.1.2 食品安全領(lǐng)域的新型數(shù)據(jù)分析技術(shù)

數(shù)學模型方法結(jié)合新興的人工智能技術(shù)應(yīng)用于食品安全領(lǐng)域,提升了食品安全數(shù)據(jù)及其分析挖掘技術(shù)在食品安全治理中的功能與地位。晁鳳英等[17]對某出入境檢驗檢疫局提供的食品安全檢測數(shù)據(jù),使用廣度優(yōu)先的Apriori算法進行了關(guān)聯(lián)規(guī)則數(shù)據(jù)挖掘,并對挖掘出的幾條有代表性的關(guān)聯(lián)規(guī)則進行了解讀,由此提煉出食品安全抽檢的優(yōu)化策略。質(zhì)量控制圖是一種簡單、有效的統(tǒng)計技術(shù)[18]。帶有上中下控制界限的、以檢測食品生產(chǎn)過程安全和判斷食品質(zhì)量穩(wěn)定狀態(tài)為目標的控制圖,已經(jīng)逐步演化和固定為食品質(zhì)量安全過程控制的專門化數(shù)據(jù)分析方法。秦燕等[19]使用控制圖工具進行危險檢出物指標預警,對廣州食檢中心某時段內(nèi)的出口茶葉中的六氯環(huán)己烷和白蘭地酒中的甲醇的檢測數(shù)據(jù)進行統(tǒng)計分析,提出了Y-Pn控制圖、C-Pn控制圖、J-Pn控制圖和-δ控制圖4種預警方法。

2.2.1.3 食品安全領(lǐng)域的新型數(shù)據(jù)科學應(yīng)用

以數(shù)據(jù)密集型科學發(fā)現(xiàn)的研究范式,研究前沿且恰當?shù)氖称钒踩珕栴},是數(shù)據(jù)科學應(yīng)用在食品安全領(lǐng)域的一種使命。因為面向主體對象不同,故其應(yīng)用場景和應(yīng)用需求也不相同[20]。所研究的對象是當前層出不窮的各類食品安全事件及危險源,如:使用主成分分析-最小二乘支持向量機預測模型鑒別地溝油[21]、使用層次分析法(analytic hierarchy process,AHP)評價水產(chǎn)品孔雀石綠的殘留風險[22]、使用SGompertz-SLogistic生長動力學模型預測清蛋糕中金黃色葡萄球菌的生長速率[23]等;所研究的內(nèi)容是在宏觀層面上食品安全水平提升所亟待解決的各種問題,如:使用關(guān)聯(lián)規(guī)則算法探尋食品質(zhì)量安全保障的關(guān)鍵因素[24]、使用循環(huán)神經(jīng)網(wǎng)絡(luò)算法對食品安全描述文本的情感傾向進行分類[25]、通過構(gòu)建貝葉斯網(wǎng)絡(luò)對白酒質(zhì)量安全進行預測[26]等;交叉研究所受益的主體及研究方向包括:政府的智慧監(jiān)管與風險預警[27-29]、食品企業(yè)的生產(chǎn)控制與事后應(yīng)對[30-32]、消費者的食品安全風險認知與支付意愿[33-35]等。

2.2.2 時間線聚類分析

使用Citespace軟件進一步繪制關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)的時間線圖譜,由圖4可知,我國食品安全與數(shù)據(jù)科學交叉研究的各研究主題存續(xù)時間不同。例如:聚類C0、C1和C2存續(xù)時間都接近20 年,而且從聚類產(chǎn)生到現(xiàn)在一直是活躍的聚類;而另一些聚類的存續(xù)時間則相對較短,例如:聚類C6、C7和C8,存續(xù)時間只有大約7~10 年,且目前已經(jīng)不再是該主題研究熱度最高的時段,這些主題都具有從存續(xù)時間長的主題中分化產(chǎn)生的特點。圖中的這些顏色與流向表征著我國食品安全與數(shù)據(jù)科學交叉研究的不同發(fā)展階段。

圖4 我國食品安全與數(shù)據(jù)科學交叉研究的關(guān)鍵詞聚類的時間線圖譜Fig. 4 Keyword clustering time-line atlas of cross-disciplinary studies on food safety and data science in China

1996—2006年為重視食品標準數(shù)據(jù)與傳統(tǒng)數(shù)理統(tǒng)計方法的階段。此階段的科技文獻主要側(cè)重引進國外先進的食品安全標準并與我國的食品安全標準進行比較[37-39];在數(shù)據(jù)分析上多基于HACCP系[40-42]、調(diào)查問卷方法和數(shù)理統(tǒng)計工具[43-45]。

2007—2014年為新型食品安全數(shù)字技術(shù)和數(shù)學模型方法開始涌現(xiàn)的階段。此階段層次分析法[46-47]、貝葉斯網(wǎng)絡(luò)[48]、關(guān)聯(lián)規(guī)則[49]、決策樹[50]、可拓決策[51]等數(shù)學模型方法被廣泛地應(yīng)用于食品安全風險評估和風險預警等方面;RFID[52-54]、QR二維碼[55-56]、同位素指紋[57-58]等技術(shù)被廣泛地應(yīng)用于食品質(zhì)量安全追溯領(lǐng)域。

2015—2019年為大數(shù)據(jù)與人工智能開始廣泛地應(yīng)用于食品安全各子領(lǐng)域的階段。此階段計算機視覺[59]、電子鼻與電子舌[60]、模式識別[61]等基于人工智能的食品安全無損檢測技術(shù)得到應(yīng)用;基于區(qū)塊鏈技術(shù)的可追溯平臺[62]、基于大數(shù)據(jù)的社會共治模式[63]、食品安全大數(shù)據(jù)的可視化分析方法[64]、基于大數(shù)據(jù)的食品安全風險分析[65]等由大數(shù)據(jù)技術(shù)驅(qū)動的食品安全智慧監(jiān)管技術(shù)與模式正在探究與實踐中。

2.2.3 關(guān)鍵詞突現(xiàn)分析

本文采用Kleinberg突發(fā)事件檢測算法[66]來探測文獻空間中的突現(xiàn)詞,Citespace軟件會從論文題目、關(guān)鍵詞和摘要等字段中提取候選專業(yè)術(shù)語,通過跟蹤分析它們在不同時間區(qū)間內(nèi)出現(xiàn)頻率的突然變化(激增),識別出代表研究前沿的若干名詞術(shù)語[67]。運行程序后,Citespace找到了47 個突現(xiàn)關(guān)鍵詞,將突現(xiàn)度前50%的突現(xiàn)詞按照其突現(xiàn)起止時間的升序排列得到表6。

表6 突現(xiàn)度最高的前50%的關(guān)鍵詞Table 6 Top 50% keywords with the strongest citation burstness

從表6可以看出,不同年份本領(lǐng)域的研究者所關(guān)注的研究熱點不同。根據(jù)表6可以進一步把我國食品安全與數(shù)據(jù)科學交叉研究的熱點演進劃分為3 個階段,與時間線聚類分析的年代劃分相吻合。1)1996—2006年為重視國外食品安全標準的引進及與我國食品安全標準開展比較研究的階段,“檢索工具”、“GB(國家標準)”是這一階段的突現(xiàn)詞。2)2007—2014年,突現(xiàn)詞“RFID”和“電子標簽”代表了新型食品數(shù)字溯源技術(shù)的研究方向;突現(xiàn)詞“利益相關(guān)者”與“食品行業(yè)”代表了與食品企業(yè)有關(guān)的研究方向;突現(xiàn)詞“供應(yīng)鏈”與“預警”等代表了與食品安全風險控制有關(guān)的研究方向。3)2015—2019年,突現(xiàn)詞“大數(shù)據(jù)”代表了數(shù)據(jù)密集型科學發(fā)現(xiàn)的研究范式;突現(xiàn)詞“風險感知”、“購買意愿”和“社會共治”等代表了這一階段涌現(xiàn)出的研究熱點。

3 討 論

3.1 交叉研究當前的研究熱點

3.1.1 新型數(shù)據(jù)采集技術(shù)與食品溯源及網(wǎng)絡(luò)輿情的研究在食品從農(nóng)田到餐桌的流通過程中,食品及其有關(guān)主體的多重屬性被計量和記錄,產(chǎn)生了食品關(guān)聯(lián)屬性的數(shù)據(jù)化基礎(chǔ)[68]。以保障食品質(zhì)量或數(shù)量安全為目的,提取這些數(shù)據(jù),則產(chǎn)生了海量的食品安全數(shù)據(jù)。數(shù)據(jù)采集技術(shù)的發(fā)展使得文本資料、社會關(guān)系、地理方位等不易被提取的數(shù)據(jù)變得可被利用;使得政府、企業(yè)、檢測機構(gòu)、行業(yè)協(xié)會、媒體和消費者這6 類食品安全社會主體[20]所產(chǎn)生和需要的結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)[69]被各種技術(shù)手段收集和儲存,以備挖掘與利用。

一方面,RFID和傳感器、物聯(lián)網(wǎng)等面向現(xiàn)實世界中食品理化數(shù)據(jù)的數(shù)據(jù)采集技術(shù),推動了食品安全溯源技術(shù)的發(fā)展。圣光磊[70]通過改進滑動窗口射頻識別數(shù)據(jù)分析-目標自適應(yīng)射頻識別數(shù)據(jù)分析(statistics moothing for unreliabler fid data-dynamic tags-based SMURF,SMURF-DSMURF)算法中數(shù)據(jù)完整性和標簽動態(tài)性條件,設(shè)計了新的更高效的多層級射頻識別數(shù)據(jù)分析(multi label DSMURF,MDSMURF)算法,并應(yīng)用于白芍飲片溯源系統(tǒng)中,提高了數(shù)據(jù)噪聲的清洗效率和多標簽動態(tài)的閱讀效率。鐘聰兒等[71]將ALOHA算法應(yīng)用于基于RFID技術(shù)的茶葉物流溯源系統(tǒng)中,并設(shè)計了仿真實驗,結(jié)果表明:通過解決硬件不兼容、信息冗余等問題,能夠顯著地提高追溯系統(tǒng)的響應(yīng)效率。

另一方面,網(wǎng)絡(luò)爬蟲及數(shù)據(jù)接口等面向虛擬世界中的食品資訊數(shù)據(jù)的數(shù)據(jù)采集技術(shù),推動了食品安全輿情研究的發(fā)展。程鐵軍等[72]使用網(wǎng)絡(luò)爬蟲技術(shù)在線獲取了2011—2014年總貼數(shù)達50萬以上的超熱度食品安全新聞事件15 例,并構(gòu)建了4大類11小類的食品安全風險預警指標,通過粗糙集理論進行屬性簡約計算,從高熱度輿情事件中提煉出易引發(fā)食品安全事件的關(guān)鍵食品流通環(huán)節(jié),為源頭管理和社會共治提供了針對性建議。洪小娟等[73]以所收集的包含588 個媒體微博節(jié)點的2014年食品安全微博輿情事件為數(shù)據(jù)集,使用Pajek軟件進行了社會網(wǎng)絡(luò)分析特有的網(wǎng)絡(luò)結(jié)構(gòu)、度、K-核以及派系分析,發(fā)現(xiàn)了食品安全新聞傳播的核心節(jié)點、媒體派系以及傳播模式,為食品安全輿情的利用與引導提供了可參考的建議。

3.1.2 新型數(shù)據(jù)存儲技術(shù)與食品數(shù)據(jù)倉庫及預警系統(tǒng)研究

大數(shù)據(jù)及其應(yīng)用技術(shù)的爆炸式發(fā)展所產(chǎn)生的數(shù)據(jù)存儲需求推動了數(shù)據(jù)存儲技術(shù)的發(fā)展。大規(guī)模并行處理機(massively parallel processor,MPP)存儲架構(gòu)、Hadoop技術(shù)和分布式計算等新興技術(shù),讓已經(jīng)長期存在的食品安全大數(shù)據(jù)有了被規(guī)范化存儲和多元化挖掘利用的可能性,尤其是基于數(shù)據(jù)庫的食品安全預警系統(tǒng),是當前研究的重要熱點形態(tài)。郭曙超等[74]以山東地區(qū)進出口食品檢測實驗室的檢測數(shù)據(jù)為數(shù)據(jù)集,根據(jù)食品安全工作需要,設(shè)計數(shù)據(jù)字典和體系架構(gòu),建立了“進出口食品與農(nóng)產(chǎn)品實驗室檢測數(shù)據(jù)倉庫系統(tǒng)”,該系統(tǒng)可進行數(shù)理統(tǒng)計、可視化分析與數(shù)據(jù)挖掘,能夠?qū)崟r掌握食品安全狀況的動態(tài),可以為食品安全管理人員提供高質(zhì)量的決策依據(jù)。劉翠玲等[75]使用Eclipse開發(fā)環(huán)境和Java語言,設(shè)計并開發(fā)了一種基于多源大數(shù)據(jù)的食品安全監(jiān)測預控系統(tǒng),該系統(tǒng)后臺采用My SQL關(guān)系數(shù)據(jù)庫,實現(xiàn)了拉曼光譜儀數(shù)據(jù)的導入、分析與預警。黎建輝等[76]以云計算、云存儲、分布式計算框架為系統(tǒng)主體,結(jié)合信息爬取、模式識別以及深度學習技術(shù)等,設(shè)計并開發(fā)了全球食品安全信息監(jiān)控與分析云平臺,通過對近5 000 個信息源的固定周期爬取與監(jiān)控,成功地預警出了礦泉水水源污染事件、病死豬肉流入市場事件以及保鮮膜中塑化劑超標事件等具有重大社會影響的食品安全事件。

3.1.3 新型數(shù)據(jù)分析技術(shù)與食品安全智能解決方案研究

應(yīng)用數(shù)據(jù)科學模型方法體系中的有監(jiān)督學習、半監(jiān)督學習和無監(jiān)督學習[77]的各類算法對海量的食品安全數(shù)據(jù)進行計算分析,可以為食品安全的信息探測、數(shù)據(jù)預測和風險評估等各方面帶來更加智能化的解決方案。劉金碩等[78]提出一種基于隱狄利克雷分配模型(latent Dirichlet allocation,LDA)的K平均值(K-means)聚類的網(wǎng)絡(luò)食品安全問題話題發(fā)現(xiàn)算法,并以網(wǎng)絡(luò)爬取的2017年包含43 個食品安全分類的1 920 條新聞報道為數(shù)據(jù)集,通過LDA-K-means算法進行聚類,以此發(fā)現(xiàn)新的食品安全話題,并與傳統(tǒng)的向量空間模型(vector space model,VSM)算法進行了比對,實驗結(jié)果表明,LDA-K-means算法相對于傳統(tǒng)的VSM算法聚類效率更高,更加利于快速探測網(wǎng)絡(luò)中新的食品安全問題話題。陳國慶等[79]使用基于熒光光譜和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò),對光譜儀發(fā)射波長的網(wǎng)絡(luò)特征參數(shù)進行訓練,并對胭脂紅溶液樣本的濃度進行預測,結(jié)果表明,該方法對食品色素溶液種類識別的準確度接近100%,可應(yīng)用于合成食品色素檢測及食品安全監(jiān)管。趙靜嫻[80]以2005—2009年華北地區(qū)20 個蔬菜種植基地的調(diào)查數(shù)據(jù)和國家農(nóng)業(yè)科學數(shù)據(jù)中心的共享數(shù)據(jù)為數(shù)據(jù)集,抽取82 個樣本作為訓練集,抽取10 個樣本作為驗證集,應(yīng)用決策樹算法進行食品安全評估,提取了5 條規(guī)則,與驗證集對比的準確率達到了90%,說明該方法能夠有效指導農(nóng)產(chǎn)品質(zhì)量安全的提高方向。

3.1.4 新型數(shù)據(jù)可視化技術(shù)與食品安全決策輔助研究

食品安全數(shù)據(jù)可視化分析作為一個新興的交叉研究領(lǐng)域,通過先進的交互式可視化工具幫助食品安全領(lǐng)域人員快速分析數(shù)據(jù)的分布態(tài)勢、探尋數(shù)據(jù)間隱含關(guān)聯(lián)、提升認知和分析能力、提高食品安全監(jiān)管的科學性和有效性[81]。陳誼等[81]在分析食品安全大數(shù)據(jù)特征的基礎(chǔ)上,使用了數(shù)據(jù)地圖、ThemeRiver、雙曲樹、TimeWheel和SolarMap等新型圖表,展示了時空數(shù)據(jù)、層次數(shù)據(jù)、多維數(shù)據(jù)和關(guān)聯(lián)關(guān)系的數(shù)據(jù)可視化形式,為提升數(shù)據(jù)可視化的易用性和輔助食品安全決策的可靠性提供了技術(shù)路徑。陳紅倩等[82]提出了一種基于Open GL圖形庫與統(tǒng)計數(shù)據(jù)的農(nóng)殘檢測數(shù)據(jù)的融合對比可視化方法,該方法可將一定規(guī)模的農(nóng)殘數(shù)據(jù)根據(jù)其所屬的地區(qū)和類別進行分類統(tǒng)計,并將多個統(tǒng)計結(jié)果融合到一個可視化界面中,可對農(nóng)殘檢測數(shù)據(jù)進行快速展示,并以此進行分析和預判,為有關(guān)專家進行農(nóng)產(chǎn)品安全快速決策提供研判依據(jù)。楊璐等[83]提出了一種挖掘數(shù)據(jù)關(guān)系的可視分析圖ExploreView,以國家食品藥品監(jiān)督管理總局抽檢數(shù)據(jù)為數(shù)據(jù)集,使用立方體隱喻組織數(shù)據(jù),進而完成數(shù)據(jù)編碼,綜合使用層次圖、細節(jié)描述圖和關(guān)系挖掘圖等新式可視化圖像,實現(xiàn)對數(shù)據(jù)的展示和交互,為食品質(zhì)量安全的監(jiān)測和預警提供決策幫助。江美輝等[84]以“上海福喜過期肉”事件新聞文本為研究對象,基于復雜網(wǎng)絡(luò)理論,使用Gephi軟件對非結(jié)構(gòu)化的文本信息進行了拓撲特征分析和關(guān)聯(lián)網(wǎng)絡(luò)挖掘,結(jié)果表明,食品安全事件新聞報道的關(guān)注點具有集聚性,且關(guān)注點會隨著時間推移而變化,該研究挖掘出了新聞實體間的隱含關(guān)系,為有關(guān)部門對食品安全突發(fā)事件的應(yīng)急管理提供了決策依據(jù)。

3.1.5 面向?qū)ο蟮氖称钒踩髷?shù)據(jù)技術(shù)應(yīng)用研究

面向食品安全治理的不同社會主體的數(shù)據(jù)特征和數(shù)據(jù)需求的應(yīng)用研究,是目前交叉研究的重要橫向?qū)用妗?傮w來看,政府需要食品安全智慧監(jiān)管類的研究。張亮等[85]提出了面向智慧型城市的食品安全監(jiān)管體系,該體系基于感知網(wǎng)絡(luò)發(fā)現(xiàn)與采集數(shù)據(jù),基于云儲存規(guī)劃與分析數(shù)據(jù),基于大數(shù)據(jù)技術(shù)挖掘與預測數(shù)據(jù),為智慧城市食品質(zhì)量的安全預警和應(yīng)急管理提供了參考路徑;食品企業(yè)需要產(chǎn)品質(zhì)量與輿情安全類的研究,席磊等[86]提出了一種分布式無公害農(nóng)產(chǎn)品數(shù)字認證系統(tǒng),該系統(tǒng)具有中心化分布式拓撲結(jié)構(gòu),使用元數(shù)據(jù)、工作流和Web Service技術(shù),可實現(xiàn)跨部門、跨地域的協(xié)同工作和高效認證的系統(tǒng)功能;檢測機構(gòu)需要共享分析和能力評價類的研究,沐曉馥[87]提出了一種基于AHP算法的檢驗檢測機構(gòu)檢測能力管理信息系統(tǒng)績效評價方法,該方法基于AHP算法設(shè)計了具有4 個一級指標和10 個二級指標的評價指標體系,用于量化評價不同檢測機構(gòu)的檢測能力管理信息系統(tǒng)的績效,為有關(guān)單位進行系統(tǒng)選型提供了實際的決策依據(jù);行業(yè)協(xié)會需要行業(yè)自律和治理參與方式類的研究,劉根華等[88]以浙江省金華市為例,應(yīng)用數(shù)據(jù)統(tǒng)計分析方法分析了行業(yè)協(xié)會參與食品安全社會共治的現(xiàn)實困難,提出了“政府職能前移”和“五方聯(lián)動機制”等有益對策;媒體需要治理策略和信息查詢類的研究,謝康等[89]基于Kahneman-Tversky前景理論和博弈論方法,定量化分析了媒體參與食品安全社會共治的條件,借助MATLAB軟件進行系統(tǒng)仿真,得出媒體可采取的“提高違規(guī)者聲譽損失度”、“持續(xù)跟蹤調(diào)查或深度報道”、“動態(tài)監(jiān)督”和“媒體群監(jiān)督與共治代表制度”4 種有效策略;消費者需要風險感知和購買意愿類的研究,張宇東等[90]使用數(shù)理統(tǒng)計方法分析了所設(shè)計、發(fā)放與回收的550 份有效調(diào)查問卷,定量化地揭示了食品安全風險感知下,消費者的量化信息偏好、購買意愿和決策邏輯,結(jié)果表明,對食品安全風險嚴重性的主觀判斷會顯著提升消費者對食品安全量化信息的偏好,而這種偏好會反向刺激消費者量化消費,以應(yīng)對所認知的食品安全風險。

3.2 交叉研究未來的發(fā)展趨勢

隨著大數(shù)據(jù)時代的到來以及數(shù)據(jù)挖掘技術(shù)在食品安全領(lǐng)域的應(yīng)用,數(shù)據(jù)科學在食品安全各領(lǐng)域的地位將會越來越重要,食品安全監(jiān)管也將向著更加智能化的方向發(fā)展,社會食品安全水平必然會得到更加顯著的提升。數(shù)據(jù)科學的發(fā)展是推動交叉研究進步的重要推動力,食品安全研究的發(fā)展過程中對數(shù)據(jù)科學產(chǎn)生的新需求是引領(lǐng)交叉研究進步的重要牽引力。從數(shù)據(jù)科學的發(fā)展趨勢來看:數(shù)據(jù)可視化、文本挖掘與自然語言處理、社交網(wǎng)絡(luò)分析、計算機視覺和高性能計算等會成為未來的大數(shù)據(jù)技術(shù)前沿[91]。若將這些前沿技術(shù)投射到食品安全領(lǐng)域,則會帶來如下的未來研究熱點:1)計算機視覺技術(shù)的發(fā)展將推動食品無損檢測技術(shù)的研究;2)自然語言處理能力的提升將推動食品安全網(wǎng)絡(luò)輿情處理的研究;3)各種機器學習算法的進步將推動食品安全歷史數(shù)據(jù)的知識發(fā)現(xiàn)以及決策支持的研究;4)食品安全大數(shù)據(jù)的云儲存與人工智能服務(wù)的需求將持續(xù)擴大,其產(chǎn)業(yè)化的研究將得到蓬勃發(fā)展。

4 結(jié) 語

在近23 年的發(fā)展歷程中,我國食品安全與數(shù)據(jù)科學的交叉研究從零星的學科交集萌芽,逐漸發(fā)展出一個新興交叉學科的雛形,目前正處于新的快速增長期。文獻數(shù)量呈指數(shù)式增長,目前已存在3 375 篇各類文獻的研究體量,期刊論文和學位論文的年平均增速分別達到51.49%和52.45%,作者合作度為2.24。涌現(xiàn)出的高產(chǎn)和高貢獻度作者越來越多,例如南京農(nóng)業(yè)大學的李太平教授、中國人民大學的唐曉純副教授和安徽工業(yè)大學的李麗副教授等。通過CNKI的“分組瀏覽-研究層次”檢索功能獲知,我國食品安全與數(shù)據(jù)科學交叉研究目前涉及到國內(nèi)工程技術(shù)(自科)、行業(yè)指導(社科)和基礎(chǔ)研究(社科)等16 個學科領(lǐng)域。結(jié)合科學計量學的分析,得出以下3 個方面的結(jié)論。

第一,通過關(guān)鍵詞共現(xiàn)圖譜分析,找出了本領(lǐng)域3大類11小類熱點研究主題。通過時間線聚類圖譜分析與關(guān)鍵詞突現(xiàn)度圖譜分析,劃分出了本領(lǐng)域發(fā)展史上的3 個典型歷史階段,即:1996—2006年的食品安全標準引入與比較和食品安全數(shù)據(jù)的數(shù)理統(tǒng)計階段;2007—2014年的食品安全數(shù)字技術(shù)與數(shù)學模型階段;2015—2019年的食品安全大數(shù)據(jù)與人工智能階段;預計在未來計算機視覺、自然語言處理技術(shù)、機器學習算法和大數(shù)據(jù)服務(wù)產(chǎn)業(yè)會在我國食品安全與數(shù)據(jù)科學交叉領(lǐng)域發(fā)揮更加重要的作用。

第二,通過文獻分析,在食品安全與數(shù)據(jù)科學交叉融合的方向?qū)哟蝸砜矗瑪?shù)據(jù)科學的數(shù)據(jù)采集、數(shù)據(jù)存儲、數(shù)據(jù)分析和數(shù)據(jù)可視化等技術(shù),在23 年間不同程度地與食品安全的食品溯源、網(wǎng)絡(luò)輿情、風險預警、智慧監(jiān)管和可視化決策等重要方面相融合,誕生出新的食品安全前沿研究形態(tài),是推動交叉研究不斷發(fā)展的重要縱向動力。數(shù)據(jù)科學的各種技術(shù)與食品安全社會共治的各個主體的實際需求相結(jié)合,誕生出各種面向?qū)ο蟮氖称钒踩髷?shù)據(jù)技術(shù),是推動食品安全與數(shù)據(jù)科學交叉融合、促進食品安全大數(shù)據(jù)技術(shù)發(fā)展的重要橫向動力。

第三,值得注意的是,雖然在僅僅23 年的時間里,我國食品安全與數(shù)據(jù)科學的交叉研究得到了迅猛發(fā)展;但是高被引論文[92]卻只是總體文獻中的極少數(shù),國內(nèi)研究與世界先進水平相比仍有差距;相比起食品安全領(lǐng)域的其他成熟學科板塊,本領(lǐng)域的學科影響力仍然較為有限。結(jié)合未來的科技發(fā)展趨勢和國家科技政策導向,我國食品安全與數(shù)據(jù)科學交叉研究應(yīng)該得到社會各界更多的重視;本領(lǐng)域經(jīng)過探索且被證明是成熟可行的研究范式,應(yīng)該以課程化的形式進入到與食品安全有關(guān)的專業(yè)學科的課程體系之中;各級科學基金也應(yīng)該加強對本領(lǐng)域的支持力度,推動本領(lǐng)域新的科研成果的不斷產(chǎn)生以及科技成果的高效轉(zhuǎn)化,以此推動我國食品安全監(jiān)管防控的智能化進程。

本文也存在一定的局限性,因為數(shù)據(jù)下載階段可檢索到并可供下載的數(shù)據(jù)與所在高校(或研究機構(gòu))所購買的數(shù)據(jù)庫的時間跨度及文獻種類的權(quán)限有關(guān)[93]。故可能存在少量未被CNKI收錄的文獻,或作者單位未購買下載權(quán)限的數(shù)據(jù)庫所包含的文獻,未被納入本研究的數(shù)據(jù)集會造成少量的樣本缺失,并會一定程度地影響科學計量與主題分析的精準度。

猜你喜歡
科學研究
FMS與YBT相關(guān)性的實證研究
2020年國內(nèi)翻譯研究述評
遼代千人邑研究述論
視錯覺在平面設(shè)計中的應(yīng)用與研究
科技傳播(2019年22期)2020-01-14 03:06:54
點擊科學
點擊科學
科學大爆炸
EMA伺服控制系統(tǒng)研究
新版C-NCAP側(cè)面碰撞假人損傷研究
科學
主站蜘蛛池模板: 久久a级片| 尤物视频一区| 5555国产在线观看| 久久天天躁狠狠躁夜夜躁| 国产精品妖精视频| 欧美一级黄片一区2区| 亚洲精品第一页不卡| 一级福利视频| 欧美爱爱网| 午夜小视频在线| 99er精品视频| 99精品免费在线| 欧美日韩北条麻妃一区二区| 99热最新在线| 国产一级小视频| 欧美日韩福利| 亚洲国产日韩在线成人蜜芽| 国产福利免费在线观看| 青青操国产视频| 9966国产精品视频| 一级成人a做片免费| www.99在线观看| 亚洲AV无码乱码在线观看裸奔 | 亚洲日韩精品无码专区97| 在线高清亚洲精品二区| 精品国产成人a在线观看| 天天综合网亚洲网站| 亚洲二区视频| 日韩欧美国产综合| 国产色婷婷视频在线观看| 中国一级毛片免费观看| 在线毛片网站| 国产午夜人做人免费视频| 国内精自视频品线一二区| 国产97视频在线| 精品视频91| 亚洲欧美日韩精品专区| 人妻少妇久久久久久97人妻| 视频二区亚洲精品| 免费毛片全部不收费的| 国产精品吹潮在线观看中文| 国内丰满少妇猛烈精品播| 91在线视频福利| 国产亚洲精品资源在线26u| 亚洲无码不卡网| 亚洲日韩欧美在线观看| 色婷婷电影网| 四虎免费视频网站| 伊人久久影视| 伊人丁香五月天久久综合| 中文无码精品a∨在线观看| 国产午夜小视频| 亚洲中文制服丝袜欧美精品| 国产黑丝视频在线观看| 久久婷婷五月综合97色| 国产一二三区视频| 亚洲欧美不卡| 亚洲天堂视频网站| 伊人国产无码高清视频| 国产美女人喷水在线观看| 国产午夜无码专区喷水| 亚洲精品欧美重口| 免费人成又黄又爽的视频网站| 91精品aⅴ无码中文字字幕蜜桃 | 亚洲欧美国产视频| 久久天天躁狠狠躁夜夜2020一| 国产极品美女在线播放| 国产99久久亚洲综合精品西瓜tv| 欧美在线视频a| 麻豆国产在线不卡一区二区| 欧美精品在线视频观看| 国产91蝌蚪窝| 亚洲香蕉在线| 亚洲精品无码高潮喷水A| 毛片网站在线播放| 成人国产一区二区三区| 欧美一道本| 全午夜免费一级毛片| 美女视频黄又黄又免费高清| 免费又爽又刺激高潮网址| 91精选国产大片| 亚洲综合18p|