余孜孜,任錫蓉,林民堯,黃玉旺,吳賢奇,劉少群,孫彬妹,鄭鵬
華南農業大學,廣東 廣州 510642
茶葉中豐富的營養成分及其保健功效相繼被發現證實,促進了茶葉的消費和需求。成品茶品質受茶葉生產和流通各環節影響,從茶鮮葉到加工,再到成品茶的貯藏等環節都需要進行監測來確保茶葉品質。傳統的檢測手段應用范圍有限且耗時、耗材,無法滿足快速、無損的精細化技術要求,因此拉曼光譜技術、近紅外光譜檢測技術、高光譜成像技術等日新月異的信息化無損檢測技術表現出極大的優越性。其中,高光譜成像技術以融合圖像與光譜來獲取物質空間信息的突出特點被引入至茶葉領域進行研究應用。高光譜成像技術能保持樣品的完整性、減少樣品前處理,實現快速、無損檢測,因此該技術在茶葉領域具有巨大的發展潛力,被引入后茶葉的種類識別、等級判別、成分及生理參數測定等檢測獲得突破。隨著技術的逐步發展,高光譜成像技術在茶葉領域的相關應用研究不斷推進,但對其研究進展少有系統梳理。
本文以中國知網(CNKI)和Web of Science(WOS)核心數據庫收錄的相關文獻為數據來源,采用文獻分析軟件CiteSpace對有關高光譜在茶葉領域的研究應用文獻進行國家、作者和關鍵詞分析,獲得可視化知識圖譜,梳理高光譜在茶葉中的研究進程,歸納其研究方向及熱點,預測未來可能的研究趨勢,以期對后續高光譜在茶葉領域應用的深入發展提供理論參考。
以CNKI 和WOS 檢索平臺作為文獻數據來源。采用高級檢索,在CNKI 中以主題/關鍵詞=“高光譜”AND“茶葉/茶”的方式進行檢索;在WOS 中的檢索公式為TS=(hyperspectral) AND TS=(tea)。CNKI和WOS數據庫的檢索時間范圍分別為1999年1月1日至2022年2月28日、1985年1月1日至2022年2月28日,手動篩選檢索結果,剔除不相關文獻,最終分別獲得69 篇中文(CNKI)和71篇英文(WOS)有效文獻,將選擇的有效文獻分別以“Refworks”和純文本文件格式導出保存作為數據樣本。
首先運用CNKI 和WOS 數據庫的可視化分析檢索功能統計文獻年發表量,發現CNKI中相關文獻最早出現在2008年,WOS中則最早出現于2009年。之后將上述保存的CNKI 和WOS 文獻數據分別導入至CiteSpace5.8.R3 軟件,進行以下設置:CNKI 數據庫時間范圍為2008年1月—2022年2月,WOS數據庫時間范圍為2009年1月—2022年2月;Node Tpyes(節點類型)均先后選擇Keyword(關鍵詞)、Country(國家)、Author(作者)分別作圖,Pruning(網絡裁剪區)均選擇Pathfinder(路徑找尋)、Pruning the merged network(修剪合并的網絡),其余為默認參數。運行軟件得到統計數據,生成并繪制共現圖譜和Timeline view(時間線視圖)。
在圖譜中,國家、作者和關鍵詞的節點越大則頻次越高;節點的圈層表示中心性,是對節點影響力的標識,其寬度越寬則中心性越強,當中心性≥0.1時可被視為關鍵轉折點。在時間線知識圖譜中,聚類模塊值Modularity(Q值)與聚類平均輪廓值Mean Silhouette(S值)兩個聚類參數用于判斷聚類效果,Q>0.3 認為聚類結構顯著,S>0.5認為聚類合理。
為進一步細化高光譜成像技術在茶葉中的研究領域,對CiteSpace統計的CNKI和WOS數據庫的所有關鍵詞進行內容分析和階段性領域歸類,若關鍵詞涉及到多個領域,則按照比例計算頻次和中心性。
高光譜成像技術在茶葉領域應用研究的國家合作網絡圖譜顯示,共有10個國家參與研究該項內容,包括中國、日本、美國、比利時、蘇格蘭、印度、英國、愛爾蘭、荷蘭、韓國。按發文量排列,中國、日本、美國位居前三,且中國發文量達53篇;其中,比利時的中心性超過0.1,中國的中心性為0.06。可見,比利時發表的研究論文對高光譜成像技術在茶葉中的應用研究貢獻最高,而中國作為茶葉原產地對相關內容的研究數量最多,貢獻率居于第二位。
作者合作網絡圖譜能夠呈現某一研究領域的核心作者以及作者間合作聯系緊密程度,而核心作者是基于最高發文量作者的發文數,可通過普賴斯定律計算,公式為=0.749(),其中代表核心作者最低發文量,代表該時間段內最高產作者的發文量。
對中英文文獻進行作者合作網絡分析后發現,CNKI 文獻的作者合作網絡顯示節點數161個,連線352 條。CiteSpace 數據統計得到論文發表最多篇數是4 篇,作者是吳瑞梅。代入上述公式計算得出=1.498,取整數2,即發文量≥2 的作者為核心作者。依照統計數據,核心作者共有34 位,發文數量3 篇及以上的作者有吳瑞梅(4篇)、李姝寰(3篇)、寧井銘(3篇)、艾施榮(3篇)、王化(3 篇)、劉仲華(3 篇)。此研究領域形成以吳瑞梅、劉仲華為核心的作者群,并且核心作者中吳瑞梅與艾施榮、李姝寰與寧井銘各自組成了合作團隊,此外還有其他合作小團體以及較多孤立的作者。
英文文獻作者節點數165個,連線394條。統計結果顯示,學者NING JINGMING(寧井銘)發表論文數最高,達14篇,代入計算得到=2.802,取整數3,表明發文量3篇及以上的作者為核心作者。按照此標準共計20位核心作者,發文量前八的作者是NING JINGMING、ZHANG ZHENGZHU(張正竹)、SUN JUN(孫俊)、WANG YUJIE(王玉潔)、CHEN QUANSHENG (陳全勝)、LI LUQING (李露青)、WU XIAOHONG (武小紅)、REI SONOBE,分別對應發表論文14 篇、10 篇、9 篇、8 篇、7 篇、7 篇、6 篇、6 篇。英文文獻核心作者之間交流相對較多,以NING JINGMING 為首,與ZHANG ZHENGZHU、WANG YUJIE、LI LUQING 等核心作者組成了聯系緊密的較大研究群體,SUN JUN 與WU XIAOHONG也交流甚多,此外還有分別以核心作者CHEN QUANSHENG、REI SONOBE、HE YONG (何勇)帶領的合作團隊。可以看出在該研究領域發表英文論文的作者多以團隊合作的形式開展研究,人數大多超過3人。
發文量的時間分布統計可以反映某研究的發展階段與趨勢,基于CiteSpace中時間切片后各年份的文獻數量統計數據,CNKI、WOS 的年發文量以及累計發文總量匯總如圖1。2008—2021年間,總體上茶葉領域高光譜成像技術研究的相關文章發文總量呈持續上升趨勢,而中英文文獻的年發文量變化波動較大,可大致分為兩個階段。2008—2016年為緩慢發展階段,文獻發表分別始于2008年(CNKI)和2009年(WOS)。此階段文獻增量總體較低,但中文文獻的數量多數時間高于英文文獻的數量,特別是在2014年中文文獻發表量出現1個小高峰,年發文量為8篇,除此之外國內外年發文量≤5篇,說明在此期間高光譜成像技術在茶葉領域的應用開始逐漸走入學者的視野,但沒有受到顯著關注。

圖1 茶葉領域高光譜研究文獻發文趨勢
2017年至今則是快速發展階段,該時期的累計發文量約占總量的68%。中文文獻又一次達到小高峰后回落,增速放緩;而英文文獻在2017年之后增長速度加快,2019年開始年發文量明顯高于中文文獻,并于2020年達到頂峰(17 篇),2022年前兩月已有2 篇英文文獻發表,表明茶葉領域的高光譜成像技術研究在國內外反響愈來愈強烈。以科技力量提高茶業質量效益和市場競爭力越來越成為全球性趨勢,因此隨著技術的發展和茶葉領域科技需求的增加,可以預測之后高光譜的相關研究熱度仍會持續。
CiteSpace 的時間線視圖和關鍵詞突顯圖譜能進一步梳理高光譜成像技術在茶葉領域的研究脈絡。時間線視圖既能對關鍵詞進行聚類分析,反映該研究領域的焦點內容,又可以呈現不同時間段的關鍵詞變化趨勢,展現聚類中的文獻歷史跨度。突顯圖譜則展示某時間段內數量激增且聯系較強的關鍵詞,以此確認前沿動態,預測未來研究趨勢。
對CNKI的中文文獻進行時間線視圖和關鍵詞突顯圖譜繪制,結果共顯示出9 個聚類集,可以大致劃分成以下兩類:4個有關高光譜成像技術的研究內容和5 個在茶葉中的應用方向,其中作物和無損檢測聚類集的研究時間貫穿整個演進過程。在時間線視圖基礎上分析突現詞,得到2008—2021年的14個關鍵詞。經計算有關高光譜成像技術發展研究的累計頻次和平均頻次分別為85 次和1.85 次,累計中心性和平均中心性分別為1.69、0.037。在茶葉中的研究應用范圍分為茶葉栽培和茶葉加工兩大領域,統計得到表1。結合時間視圖、突顯圖譜和表1,可將CNKI文獻中茶葉領域中高光譜成像技術應用領域的研究分為以下幾個階段。

表1 CNKI文獻中高光譜成像技術在茶葉中的主要應用領域和方向
緩慢發展階段(2008—2016年),在茶葉栽培領域,高光譜以植物營養信息獲取、病蟲害檢測和農藥殘留檢測的應用為主。在茶葉加工領域,種類識別、品質鑒別為主要的應用方向,其中,品質鑒別包含等級評判、制茶工藝評價(萎凋)等不同研究內容。突顯圖譜顯示,栽培與加工領域的“等級”“茶多酚”“萎凋”關鍵詞在此階段突顯,“等級”的突顯強度較強(1.08),且持續研究的時間長度最長。
快速發展階段(2017—2021年),主要應用范圍繼續擴展。除病害檢測外,茶園分布識別以及茶園生產管理為栽培領域的主要方向。對于加工領域,儲藏年份判別是近年來新增的研究方向,且此階段的品質鑒別中同樣含有在制茶工藝評價中的應用,但具體內容從萎凋工藝發展到拼配、發酵的工藝。
綜上,中文文獻的有關高光譜成像技術在茶葉領域的應用方向主要有植物營養信息獲取、病蟲害檢測、農藥殘留檢測、茶園分布識別、茶園生產管理、種類識別、品質鑒別。從整體的頻次和中心性來看,茶葉加工領域均高于茶葉栽培領域,并且兩個領域總和的累計值(111 次和1.85)均高于有關高光譜成像技術發展研究的累計值,但其平均值較低,分別為1.35次和0.022。
WOS 文獻聚類共顯示8 個聚類集,聚類集的分類標準與CNKI聚集的分類標準一致,其中feature selection (特征選擇)、convolutional neural networks(卷積神經網絡)、modeling(建模)為高光譜成像技術發展研究,而tea leaves(茶葉)、discriminant analysis(判別分析)、fine tea powder(細微的茶粉)、tea quality(茶葉品質)和shadegrown tea(遮陰茶)則屬于茶葉領域的應用研究方向。此外,生成的突顯圖譜共顯示10 個突顯詞,時間段為2009—2022年。WOS中計算得到有關高光譜成像技術發展研究的累計頻次和平均頻次分別為123 次和1.86 次,累計中心性和平均中心性分別為2.56、0.039。將國際文獻中有關高光譜成像技術在茶葉領域的主要應用方向歸類整理如表2,并歸納出WOS 文獻中階段性茶葉研究方向內容如下。

表2 WOS文獻中高光譜成像技術在茶葉中的主要應用領域和方向
2009—2016年,國際上對高光譜成像技術在茶葉中的應用研究關注度低,關鍵詞分布稀疏。在茶葉栽培領域主要是獲取茶葉生長的營養信息,在加工上主要有對制茶工藝中的茶葉如干燥葉進行品質鑒別。“tea quality”“tea leave”“discriminant analysis”以及“water content”為此階段兩個領域的突顯詞。
2016年之后,高光譜成像技術在茶葉領域的應用快速發展,特別是2019年前后,關鍵詞分布變得密集。栽培領域方向由植物營養信息獲取發展至病蟲害檢測、茶園分布識別等,而加工領域增加種類識別,并且品質鑒別內容拓展,新增儲藏年份判別和茶深加工產品品質判別。突顯圖譜顯示這一階段兩個領域的突顯詞有“monitoring photosynthetic pigment”和“fine tea powder”,對“fine tea powder”的研究持續至今。
英文文獻中高光譜成像技術在茶葉領域的研究方向主要為植物營養信息獲取、病蟲害檢測、茶園分布識別、種類識別、品質鑒別,茶葉加工領域整體關注度高于栽培領域。而兩個領域總和的頻次累計值和中心性累計值(76 次和2.07)雖然低于高光譜技術發展領域的累計值,但平均值要更高,分別為1.90次和0.052。
高光譜成像技術在茶葉領域的研究自2017年進入快速發展階段,發文量的翻倍增加表明該技術在國內外的關注度迅速提升,茶業信息技術化進程正加速推進。其中,中國學者的英文文獻發文量遠超其他國家,占比高達78%,我國學者作出巨大的貢獻。
但是從國家、國內外作者的合作網絡可以看出,國家以及科研工作者之間聯系強度較弱,特別是國內核心作者交集較少,而且國際性交流合作不足,因此未來國內外研究者之間的團隊合作強度有待增強,望能出現更多的引領者進一步拓展該領域的學術成果。
通過對關鍵詞分析總結,得到高光譜成像技術主要在茶葉栽培與加工領域逐漸擴大深入,茶葉加工受到學者的更多關注。加工領域的品質鑒別、種類識別和栽培領域的茶葉營養成分監測、病蟲害預測鑒定是當前熱點應用方向。
品質鑒別是高光譜成像技術最早研究的方向,包括等級評判、制茶工藝評價等內容。在等級評判中已應用的檢測手段如感官審評、近紅外光譜等均未能兼顧茶葉內外綜合信息,2008年開始學者利用高光譜成像技術的圖像信息,進行一系列圖像處理來研究綠茶等級評判,以達到同時檢測茶葉內外品質的目的,因而利用此技術綜合高效判別茶葉等級成為學者關注的熱點,之后研究對象從綠茶又發展至烏龍茶、紅茶。
數字農業中的精細化要求,使得生產者通過科技的融入將品質特征數字化,從而更精確把控各道加工工藝。在高光譜成像技術應用于制茶工藝的研究上,CNKI 文獻以探究紅茶的萎凋、發酵程度,以及拼配效果為主,通過生化成分含量或生產信息建立預測模型進行量化判別;WOS文獻除關注紅茶萎凋程度的判別研究外,還涉及茶葉品質檢測等方面。
傳統的茶葉種類識別多依靠一定經驗積累的人工判別,且同樣需要結合外部特征與內部品質信息,因此采用高光譜成像技術已建立針對不同茶類識別的預測模型,但在建模過程中存在提取特征信息困難等問題。隨著技術的不斷深入應用,研究者改進數據處理和建模方法,通過聯合低秩自動編碼器、高光譜遙感等技術提升準確率和效率。因此,該技術還被應用于茶葉特別是名優茶的真偽識別和地理起源保護,如碧螺春、鐵觀音真偽判別和龍井茶、廬山云霧茶產地鑒別等。
光合色素是茶樹光合作用中的重要功能物質,其包含的葉綠素能反映植物的生長態勢和營養狀況,并且影響茶葉外觀及品質形成;此外,有學者提出總葉綠素與類胡蘿卜素的比例可能是評估植物環境壓力的良好指標,因而國內外學者重點關注高光譜成像技術無損監測葉綠素、類胡蘿卜素含量,這對茶樹健康狀況、抗逆能力等方面的及時準確判斷具有指導意義。值得注意的是,日本的茶樹栽培通常經過遮光處理,即承受低光脅迫的環境壓力,所以日本采用高光譜成像技術監測色素含量變化以研究遮陰茶樹生長條件。
氮、磷、鉀是茶樹生長發育中必需的3 種養分,傳統方法檢測茶葉氮、磷、鉀的含量不僅耗時且會破壞茶葉,鑒于此,高光譜成像技術因能無損估算營養成分含量而得到運用。而且,如今茶農為追求茶葉品質常大量施肥,有研究將高光譜成像技術應用于茶樹氮肥水平判別,利于指導合理施肥。通過高光譜成像技術建立光合色素(葉綠素、類胡蘿卜素)和氮、磷、鉀等植物營養成分含量與茶樹生長態勢之間的檢測模型,可高效實時監測茶樹健康狀況,為優化施肥管理和提高茶葉品質提供了數據基礎。
茶樹遭受病蟲害初期,受害葉片的外觀特征并不顯著,隨著受害程度的加深,為害特征通過葉片顏色、形態等方面逐漸顯現,因此對茶葉病蟲害進行早期診斷十分重要。在使用科技采集信息之前,人工觀察鑒別存在不及時、易誤判等問題,而高光譜成像技術通過獲取影像和光譜信息,能實時、客觀地分析茶葉特征,預測識別災害類型及損害程度。目前,該技術在茶園常見的炭疽病、赤葉斑病、茶白星病、紅葉病以及小綠葉蟬等病蟲害識別中得到應用,有助于茶葉病蟲害的綜合防治。
品質鑒別是茶葉加工最核心的研究內容,中國六大茶類(綠茶、紅茶、白茶、黃茶、黑茶、青茶)具有不同品質特征,各茶類品質評判標準不盡相同,因而上述品質鑒別中各研究內容還有較大研究空間,如繼續利用高光譜成像技術進行更多的茶類及其等級評判,以及綠茶殺青、白茶萎凋、黃茶悶黃、黑茶渥堆等關鍵工藝評價。同時,技術的深入應用也受到市場的影響。市場上隨著人們對茶葉“越陳越香”的品質追求,出現白茶、普洱茶等茶葉儲藏年份造假以哄抬價格等亂象,使得利用高光譜成像技術快速無損判別茶葉儲藏年份的應用受到關注,陳書媛等發現建立標準正態變換預處理結合支持向量機模型對壽眉的儲藏年份判別效果最佳。因此,通過高光譜成像技術建立茶葉儲藏年份與茶葉品質的關系,幫助消費者快速、準確識別茶葉儲藏年份是今后研究的一個重要方向。
此外,研究人員還利用高光譜成像技術對抹茶進行質量評估、物化特性檢測的研究,但仍需在特征提取和建模手段中提高模型預測能力。隨著茶產品的開發利用,相關產品的品質鑒別會是未來高光譜成像技術新的研究內容。
對茶園進行精細化管理,可為茶葉品質提升提供良好基礎。先前有學者利用高光譜遙感基于茶樹冠層光譜檢測生長時期的茶葉質量,但是高光譜遙感技術在茶葉栽培領域的研究較少涉及整體茶園的生態及生產管理。現階段已有關注數字化對茶園生產模式創新的影響,將高光譜遙感技術運用于安吉白茶產量估算,使得數字化進一步在茶園管理深入應用。高光譜遙感技術多應用于生態系統的生物參量精確分析檢測,在茶園精準生產管理中仍有廣闊的實踐空間,如植被多樣性檢測、土壤生化參量反演、大氣污染物監測等茶園精細化管理是未來繼續努力的方向。