王宇
(眉山職業(yè)技術(shù)學(xué)院,四川眉山620010)
基于大數(shù)據(jù)分析的茶葉質(zhì)量評估
王宇
(眉山職業(yè)技術(shù)學(xué)院,四川眉山620010)
茶葉是我國的特色產(chǎn)業(yè),已經(jīng)成為家家戶戶日常飲用和待客過程中不可或缺的重要物品。茶葉質(zhì)量既關(guān)系到人們飲茶的口感,也關(guān)系到我國的食品健康安全,更關(guān)系到茶葉生產(chǎn)商的品牌形象和信譽(yù)。近年來,隨著市場競爭的加劇,質(zhì)量已經(jīng)成為各大品牌商獲得市場空間的前提和保障。本文以大數(shù)據(jù)分析為平臺,對網(wǎng)絡(luò)背景下的茶葉種植狀況和生產(chǎn)情況進(jìn)行評估,從而對茶葉種植和生產(chǎn)流程進(jìn)行控制,并對我國茶葉種植和生產(chǎn)過程中的不足進(jìn)行彌補(bǔ),為人們提供優(yōu)質(zhì)茶源,為茶葉生產(chǎn)提供良好的物質(zhì)保障,提升我國茶葉的國際知名度和市場競爭力。
大數(shù)據(jù)分析;茶葉質(zhì)量評估;云計(jì)算;數(shù)據(jù)網(wǎng)絡(luò)
茶葉是我國的一大傳統(tǒng)型產(chǎn)業(yè),其既關(guān)系到茶加工企業(yè)的生存和發(fā)展,又關(guān)系到與茶相關(guān)的邊緣產(chǎn)品的開發(fā)和生產(chǎn)。茶葉的產(chǎn)量和質(zhì)量決定了我國茶葉市場的發(fā)展動(dòng)向。但是,氣候條件、環(huán)境條件和生態(tài)條件的不穩(wěn)定性,使我國茶葉在生產(chǎn)和開發(fā)過程中存在諸多問題。茶葉質(zhì)量是茶葉加工企業(yè)獲得市場空間的基礎(chǔ),也是人們享受到綠色茶源的基本前提。政府和相關(guān)部門要結(jié)合茶葉發(fā)展過程中的諸多訴求,對茶葉種植和生產(chǎn)過程進(jìn)行監(jiān)測,確保對其種植和生產(chǎn)過程中的每一個(gè)環(huán)節(jié)進(jìn)行有效的把控,進(jìn)而充分發(fā)揮我國茶產(chǎn)業(yè)的市場潛力。但是,依托于傳統(tǒng)的茶葉種植和生產(chǎn)方式對茶葉進(jìn)行人工現(xiàn)場采樣、評估和監(jiān)測等,會耗費(fèi)大量的人力和物力,并且受到外部因素制約,采樣效果比較差,進(jìn)而影響茶葉的整體質(zhì)量評估效率。計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)技術(shù)的快速發(fā)展為茶質(zhì)量評估提供了廣闊的空間,使茶葉質(zhì)量評估過程中得以對網(wǎng)絡(luò)技術(shù)和計(jì)算機(jī)基礎(chǔ)進(jìn)行充分應(yīng)用,進(jìn)而提升了其質(zhì)量評估的整體效益。相關(guān)人員可以借助網(wǎng)絡(luò)技術(shù)對天氣、溫度、濕度和病蟲害等不可控信息進(jìn)行收集和整理,進(jìn)而結(jié)合相關(guān)數(shù)據(jù)對其進(jìn)行分析和預(yù)測,實(shí)現(xiàn)大數(shù)據(jù)背景下,以茶葉種植和生產(chǎn)為基礎(chǔ)的茶葉質(zhì)量評估,提高我國的茶葉和茶產(chǎn)品供應(yīng)質(zhì)量。
茶葉是我國國民經(jīng)濟(jì)發(fā)展過程中的重要組成部分,具有豐富的歷史內(nèi)涵和文化內(nèi)涵。而茶葉質(zhì)量又是我國茶產(chǎn)業(yè)發(fā)展過程中的主要要素。茶葉質(zhì)量直接關(guān)系到人們的飲茶健康和安全。近年來,消費(fèi)觀念發(fā)生了轉(zhuǎn)變,人們對茶葉質(zhì)量提出了更高的要求,政府也不斷凈化茶葉市場環(huán)境,以確保茶產(chǎn)品質(zhì)量安全,最大程度維護(hù)消費(fèi)者的利益。茶葉質(zhì)量關(guān)系到茶企業(yè)的效益,也關(guān)系到國內(nèi)外消費(fèi)者對中國茶葉的整體認(rèn)可度。借助茶葉種植和茶葉生產(chǎn)開發(fā)對茶葉質(zhì)量進(jìn)行評估,能夠凈化茶葉市場環(huán)境,降低人們?nèi)粘o嫴柽^程中的安全隱患,推進(jìn)我國茶產(chǎn)業(yè)的快速發(fā)展。同時(shí),對茶葉質(zhì)量進(jìn)行評估,能夠從根本上推動(dòng)我國傳統(tǒng)茶葉種植技術(shù)的變革,使相關(guān)技術(shù)人員積極研發(fā)新型茶葉種植和開發(fā)技術(shù),減少茶葉種植過程中易溶于水的農(nóng)藥使用量,確保百姓真正喝到放心茶和安心茶。
2.1大數(shù)據(jù)分析與云計(jì)算
茶葉質(zhì)量評估過程中,大數(shù)據(jù)分析的應(yīng)用原理是借助非結(jié)構(gòu)化和無規(guī)律性的數(shù)據(jù)篩選,對有效的茶葉數(shù)據(jù)信息進(jìn)行提取,將其廣泛應(yīng)用到茶葉種植、生產(chǎn)和銷售等各個(gè)環(huán)節(jié),進(jìn)而提升我國茶葉產(chǎn)業(yè)的整體發(fā)展效益。大數(shù)據(jù)分析并不是對茶葉質(zhì)量評估過程中的相關(guān)數(shù)據(jù)進(jìn)行隨機(jī)抽取,而是對所有數(shù)據(jù)進(jìn)行全面分析。因此,在大數(shù)據(jù)背景下,對茶葉質(zhì)量進(jìn)行評估,可以不受采集過程中主觀采集方式和樣本等因素的影響,從根本上提升了數(shù)據(jù)分析結(jié)果的準(zhǔn)確性。近年來,隨著數(shù)據(jù)分析在茶葉質(zhì)量評估過程中的廣泛應(yīng)用,出現(xiàn)了越來越多的分析方式。例如,谷歌公司通過借助互聯(lián)網(wǎng)對網(wǎng)絡(luò)環(huán)境背景下的流感數(shù)據(jù)進(jìn)行分析,進(jìn)而應(yīng)用聚合方式對流感發(fā)展情況進(jìn)行預(yù)測,提升了數(shù)據(jù)分析的準(zhǔn)確性。同理,借助大數(shù)據(jù)分析技術(shù)對網(wǎng)絡(luò)上的茶葉信息進(jìn)行整合,并結(jié)合茶企業(yè)本身的發(fā)展特色,選擇合理的茶葉質(zhì)量分析方式,對茶葉質(zhì)量進(jìn)行評估和預(yù)測。
云計(jì)算是一種分布式平行計(jì)算方法,其能夠同時(shí)對多種數(shù)據(jù)信息進(jìn)行處理,并確保數(shù)據(jù)的處理效率和質(zhì)量。在茶葉質(zhì)量評估過程中,應(yīng)用云計(jì)算,能夠提升茶葉質(zhì)量分析速度和計(jì)算效率,降低茶葉質(zhì)量評估過程中的成本。云計(jì)算的開發(fā)平臺和應(yīng)用過程都比較簡單,并且具有容錯(cuò)性和節(jié)點(diǎn)擴(kuò)充方面的優(yōu)勢。
2.2平臺設(shè)計(jì)框架
在云計(jì)算背景下進(jìn)行大數(shù)據(jù)處理,能夠借助網(wǎng)絡(luò)對茶葉質(zhì)量評估中涉及到的相關(guān)要素進(jìn)行分析和處理,并實(shí)現(xiàn)數(shù)據(jù)的導(dǎo)入和導(dǎo)出。其主要特點(diǎn)表現(xiàn)在以下幾個(gè)方面。首先,其借助Hadoop進(jìn)行存儲,并將其作為存儲中心,通過多個(gè)數(shù)據(jù)源對相關(guān)數(shù)據(jù)進(jìn)行讀取。其次,借助流分析技術(shù)實(shí)現(xiàn)各種實(shí)時(shí)數(shù)據(jù)的分析和處理。第三,對經(jīng)過處理的數(shù)據(jù)進(jìn)行導(dǎo)出操作,并將相關(guān)數(shù)據(jù)庫作為其導(dǎo)出對象。第四,實(shí)現(xiàn)茶葉質(zhì)量評估過程中,不同數(shù)據(jù)類型的協(xié)同分析,進(jìn)而提供有用的茶葉質(zhì)量評估信息。
大數(shù)據(jù)平臺主要包括數(shù)據(jù)層、數(shù)據(jù)處理層和管理層。數(shù)據(jù)層主要是以流的形式,將茶葉質(zhì)量評估過程中涉及到的相關(guān)數(shù)據(jù)發(fā)送到數(shù)據(jù)處理層。數(shù)據(jù)處理層是在云計(jì)算平臺背景下,對數(shù)據(jù)層傳入的數(shù)據(jù)流進(jìn)行分析和處理。管理層主要是將茶葉質(zhì)量評估中的相關(guān)數(shù)據(jù)進(jìn)行管理,進(jìn)而將其處理結(jié)果傳送給終端客戶。以DAP為平臺,對不同茶葉質(zhì)量評估方法進(jìn)行考慮和應(yīng)用,進(jìn)而借助相關(guān)技術(shù)支持,對茶葉質(zhì)量評估相關(guān)執(zhí)行方案進(jìn)行確定,從而以大數(shù)據(jù)分析為依托,進(jìn)行茶葉質(zhì)量的評估和預(yù)測。
3.1數(shù)據(jù)層
數(shù)據(jù)層涵蓋的工作內(nèi)容和要素比較多。其主要在茶葉質(zhì)量評估中對茶葉種植和生產(chǎn)過程中涉及到的相關(guān)數(shù)據(jù)進(jìn)行采集和篩選,并借助互聯(lián)網(wǎng)平臺,對茶葉的相關(guān)過濾和提取數(shù)據(jù)執(zhí)行情況進(jìn)行監(jiān)控。應(yīng)用Hadoop分布式文件系統(tǒng)對處理過的茶葉數(shù)據(jù)信息進(jìn)行存儲。以云計(jì)算為背景,數(shù)據(jù)層能夠?qū)崿F(xiàn)網(wǎng)絡(luò)茶葉數(shù)據(jù)資源的快速采集、整理和更改,進(jìn)而提高茶葉質(zhì)量評估過程中的數(shù)據(jù)處理質(zhì)量和效率,并且操作過程也比較簡單。
在大數(shù)據(jù)背景下對相關(guān)茶葉信息采集和分析,一般會對茶葉種植過程中涉及到的環(huán)境和生態(tài)等相關(guān)要素進(jìn)行提取。茶葉種植過程中,影響茶葉質(zhì)量的因素包括自然環(huán)境、土壤、大氣環(huán)境、氣候和工藝流程等。部分茶葉產(chǎn)地含有重金屬,其會對茶葉造成污染,同時(shí),氣候變暖為病蟲害提供了生長空間,進(jìn)而影響茶葉的種植質(zhì)量和產(chǎn)量。在茶葉種植過程中,要嚴(yán)格遵循正確的種植流程和標(biāo)準(zhǔn),對茶葉種植過程中的不利因素進(jìn)行控制,最大程度避免氣候問題和病蟲害問題的影響,降低茶葉種植效益。利用計(jì)算機(jī)技術(shù)和網(wǎng)絡(luò)平臺,對茶葉種植過程中的相關(guān)影響要素進(jìn)行收集和分析,進(jìn)而借助數(shù)據(jù)分析平臺對相關(guān)數(shù)據(jù)進(jìn)行采集、過濾和存儲。再加上茶企業(yè)往年發(fā)展過程中的茶葉質(zhì)量評估經(jīng)驗(yàn),對茶葉種植和生產(chǎn)過程中的質(zhì)量進(jìn)行全面控制,從而凈化茶葉市場,為人們供應(yīng)優(yōu)質(zhì)茶葉和茶源,推進(jìn)我國茶文化傳播和茶產(chǎn)業(yè)的快速發(fā)展。
3.2數(shù)據(jù)處理層
數(shù)據(jù)處理層主要是對經(jīng)過數(shù)據(jù)層處理之后的相關(guān)茶葉數(shù)據(jù)進(jìn)行分析,進(jìn)而最大程度確保茶葉質(zhì)量評估的準(zhǔn)確性和合理性。筆者以關(guān)聯(lián)模型作為茶葉質(zhì)量評估過程中的核心技術(shù),進(jìn)行相關(guān)操作。
將不同時(shí)間和地點(diǎn)背景下的相關(guān)氣象生態(tài)信息數(shù)據(jù)向量用X進(jìn)行假設(shè)而茶葉質(zhì)量數(shù)據(jù)用向量Y進(jìn)行假設(shè)。其中,(X,Y)=X∪Y,任意向量M?(X,Y),其中Supp(M)=Count(M)為M支持度,在向量集合{(X,Y)}中,M的出現(xiàn)次數(shù)用Count(M)表示;針對任意向量,我們將Xi→Yi的關(guān)聯(lián)可信度定義為Conf(Xi→Yi)/Supp(Xi);將可信度閾值設(shè)為λ,將關(guān)聯(lián)規(guī)則集合定義為{Xk→Yk}={Xk,Yk},whereConf(Xk→Yk)≥λ。該模型的執(zhí)行流程為:
首先,借助數(shù)據(jù)層對各種數(shù)據(jù)向量集進(jìn)行過濾分析。
其次,將閾值設(shè)置為λ,計(jì)算規(guī)則集合為{Xk,Yk},其中{Xk}為條件集合。
第三,將當(dāng)前需要評估的條件數(shù)據(jù)設(shè)定為X,需要對X與集合{Xk}各個(gè)向量的Jaccard相似度進(jìn)行計(jì)算,并對Xm的條件向量進(jìn)行計(jì)算。
該計(jì)算模型是在MaoReduce和Hadoop框架云計(jì)算背景下,通過并行處理技術(shù)對茶葉種植和生產(chǎn)過程中的成本進(jìn)行降低,進(jìn)而確保在單個(gè)節(jié)點(diǎn)背景下對相關(guān)數(shù)據(jù)進(jìn)行處理。
3.3管理層
大數(shù)據(jù)分析背景下的茶葉質(zhì)量評估是通過SOA思想設(shè)計(jì)而成的。面向茶葉質(zhì)量評估過程中的需要對有關(guān)數(shù)據(jù)進(jìn)行增加和刪除。前臺頁面是借助HTML完成相關(guān)設(shè)計(jì)工作的,其能夠確保與移動(dòng)設(shè)備之間的互動(dòng)和訪問,通過借助大數(shù)據(jù)工作流思路對相關(guān)數(shù)據(jù)信息進(jìn)行挖掘。進(jìn)而縮短分析過程和數(shù)據(jù)結(jié)果導(dǎo)入時(shí)間,提升茶葉質(zhì)量評估效率。同時(shí),該模式背景下,也為移動(dòng)終端交互提供了相應(yīng)的支持,以確保對茶葉種植過程中的相關(guān)信息進(jìn)行快速而準(zhǔn)確的獲得,從而提升茶葉的整體種植和生產(chǎn)效益。
大數(shù)據(jù)平臺的應(yīng)用改變了我國傳統(tǒng)的粗放型茶葉種植和生產(chǎn)模式,很大程度上提高了茶葉種植效率和市場效益。其能夠通過對相關(guān)信息數(shù)據(jù)技術(shù)的應(yīng)用,提升茶葉種植過程中的可預(yù)測性。傳統(tǒng)茶葉監(jiān)測方式比較落后,其監(jiān)測過程中受到諸多因素的限制,很難確保整體監(jiān)測質(zhì)量和效率。大數(shù)據(jù)背景下的質(zhì)量監(jiān)測平臺是網(wǎng)絡(luò)時(shí)代背景下我國茶葉種植和茶產(chǎn)業(yè)發(fā)展過程中的必然。當(dāng)前,我國在茶葉質(zhì)量評估層面已經(jīng)取得了相應(yīng)的技術(shù)成就,相關(guān)科研機(jī)構(gòu)和部門要結(jié)合我國茶葉種植和發(fā)展?fàn)顩r,提升茶葉質(zhì)量評估過程中的技術(shù)性和先進(jìn)性,促進(jìn)我國茶產(chǎn)業(yè)的健康快速發(fā)展。
[1]何曉葉,李建科,趙偉,劉潤,張琳,孔祥虹.化學(xué)指紋圖譜技術(shù)在茶葉質(zhì)量控制中的應(yīng)用[J].食品科學(xué)技術(shù)學(xué)報(bào),2015(1):49-54.
[2]周峰,馮小萍.基于大數(shù)據(jù)分析的茶葉質(zhì)量評估[J].現(xiàn)代工業(yè)經(jīng)濟(jì)和信息化,2015(9):92-93+104.
[3]劉英,吳曙光,尹州,吳廣紅,曹麗芬.指紋圖譜技術(shù)在茶葉研究上的應(yīng)用[J].茶葉科學(xué),2013(1):13-20.
[4]劉新,張穎彬,潘蓉,王國慶,汪慶華,金壽珍,魯成銀.我國茶葉加工過程的質(zhì)量安全問題及對策[J].食品科學(xué)技術(shù)學(xué)報(bào),2014(2):16-19.
[5]孫慶磊,楊秀芳,王盈峰,鄒新武,張士康.基于數(shù)據(jù)統(tǒng)計(jì)分析的我國茶葉質(zhì)量安全狀況調(diào)查[J].中國茶葉加工,2012(2):4-8.
王宇(1982-),女,四川眉山人,研究生,講師,研究方向:計(jì)算機(jī)、課程與教學(xué)論、計(jì)算機(jī)輔助教學(xué)與管理。