摘要:橡膠是一種重要的戰略物資,其種植受到土地資源、地理環境、橡膠機械化的影響,產量波動很大。本文對農墾橡膠產業種植、生產加工引入數據挖掘技術的必要性進行了初步探究,指出通過提取土壤圖像的特征,用支持向量機的算法可以發現橡膠種植、生產加工的規律,進而制定精準的橡膠產業相關策略,以提高橡膠產量、節約成本、提高利潤。
關鍵詞:橡膠種植;數據挖掘;特征提取;支持向量機
橡膠是一種重要的戰略物資,與石油、鋼鐵、煤炭并稱為四大工業原料。我國是全球最大的天然橡膠消費國和進口國,國內天然橡膠長期處于缺口狀態,需求的2/3依賴進口來滿足天然橡膠產業屬于資源約束型、勞動密集型產業,相對其他農作物來說,具有周期長、收益長等特點。農墾橡膠業的產生、發展與壯大實際上是中國橡膠業發展的一個縮影,一直是學術界研究的熱點。根據農墾橡膠產業種植、生產加工的歷史數據進行數據挖掘,發現其種植、生產加工的規律,進而制定精準的橡膠產業相關策略,以提高橡膠產量、節約成本、提高利潤的數字化研究,目前國內還比較少。
1 引入數據挖掘技術的必要性
天然橡膠以其獨具的高彈性、高強度、高伸長率、耐磨、耐撕裂、耐沖擊、耐酸堿、耐油、耐腐蝕、耐高低溫和絕緣性好、粘合性、密封性強等特點,始終處于不可替代的地位。我國天然橡膠需求量大,近幾年一直處于供不應求的狀態。造成這種局面的原因主要有以下兩點:一、國內輪胎工業迅猛發展;二、天然橡膠的種植條件苛刻。其種植條件苛刻主要體現在對種植地要求高,如對土地的含碳、含氮、濕度等要求都很嚴格;容易受到寒害、蟲害、臺風的襲擊。橡膠的供應不足阻礙了我國經濟(特別是輪胎行業)的發展。基于此背景下,本文通過數據挖掘技術對橡膠樹生長地的土壤進行評價研究,為尋找出最適合橡膠樹生長的土壤和尋找橡膠樹種植地提供依據,一方面可以降低種植橡膠的成本,另一方面可以讓新的橡膠農更容易掌握種植橡膠技巧,讓更多的人加入種植橡膠的隊伍中。
2 數字化流程圖
2.1 樣本采集
研究的橡膠林可以分為4種不同林齡膠林:幼林早期(0~2齡)、幼林晚期(2~7齡)、開割數(7~16齡)、老齡即將更新數(>16齡)。取土壤樣本的時間要在晴天上午,如果遇雨天,則等2個晴天后再進行取樣。每個林齡段中隨機設置n個樣地:每個樣地的面積a(m)×b(m),分0~15cm、15~30cm、30~45cm、45~60cm4個層次拍攝土壤樣品,每個層次拍攝m張。每張土壤樣品圖片的命名規則為“膠林_層次.jpg”。
2.2 特征提取
通過拍攝得到的土壤圖像,由于圖像的維度過大,不容易分析,需要從中提取土樣圖像的特征,提取反應圖像本質的一些關鍵指標,以達到自動進行圖像識別的目的。
圖像的特征主要包括顏色特征、紋理特征、形狀特征等。本文主要運用圖片的顏色特征和紋理特征建立圖片自動識別模型。
2.2.1 顏色特征
圖片的顏色特征用顏色矩表示。基于顏色矩提取圖像特征的數學基礎在于圖像中任何的顏色分布均可以用它的矩來表示。顏色的矩包含各個顏色通道的一階矩、二階矩和三階矩,對于一幅RGB顏色空間的圖像,具有R、G和B三個顏色通道,共有9個分量。
2.2.2 紋理特征
。因為紋理是由灰度分布在空間位置上反復交替變化而形成的,因而在圖像空間中相隔某距離的兩個像素間一定存在一定的灰度關系,稱為是圖像中灰度的空間相關特性。
其中L表示圖像的灰度級,i,j分別表示像素的灰度。d表示兩個像素間的空間位置關系。不同的d決定了兩個像素間的距離和方向。元素Pd(1,0)代表了圖像上位置關系為d的兩個像素灰度分別為1和0的情況出現的次數。
在建模中一般不直接用圖片的灰度共生矩陣建模,往往要從灰度共生矩陣中提取它的特征參數用戶建模。灰度共生矩陣的特征參數有二階距、對比度、相關、熵。
3 模型構建
特征提取完之后,用支持向量機算法對圖像進行圖片識別。根據識別出的結果就可以有針對性的對土壤做些有利于橡膠樹生長的干預工作,如:如果識別出土壤缺少氮元素,可以給土壤適當的施些氮肥;如果識別出土壤的水分較少,就要給土壤澆水,給農墾橡膠產業提供數學指導意義。
4 結論
本文分析了橡膠種植中引入數據挖掘技術的必要性,對橡膠種植數字化研究做了初步闡述。可以給橡膠業提供一定的參考意義。
參考文獻:
[1]黃冠,吳紅宇.廣東農墾天然橡膠種植現狀及“走出去”戰略實踐.中國熱帶農業,2015,3(4),1821.
[2]李煒.廣東農墾“走出去”做強做大橡膠產業.今日熱作,2013,19(1),5253.
[3] Rapepun Wititsuwannakul, Piyaporn Pasitkul, et.al. Hevea latex lectin binding protein in Cserum as an antilatex coagulating factor and its role in a proposed new model for latex coagulation, Phytochemistry 2008,69(1),656–662.
[4]勒碧.數據挖掘算法及其生產優化應用中的研究.浙江大學碩士學位論文,2006.
項目:廣東農工商職業技術學院校級課題“基于數據挖掘技術的橡膠產業的數字化研究”(xykt1601)
作者簡介:官金蘭(1982),女,博士,副教授,研究方向:偏微分方程及其應用,大數據與數學建模。