董博華,韓 笑,宋毅洲,安寧寧,劉韻婷
(沈陽理工大學,遼寧 沈陽110168)
隨著時代的進步,人們已經習慣用手機解決生活中的大多數問題,而當人們遇到一種感興趣的植物時,一定想知道它的種類和特性等信息,如果能通過一款手機APP 立即獲得該植物的信息會相當方便。對于植物識別這類圖像分類任務,使用深度卷積神經網絡模型,即用深度學習算法來解決,與傳統機器學習算法相比具有不可比擬的優勢。目前人們做圖像分類很少自己改通用模型結構,基本都是根據具體的圖像分類問題選擇一個合適的模型,然后做數據增廣、計算訓練、調整參數,再將訓練好的模型去做模型壓縮,提高執行性能。
本項目采用卷積神經網絡算法對“植鑒”APP 使用者所提供的植物圖片進行識別。當人們外出游玩遇到感興趣的植物時,可以用來查找其資料,方便人們認知這個世界,了解到更多有趣的事物,讓人們意識到植物對世界的重要性,提高人們對植物和環境的保護意識。除此之外,它對于植物園分類學也可以起到極大的作用,傳統的植物分類學主要采用形態學方法對植物進行分類鑒定,但其存在著工作效率低、工作量大并且數據客觀性難以保證等缺點,會影響分類的客觀性和精確性。隨著20 世紀40 年代計算機的出現以及近年來人工智能技術的興起與發展,利用圖像識別技術來進行植物分類已是大勢所趨。并且“植鑒”APP 還給植物愛好者提供了交流分享的平臺,方便進行植物種植和養護的經驗交流。“植鑒”APP 適合園藝工作者、植物愛好者、大中小學生及學生家長,無論在街頭、公園或者郊外游覽,可以隨時認識植物,了解身邊的植物和花卉。
通過實時照相或調用相冊內的照片,調用訓練好的模型對植物照片進行識別,使用相應的算法,調用對應的數據庫,確定植物所屬類別,向使用者展示植物基本百科信息。
輸入已有的植物圖像,定義權重矩陣,通過卷積層從圖像中提取特征而無需損失其有關空間安排的信息,使用遷移學習重新訓練Inception-v3 模型,訓練得到好模型后再去做模型壓縮,提高執行性能。
如果用戶對查詢結果有異議或遇到很難通過照片識別的植物,可利用內置分享平臺咨詢互動。為植物愛好者提供一個交流的平臺,分享自己的養護及種植經驗等。
通過用戶投票評選出每日最佳植物識別的圖片,可供用戶查看每日投票數量最多的一些作品。當用戶進行植物識別時,也會為用戶生成植物美圖,可供用戶分享自己的作品。
通過用戶上傳自己喜歡的植物圖片來擴充植物圖庫數據,方便后期進行擴充植物種類和模型的訓練。
為用戶提供景點相關信息,方便用戶規劃旅游路線。
基于卷積神經網絡的植物圖像識別方法流程如圖1所示。

圖1 基于卷積神經網絡的植物圖像識別方法流程圖
本系統采用TensorFlow 框架進行開發。TensorFlow 是Google 的一個開源深度學習框架,其基本思路是使用有向圖來表示計算任務,并且所有操作都必須在會話中執行,靈活性很強,再使用GPU 提高模型訓練速度。深度學習是包含多級非線性變換的層級機器學習方法,而卷積神經網絡則是其中一種經典而廣泛應用的結構,它的權值共享網絡結構使之更類似于生物神經網絡,降低了網絡模型的復雜度,減少了權值的數量,圖像可以直接作為網絡的輸入,避免了傳統識別算法中復雜的特征提取和數據重建過程。使用卷積神經網絡進行更加深入的分析從而得到抽象度更高的特征,經過其中的池化層可以有效地減少整個神經網絡參數。經過處理之后提取到了圖像信息含量更高的特征,最后經過全連接層得到不同種類的概率分布情況,由此再得出最后的分類結果。Inception-v3 模型架構如圖2 所示。

圖2 Inception-v3 模型架構圖
本項目使用的Inception-v3 模型總共有46 層,將全連接層之前的網絡結構訓練作為圖像特征提取的過程,再將提取的特征傳入全連接層之后的網絡結構進行遷移學習。這樣不僅可以加快整個模型訓練的速度,也可以在遷移學習過程中設計更適合該問題的網絡結構,再經過反復迭代訓練,從而加強模型的識別準確度。
通過使用手機以日常人們對植物觀賞的距離和多個角度進行拍攝,對各種植物圖像至少拍攝150 張照片,為后期保證訓練模型以及測試模型提供充足的數據,對拍攝后的照片還采用了多種擴充方法進行處理,包括順時針旋轉逆時針旋轉、水平鏡像翻轉、垂直鏡像翻轉隨機剪載等,然后將處理好的圖片再隨機分為訓練集與測試集,訓練過程只在訓練模型時使用,在訓練結束后,用測試集來估計模型準確度。
本項目采用指數衰減法優化學習率,通過這個函數可以先使用一個較大的學習率快速得到一個比較優的解,然后隨著迭代逐步減小學習率,使得模型在訓練后更加穩定,最終確定了0.003 的學習率,20 萬次的選代次數。在設置初始學習率每一次反向傳播時,觀察對參數優化的調整幅度,根據特定任務確定合適的學習率,若幅度過大則有可能錯過最優的學習率,反而產生更差的結果。若幅度過小則可能導致每次進步很小,從而加大迭代次數和耗時過長。
最后將訓練好的神經網絡模型,利用測試集圖片進行檢驗,最終得到平均91%的準確性。將訓練好模型進行封裝,可實際應用到移動APP,最終實現實時在線識別植物品種的APP——“植鑒”。