孫明思 李瑞婷 趙瑩 吉林農業科技學院 電氣與信息工程學院
中藥是從中國傳統醫藥理論指導采集、炮制、制劑,說明作用機理,指導臨床應用的藥物。中藥是中華醫學的中藥組成部分,包括動物源中藥、植物源中藥、礦物源中藥以及部分化學生物制品類藥物。古語有“諸藥以草為本”,中藥品類多以植物類中藥居多。因此本文研究對象為植物藥的識別與鑒定技術。
圖像處理技術是利用計算機相關技術對圖像信息進行加工、處理的技術,包括圖像數字化、圖像增強和復原、圖像信息數據化編碼、圖像分割及識別等。圖像處理技術應用過程中,有兩個方向:一是模擬圖像,如遙感圖像、相機獲取的圖像等圖像信息;二是數字圖像的處理。本文所研究的內容屬于模擬圖像范疇。本文研究如何利用現有圖像處理技術實現復雜的中藥鑒定過程。
目前,圖像識別算法主要有兩種:一種是傳統識別算法;二是基于深度學習的圖像識別算法。
傳統識別算法通常情況下由三個步驟組成,分別是圖像預處理、圖像特征提取以及圖像分類識別。圖像預處理通常包括圖像去噪以及圖像增強兩種。大部分圖像去噪會采用濾波算子、小波去噪、稀疏編碼去噪、直方圖均衡化等方法,目的在于去除圖像中對分類識別產生影響的圖像噪聲。圖像增強則可以突出目標信息,進而提高后續識別的準確性和識別效率。特征提取的目的是要提取出有用的、有利于分類識別的圖像特征,是圖像檢測以及圖像識別的核心內容。圖像特征的提取需要從眾多特征中明確出有效的信息特征,例如顏色、紋理、梯度、形狀等等。常用且效果較好的特征有SIFT 特征、LBP特征、HOG特征等。圖像特征分類識別多采用分類器完成。常用分類器有決策樹、樸素貝葉斯分類器、羅杰斯特回歸、KNN分類器和支持向量機等等,其中,以支持向量機和Sofimax分類器應用最為廣泛。
深度學習是近十幾年來人工智能研究領域所取得的重要突破,已將其應用于計算機視覺、語音識別、圖像與視頻分析等諸多領域,并取得了巨大的成功。深度學習在計算機視覺領域中的應用是本文研究的內容。深度學習與傳統識別算法最大的不同在于圖像特征的獲取是通過在大量數據中自動學習而得,其特征提取效率遠高于傳統識別算法,同時特征的表示可以包含成千上萬的參數。基于深度學習的圖像識別中特征表示和分類器是聯合優化的,充分發揮二者聯合協作的性能。深度學習的核心在于神經網絡的層次結構,各個層次同構聯合學習、整體優化,性能將大幅度提升。深度學習在網絡結構、層的設計和訓練方法各方面的理論、算法和應用成為本文后續研究工作的主要內容。
圖像處理技術的應用過程中,圖像來源及圖像數字化、預處理等方面是重要環節,某種程度上決定了技術在相應領域應用的成敗。基于圖像處理技術的中藥鑒定算法研究同樣存在此問題。在算法研究過程中,存在如下關鍵技術問題:
(1)數據集的獲取
目前,現存最早的本草專著是漢代的神農本草經,收錄了365種中藥,在明朝、清代建國時期,中藥種類達到5767種,其中植物藥有4773種。對于4773種中藥品的圖像獲取存在一定難度。除了日常使用中常見的500種外,其他中藥則需專業人士參與指導以完善數據集的數量,并達到深度學習識別算法所需的數據規模。
(2)圖像樣本標簽設置
中藥圖像同樣存在圖像樣本相近或相似的問題。采用深度學習圖像給處理技術,需對同一藥品不同圖像、不同藥品相似圖像做出標注,以備訓練深度學習的識別模型所使用。然而,目前常用的圖像標注方法和標注工具并不能夠有效完成中藥圖像的自動標注。在后續的研究過程中,將考慮應用細粒度圖像處理技術,結合領域專業知識對圖像進行預處理。
(3)圖像特征理解與表達
圖像的特征理解與特征表達一方面將決定圖像處理結果的有效性,另一方面會影響算法的效率及性能。特征表達需結合圖像數據集的規模,明確圖像屬性,以較為精簡的數據類型描述體現圖像樣本的特征。中藥圖像具有不同品類相同或相近圖像屬性的特點。因此,在特征理解與表達時應考慮到識別精度和機器性能等因素。
圖像處理技術已廣泛應用于人們生活、工作的各個領域,如人臉識別應用于乘車進站、小區門禁、單位考勤等實際領域。將此項技術研究應用于中藥鑒定、中草藥鑒定相關領域將會對中醫藥事業的發展產生較大的促進與推動作用。本文已詳細分析圖像處理技術在中藥鑒定過程中的可用算法及關鍵技術,為后續項目研究工作奠定了理論基礎。