摘 要:機器學習是一門多領域交叉學科,讓機器模擬人類的學習行為。圖像處理是利用計算機對圖像數據進行變換、預處理、特征提取與識別的技術。將機器學習方法融入到“圖像處理”課程中,有利于實現“新工科”專業課程內容的更新。以機器學習方法為主線,將深度學習滲透到圖像處理課程教學內容中,并與林業圖像相結合,制定具體的教學實施方式,滿足“新工科”課程建設的需求。
關鍵詞:機器學習; 圖像處理; 新工科
中圖分類號:G642? ? ? ?文獻標識碼:A? ? ? ? ?文章編號:1006-3315(2021)11-217-002
“新工科”[1]是在第四次工業革命、工業4.0等重大戰略下,提出來的工科專業,具有實用性、綜合性、交叉性等特點,產生于傳統專業,又高于傳統專業。在專業建設目標、理念、方法、內容上,都要體現未來需求驅動,創新與交融、協調與卓越等思想。新工科專業主要以智能和互聯網為主軸,有人工智能、大數據、區塊鏈、5G等相關工科專業。利用智能對傳統專業進行存量更新,實現信息化、智能化。還有增加新興工科專業,提前布局培養引領未來技術和產業的人才。人工智能是新工科的核心技術之一,主要包括:問題表示與解決、自然語言、語音識別、視覺理解、機器學習與控制等。機器學習屬于人工智能的一部分。
機器學習就是給定一系列數據構建一個模型,然后用此模型對新數據進行預測和判別[2]。可簡化為:數據-模型-屬性。首先要找到大量的數據,構成數據集,并找出數據的概率分布規律,確定模型的形式和參數,此步驟稱之為訓練。訓練好的模型對新數據進行概率計算,得到屬性評價。圖像處理是對圖像數據進行計算的技術。圖像是數據最常見的一種形式,因此,機器學習的各種方法都可以應用到圖像處理中來[3-4]。
機器學習包括深度學習,兩者的本質區別在于特征提取環節,傳統的機器學習提取精確的特征集,此特征能夠區分不同類別,然后用分類器加以識別。深度學習是多參數、多層的神經網絡(或稱之為模型),利用多參數可以提取每一層的特征,沒有必要與具體物理意義對應的特征,更具有通用性、一般性、智能性。以“深度學習”為代表的新技術,是“新工科”課程建設的標志之一。本文將機器學習方法應用到圖像處理教學的整個過程中,實現教學內容更新,適應新時代需求。
一、機器學習、深度學習與圖像處理的關系
機器學習是人工智能研究的一個分支,人工智能研究包括專家系統、機器學習、進化計算、模糊邏輯、計算機視覺、自然語言處理、推薦系統等。而機器學習是一種實現人工智能的方法,傳統方法主要有K-均值、K-近鄰(KNN)、決策樹(Decision Tree)、EM(Expectation-Maximization)、自適應增強(Adaboost)、支持向量機(Support Vector Machines, SVM)、貝葉斯分類(Bayesian Classification)、聚類(Clustering)等方法。根據不同的分類方法有:監督學習(如分類問題)、無監督學習(聚類問題)、弱監督學習、半監督學習、集成學習、深度學習和強化學習等。深度學習是機器學習的一部分,本質上是一種深度結構的神經網絡,主要有卷積神經網絡(Convolutional Neural Networks, CNN)、深度置信網絡(Deep Belief Networks,DBN)等。主要模擬人的大腦中神經元的通信和計算方法。
人類獲取信息中80%以上為視覺信息,視覺有視頻和圖像,視頻本質上是由一張張圖片按時間軸疊加在一起而形成,因而視頻處理最終還是要歸結到圖像處理。機器人通過視覺傳感器獲取圖像,機器人要進行機器學習、理解、分析,并得出有用的結論和解決方案。深度學習是模仿人類大腦的一種機器學習方法,比傳統的機器學習方法學習效果更好,同時計算成本更大,對硬件設備要求高,是一種升級的新穎的機器學習方法。因此,機器學習及深度學習都是一種理論和知識,可用于各種數據,例如圖像、語音、文本、傳感器數據、網絡數據等各類數據,而圖像處理是一門技術和方法,主要包括:圖像采集、圖像變換、圖像增強和復原、圖像編碼、圖像分割、圖像特征及描述、圖像分類和識別等。圖像處理也可以為機器學習提供更多的數據進行訓練和測試,進而獲得更好的數學模型和神經網絡結構,使得機器更加智能化。可以將傳統的機器學習及較新的深度學習等理論應用到圖像處理的技術和教學中去,賦予傳統教學內容的“新工科”特性。
二、機器學習在圖像處理教學中的應用
機器學習分類方法有很多,主要有統計學習、強化學習、進化學習和群體智能等。統計學習主要以概率論為基礎,分為參數學習和非參數學習。強化學習,又稱再勵學習、評價學習或增強學習,交互過程中通過學習策略以達成回報最大化。進化學習和群體智能主要解決優化問題。圖像去噪是將噪聲和目標分開,并采用不同的閾值辦法,將噪聲去除,目標保留。因此可以利用有監督學習方法或聚類法實現目標和噪聲的分離。圖像分割是將感興趣的區域和背景區分開,本質上是像素的分類或聚類問題。可以將監督法、半監督、弱監督法用于圖像分割,比如SVM和KNN。圖像目標檢測、分類和識別都可以采用機器學習方法實現,即分類器,包含決策樹、邏輯回歸、樸素貝葉斯、神經網絡等算法。以“進化學習和群體智能”為例,說明其在圖像處理優化問題求解中的應用。進化計算最典型原始的算法包括遺傳算法、進化策略、進化規劃、遺傳編程等;群體智能包括蟻群算法、微粒群算法、蜂群算法、細菌覓食算法、細菌去藥性算法等。利用優化算法實現灰度變換系數的最優求解,實現圖像增強;優化算法與各種分割準則相結合,得到最佳的單閾值或多閾值,實現圖像分割;利用優化算法得到紋理特征描述,進而實現紋理分割、合成、分類等。對圖像配準、圖像特征提取和選擇、分類器、圖像融合中的參數進行優化,得到最優的圖像處理效果。
三、深度學習在圖像處理教學中的應用
深度學習是一種基于深度神經網絡的機器學習方法,比傳統的神經網絡的結構要深,參數量大,能刻畫數據內在的豐富信息,典型的有卷積神經網絡、深度信任網絡、堆棧自編碼網絡等[5-6]。深度學習可以用于各種類型的大數據,如文字、聲音、圖像等。用于圖像處理的主要有TensorFlow(Google公司開發,在圖像分類、音頻處理、推薦系統和自然語言處理有廣泛應用)和PyTorch(Facebook開發,配置靈活,簡潔高效)框架,應用于圖像分類、圖像目標檢測、圖像分割和圖像生成等。圖像分類有ResNet-18、ResNet-34、ResNet-50、ResNet-101、ResNet-152殘差神經網絡、InceptionNet-V1、InceptionNet-V2、InceptionNet-V3、InceptionNet-V4網絡。目標檢測有SSD模型,預測對應物體的選框和選框對應物體的種類信息,有SSD300與SSD500兩種。圖像分割包括語義分割、實例分割、全局分割。全卷積網絡(Fully convolutional network,FCN),使用最后一層特征進行卷積,然后上采樣得到和原來圖像一樣的形狀,通過和原始圖像的Mask進行比較來實現像素級物體分割;Unet網絡借鑒了FCN,并增加了殘差鏈接部分,不同層次的特征進行組合,實現上采樣和下采樣結合,圖像分割更加精確。生成圖像主要采用生成模型,給定一組隨機數,根據隨機數生成服從訓練數據分布的圖像。主要有變分自編碼器(VariationalAuto-Encoder, VAE)和生成對抗網絡(Generative Adversarial Networks, GAN)。VAE采用編碼器和解碼器,編碼器將訓練圖像轉換成隱含變量,解碼器將輸入的隱含變量轉換成圖像。GAN包括生成網絡和判別網絡,生成網絡將輸入隱含變量轉換成對應圖像,判別網絡判別測試圖像是否和生成圖像一致。深度學習的核心就是卷積神經網絡模塊,本質上是特征提取功能,不需要構造具體特征,通過自動學習,獲得模型參數,得到特征值。此外,數據集的構造和選擇是深度學習結果好壞的重要因素之一。常用的數據集分為:小型、中型、大型。小型的有MNIST(來自美國國家標準與技術研究所,由手寫數字的圖片和相應的標簽組成)和CIFAR(由Alex Krizhevsky、Vinod Nair和Geoffrey Hinton收集,CIFAR-10和CIFAR-100);中型的有Pascal VOC(為圖像識別和分類提供了一整套標準化的優秀的數據集);大型的有ImageNet(用于視覺對象識別軟件研究的大型可視化數據庫)和COCO(大型的、豐富的物體檢測,分割和字幕數據集)。Torchvision(有圖片分類、語義切分、目標識別、實例分割、關鍵點檢測、視頻分類等工具)提供了數據包裝類數據集進行載入。深度學習圖像處理流程為:構建和搜集圖像數據庫、選擇深度學習模型、模型訓練、模型驗證及圖像數據測試。利用深度學習可以提高圖像處理教學質量。
四、結語
以“人工智能和深度學習”為代表的第四次工業革命即將到來,論文將機器學習和深度學習融入到圖像處理課程教學當中,緊密結合圖像增強、圖像分割、圖像特征提取、圖像分類及生成等教學內容,突出教學內容的“創新”元素。初步構建了“新工科”課程教學體系,滿足新形勢下的教學內容更新需求。
基金項目:南京林業大學2021教學質量提升工程項目(2021-SXJS-006)
參考文獻:
[1]王峰,趙小剛,汪鼎文.新工科背景下案例化教學在《數字圖像處理》課程中的研究與實踐[J]漢江師范學院學報,2021,41(03):89-93
[2]萬琳,裴小兵,張倩,李軒涯.面向軟件工程專業的機器學習課程實踐教學探究[J]計算機教育,2021,{4}(04):155-158
[3]趙雪峰,施珺.面向本科生機器學習課程的教學探索[J]計算機教育,2021,{4}(02):170-174
[4]王永強,賈瑞麗,柳明,劉瀚,佟文超.科教結合的MatLab圖像處理課程教學模式探索[J]中國現代教育裝備,2021,{4}(05):111-113
[5]陳舒涵,胡學龍,姚志均,陳萬培.深度學習在“數字圖像處理”課程教學中的應用探討[J]工業和信息化教育,2019,{4}(02):84-88+94
[6]莫建文,張彤,袁華,歐陽寧.深度學習在圖像處理技術課程教學實踐中的應用探討[J]教育教學論壇,2016,{4}(09):115-116
作者簡介:程玉柱,1980年生,男,漢族,江蘇鹽城人,博士,講師,研究方向:林業圖像分割與識別研究。