張寶金,劉偉新,任海龍,荊洪迪,崔宇,吳東,張振江
(1.鞍鋼礦業有限公司眼前山分公司,遼寧 鞍山市 114000;2.中國科學院沈陽自動化研究所,遼寧 沈陽 110016)
在鐵礦石的開采加工過程中,及時了解鐵礦石的品位至關重要。通過鐵礦石品位能夠大致判斷鐵礦石的利潤,采用人工智能識別鐵礦石品位可以及時發現廢石增多的情況,從而減少廢石的產生,降低處理成本。
近年來,人工智能得到了飛速的發展,基于深度學習卷積神經網絡的圖像識別技術更是衍生了一系列快速且精確的算法,在工程中得到了廣泛的應用。徐述騰等[1]實現了利用電鏡對礦石礦物進行智能識別;郭艷軍等[2]采用ResNet18 深度卷積神經網絡對礦物進行識別與分類;劉飛躍等[3]利用深度學習對礦山的巖體質量進行了精細化評價;張野等[4]利用深度學習對巖石的巖性進行了自動識別與分類。
礦石品位的識別是相同背景下的圖像淺層信息提取與識別,因此,利用人工智能模型來判斷礦石的品位可以達到很高的準確率。通常對于淺層信息來說,提高分辨率是快速提升模型正確率的方法,但提升輸入圖片的分辨率對于模型的速度與大小有著指數級的關系。故針對生產現場需要模型既具有一定精度又有便攜性且識別速度需要達到標準,因此,本文選擇MobileNet-SSD 算法對鐵礦石品位進行判斷。
MobileNet-SSD 算法的第一個識別判斷模塊為利用改進的MobileNet 搭建的SSD 算法,其中MobileNet 模型是谷歌開發的一種輕量級的神經網絡模型,主要用于各種嵌入式設備搭載利用,其使用的核心是深度可分離卷積塊。而SSD 算法是結合了Fast-RCNN、YOLO 兩大主流算法的優點,其檢測速度為Fast-RCNN 的6 倍,map值比YOLO高11%。
MobileNet-SSD 算法是利用改進的MobileNet 網絡替換SSD 中的VGG16 網絡,在其他結構不變的情況下可以提升模型的運行速度,減少模型的大小。結合定位的礦石位置,使用掩碼信息提取礦石中心圖像,并利用KNN 模型進行二次預測,結合兩次的預測結果進行加權處理,輸出最終的結果。
MobileNet 是一種專注于嵌入式設備的輕量的卷積神經網絡,相比于傳統的卷積神經網絡,采用深度可分離卷積(Depthwise Separable Convilution)在小幅度降低模型準確率的情況下可大大減少模型的參數與運算量。
MobileNet 中深度可分離卷積結構分為以下兩部分。
(1)逐通道卷積。常規卷積為3 個卷積核負責1 個同共通道,而逐通道卷積(簡稱DW 卷積)的1 個卷積核負責1 個通道,DW 卷積在二維平面內進行,卷積核的數量與上一層通道數以及Featuremap 個數相同[6],在減少參數的情況下保證網絡的深度以及對信息的提取。
(2)逐點卷積。逐點卷積(PW 卷積)的運算與常規卷積運算非常相似,其卷積核的尺寸為1×1×M,M為上一層的通道數。所以這里的卷積運算會將上一步的map在深度方向上進行加權組合,生成新的特征圖。有幾個卷積核就有幾個特征圖輸出[6]。
(3)算量計算。模型的計算量簡稱算量,是衡量算法運行速度以及訓練速度的一個關鍵指標。實例中輸入的圖片為3(M)通道輸入,4 通道,最終輸出4(N)個特征圖,圖片的長寬為DF,卷積核大小為(3×3)DK×DK,具體如圖1 所示。

圖1 算量對比
通過理論計算,深度可分離卷積在深度加深的情況下計算量大約為普通卷積計算量的1/8~1/9,嵌入式設備算力較低,VGG16 在大多數設備運行不良而MobileNet-SSD 則能流暢運行,且所占內存空間也更少。
實驗室數據集為從某地下鐵礦實地采集,數據集包含1334 張圖片共5 個類別,分別為磁鐵礦貧/富、赤鐵礦貧/富以及圍巖,經過圖像翻轉變換、平移變化、噪聲擾動、縮放旋轉等數據增強操作,將原有的數據集擴充成5 565 張圖片,部分數據如圖2所示。

圖2 部分數據圖展示
本實驗平臺配置:系統為win10-64;CPU 為i 711700;GPU 為雙路1060-6G;模型的搭建及訓練均在python3.7 以及tensorflow2.2 下進行編譯及訓練;使用tensorflow 進行分布式訓練并利用N 卡CUDA 進行加速訓練過程。
目標檢測算法模型的精度由 mAP(mean Average Precision)來進行評定,其中AP為PR曲線下的面積值;P為精確度(Precision),R為召回率(Recall)所組成的面積及為AP值。

式中,TTP是其IOU 值大于閾值檢測框的數量(閾值設置為0.5);FFP為IOU 值小于閾值檢測框的數量;FFN為沒有檢測到的真實框的數量;RRecall表示分類器認為是正類且原本確實是正類的部分占所有原本屬于正類的比例;PPrecision表示分類器認為是正類并且原本確實是正類的部分占所有分類器認為是正類的比例。
訓練采用遷移學習的訓練思想,設計訓練過程為50 Epoch,前25 Epoch 執行凍結前20 層權重進行訓練,25~50 Epoch 訓練正常;利用 Early Stopping(早停法)對迭代進行控制,在3 次訓練損失值下降少于0.1 或不下降時終止訓練,最終迭代在47 Epoch 提前終止,損失值收斂到6.25,在進行多次訓練的模型中效果較好,如圖3 所示。

圖3 損失值曲線
利用數據集中的測試集對模型進行測試,測試結果如圖4 所示,MobileNet-SSD 模型對不同品位的礦石和圍巖可以進行很好的分類識別,單張圖片識別的準確率能達到97%,而視頻的識別結果正確率稍低,為91%,說明本文模型具有良好的魯棒性和泛化性。

圖4 部分實驗結果
(1)MobileNet-SSD 模型可以很好地識別礦石品位及圍巖,并可以在大多數嵌入式設備上進行搭載識別,速度和準確率均可達到要求。
(2)MobileNet-SSD 算法在加大分辨率時需要的算力更少,便于后期嵌入式設備性能突破時更改模型的結構,增加正確率。
(3)增加模型樣本數量、將圖片進行統一處理均能提升一定的準確率,但會消耗一定的算力。
綜上所述,MobileNet-SSD 算法是一種適用于低算力嵌入式的算法,對礦石品位以及圍巖具有良好的魯棒性和泛化性,可充分利用算力資源。