基于VGG-16的電商評論圖像審核

2022-02-24 06:27:54李蘭潘浩

電子測試 2022年2期

李蘭，潘浩

（青島理工大學信控學院，山東青島，266000）

0 引言

如今，隨著互聯網的高速發展，以京東，淘寶等為主的電商平臺迅速崛起，網上購物免去了很多交通和時間成本，給人們的生活工作帶來了極大的方便。但是隨著電商平臺的商品種類和數量的不斷擴大，商品質量也變得參差不齊，因此消費者對于商品質量的售后評價成為了衡量商品質量和平臺綜合服務的重要標準，而評價對于后續購買該商品的消費者來說具有極大的參考價值，不僅可以保障消費者的權益也有利于督促商家不斷提高商品質量。

上傳商品點評圖像是商品點評的重要環節，真實的商品圖像往往比商品描述文字，語言更有說服力，更能協助消費者觀察商品整體情況從而判斷商品是否適合自己，然而點評信息并不都是有效的，部分用戶為了圖簡單，隨意填寫，隨便上傳圖片，甚至惡意上傳大量無效圖像，這類無效點評不僅影響用戶的使用體驗也使得平臺公信力下降，因此電商平臺會通過人工在后臺對點評信息進行審核，篩選并剔除大量的無效評論圖像和內容。

隨著大數據和人工智能的發展，利用神經網絡對圖像進行識別分類已經在各個領域得到了很好的應用，張建華等學者[1]利用VGG卷積神經網絡實現對棉花病害圖像對識別，從而通過機器對棉花病害做出診斷；徐昭洪等人[2]通過神經網絡對預編碼對建筑圖像進行了語義分割；王菽裕等學者[3]通過VGG16框架實現了對名人面孔圖像的識別。陳英義[4]以及田佳鷺等[5]學者團隊，分別基于VGG-16通過遷移學習實現了對與魚類和猴子圖像等分類識別，并取得了較高的準確率。本文在前人研究的基礎上，基于傳統的VGG-16網絡建立起圖像識別模型，并優化了梯度下降算法，解決了模型過擬合問題，該模型可以根據已有電商平臺用戶上傳的點評圖像快速準確判斷圖像對應類型，完成圖像分類，預測，審核，提高了平臺審核效率。

1 模型算法

1.1 VGG-16卷積神經網絡

如今大數據的不斷發展使得深度學習在數據處理方面得到廣泛應用，Hinton提出的深度置信區間以及硬件設備GPU性能的不斷優化大幅提高了神經網絡的訓練速度。在圖像識別應用中，卷積神經網絡（Convolution Neural Network，CNN）可以在短時間內訓練大量圖像數據。隨著卷積神經網絡的發展，一些學者科研團體或者企業組織開始構造較為通用的普適性模型，VGG[6]模型便是其中之一，由Simonyan等人提出并研發，其命名來源于牛津大學視覺幾何組（Visual Geometry Group）的縮寫。本文采用在圖像分類任務中表現較為出色的VGG-16卷積神經網絡模型進行研究。

作為卷積神經網絡中分類性能優良的網絡模型，VGG-16提出卷積塊的概念，使模型的感受野更廣闊，并且減少網絡參數；VGG-16通過多次使用ReLU激活函數，實現更多的線性變換，從而提高學習能力。VGG-16網絡模型一共由包括13個卷積層、5個最大池化層、3個全連接層和1個輸出層(Softmax)等22個層級結構組成。

VGG-16網絡通過將3×3卷積核和2×2最大池化層排列組合，以提取出輸入圖像中大量細節特征。通過堆疊組合3×3卷積核不但實現了與其他類型卷積核相同的效果，而且使模型具備更好的非線性特征。

1.2 模型優化

在進行圖像分類任務時，影響分類效果和系統性能的主要指標包括識別精度和仿真速度，這兩點分別影響著模型的識別準確率和效率，為了進一步提高識別效果，我們對傳統VGG-16網絡進行優化。優化模型的方法有很多，包括梯度下降、拓展數據集、降低過擬合以及遷移學習等等，其中梯度下降優化算法在卷積神經網絡中的應用較為廣泛。本文采用了隨機梯度下降的優化算法[7]，它可以在每次更新權重的同時更新每個樣本的梯度；在實際公司業務中，數據的大量冗余在所難免，相對于其他梯度下降算法，該算法可以在數據冗余時，更加有效地利用數據信息。每當更新參數時，算法僅使用一個樣本x及其所對應的標簽進行梯度運算，公式如式(1)：

網絡模型訓練完成后，需要評估其識別性能和損失值[8]。本模型中的損失值通過運用對數損失函數計算，其運算公式如式(2)：

1.3 防止過擬合

模型對訓練集與驗證集的識別準確率差距較大的現象叫做過擬合，出現過擬合的模型泛化性能不強，極大影響識別效果。通過降低過擬合方法主要包括Dropout方法、數據集擴增方法以及遷移學習方法。

Dropout方法[9]通過隨機地丟棄訓練所得的信息，從而減少模型過擬合。該方法應用于激活層之后，每次反向傳播時按一定比例對激活層的隱藏節點隨機采樣，使得全連接網絡稀疏化，從而減輕了不同特征的協同效應；由于隱含節點都是以一定概率隨機出現，因此兩個神經元不會每次同時出現，減少了神經元之間的共適應關系，提高了魯棒性。

卷積神經網絡對于同一圖像數據不同情況下的形態，都可以進行穩健的分類，因此利用基本變換可以有效擴充數據集。即通過裁剪、旋轉、錯切等圖像變換手段處理原始圖片樣本集，不僅獲得了更多的訓練樣本圖片，還提高了模型的抗干擾能力，解決了模型因數據不足導致的表達能力差、過度擬合等問題。

遷移學習[11]是將已經過完整訓練的通過模型應用到新的任務中，大幅降低了模型的研發成本。由于本文所需數據集的采集難度較高，現有數據量難以支撐訓練任務，利用遷移學習可以有效解決這一問題。利用VGG-16在ImageNet數據集上的預訓練模型進行相關知識的遷移，優化各卷積層和池化層的參數，降低過擬合的同時節省了訓練成本。

2 評論圖像分類模型研究

2.1 訓練圖像數據分析

由于審核需要篩除對用戶沒有參考意義的評論圖像，因此通過對電商平臺點評數據的分析以及人工審核規則，將得到的圖像分類，如表1所示。

表1 點評圖像數據集

本次實驗使用數據源均來源于京東、天貓、網易嚴選、蘇寧易購等電商平臺用戶上傳的商品評論數據，并經過人工標記，各評論數據示例圖如圖3.1，不同電商點評圖像的特征如表2所示。

圖1 點評圖像分類示例圖

表2 電商6種評論圖像特征

2.2 模型處理流程

本文模型訓練和測試均在Tensorflow環境下進行，模型搭建采用開源框架實現，硬件設備:處理器為AMD 2600X，GPU為NVIDIA GTX2080TI。模型對圖像處理流程如下:

Step1：數據預處理。由于電商數據可采樣的樣本數量有限，因此首先通過平移、縮放、旋轉、錯切等圖形變換手段對用戶在評論中上傳的圖像進行處理，生成更多不同的訓練樣本，而后調整數據圖像尺寸大小統一，并將數據集合注入網絡進行訓練。通過預處理在擴充了訓練數據量的同時，也強化了模型的泛化能力。

Step2：輸入評論圖像圖樣。從Step1生成的點評圖像庫中抽取圖片，輸入模型進行訓練。

Step3：將VGG-16卷積神經網絡應用于電商用戶上傳評論圖像審核，構建如圖3.2所示的電商評論圖像分類模型：輸入224像素×224像素×3向量的RGB圖像，首先經過兩個卷積核大小為3×3的卷積層，卷積核數量均為64，滑動步長為1，經過兩次卷積和ReLU運算后，尺寸變為224×224×64；再經過一層池化單元尺寸為2×2，步長為2的最大池化層，該池化層使目標圖像尺寸減半，變為112×112×64，接著經過與之前相同的兩個卷積層和最大池化層，目標圖像尺寸變為56×56×128；隨后經過3層卷積核大小均為3×3，數量均為256，步長為1的卷積層，以及池化單元尺寸大小為2×2，步長為2的最大池化層，圖像輸出為28×28×256，最終經過三層卷積和一層最大池化重復三次處理后，圖像最終尺寸輸出為7×7×512；隨后經過兩個包含4096個隱藏節點的全連接層及ReLU，最后一層輸出層包含6個節點，對應本次電商圖像常見的6種分類結果，進行Softmax分類。

圖2 電商評論圖像分類模型

本文提出的電商評論圖像分類模型在卷積層均采用3×3尺寸的卷積核，并由2或3個卷積核連續排列，可以獲得更大的感受野；卷積核滑動步長為1，并利用padding邊界填充使卷積層前后圖像維數不變；模型中的池化層選用2×2尺寸的池化窗口，步長為2，用于降低卷積后的特征圖尺寸，實現少量參數對特征的表示；全連接層是連續3個全連接結構的堆疊組合，通道數分別是4096、4096、6個；網絡末尾是由具有6個標簽的Softmax分類器作為輸出；在已有網絡基礎上采用隨機梯度下降算法更新模型參數；模型在激活函數之前應用歸一化方法，在全連接層執行Dropout方法，系數分別為0.7、0.5，通過Xavier方法初始化全連接層參數，根據對測試集數據的識別準確率和整體性能對模型進行評價。

2.3 模型訓練和結果分析

在對模型進行訓練時，我們加載ImageNet上的VGG-16預訓練模型，通過遷移學習方式優化評論圖像識別模型參數，主要優化13個卷積層和池化層的參數。設定動量參數、學習速率和迭代次數，通過損失函數的迭代，優化網絡各層參數。在訓練過程中，經過對測試數據的迭代測試，我們發現當迭代頻次較低時，網絡對訓練數據的學習不夠充分，在測試集的識別準確率也不理想，隨著訓練的迭代進行，圖像在測試集的識別準確率持續上升，并最終穩定在較高水平。

因此，本文構建的網絡模型，通過遷移學習的支持，不僅保持了較高的識別精度同時收斂性能相對較強。本問提出模型在擴增過的訓練集上訓練量級達到450輪時，在測試集上的識別精度達到了90%以上，取得了優良的識別性能。為比較本文研究模型與其他識別方法和模型的性能差異，本次研究將BP神經網絡[12]、支持向量機[13]等2種淺層網絡，以及AlexNET[14]、傳統VGG-16NET[15]等2種深層神經網絡作為對照模型，與本文模型進行對照分析，結果如表3所示。

表3 電商點評圖像分類結果

通過實驗，由表3.3對比可知，Alex、傳統VGG-16與本文優化VGG-16等3種深層神經網絡模型均大幅優于BP神經網絡、支持向量機等2種淺層網絡。由于VGG-16網絡的特征提取是通過3×3卷積核的堆疊組合，提取出電商評論圖像區域內更多較細節的特征，因此，基于VGG-16的網絡模型分類準確率優于Alex模型，同時，本研究模型綜合采用了隨機梯度下降算法和一系列降低過擬合的方法，從測試結果看對于各個類型圖像的識別準確率以及平均準確率均略高于傳統VGG-16NET。由此可知，本文提出的模型識別電商點評圖像的準確率更高，對不同類型點評圖像的分類效果更好。

3 結論

本文基于VGG-16卷積神經網絡模型的基礎上，構建了一個電商點評圖像分類模型，通過使用隨機梯度下降算法更新網絡權重，并利用數據集擴增、Dropout方法、遷移學習等方法優化模型，針對當前研究課題和業務，有效提高了訓練效率和識別準確率，并降低了過擬合，實驗結果表明本模型達到了很高的識別精度和模型性能，實現了預期目標。

電商平臺點評圖像自動分類審核的實現，不僅為企業節省了大量人力成本，運營成本和培訓成本，還提高了電商圖像的審核效率，可以更快的為網站用戶提供更有效更真實的購物評論信息。為互聯網電商平臺的后臺運營的方式方法提供了新的思路，在更廣闊的方向上，為機器取代人類的重復性勞動，提供了可能，對于智能機器人領域的發展也有深遠意義。

點評圖像自動審核是基于圖像識別和特征提取的方式，下一步我們可以考慮引入圖像和自然語言的情感語義分析，進一步通過深度學習強化機器對于商品點評內容信息的理解，嘗試結合文字和圖像兩個維度識別點評信息積極和消極因素，此外還可以在VGG-16模型基礎上引進注意力機制，通過強化重要信息關注點，提高識別效果，最大化實現完全取代人工的自動審核功能。