陳 雨 ,陳 桂 雄 ,周 雄 圖 ,2,張 永 愛 ,2,林 志 賢 ,2,吳 朝 興 ,2,郭 太 良 ,2
(1.福州大學 物理與信息工程學院,福建 福州350116;2.中國福建光電信息科學與技術創新實驗室,福建 福州350116)
市場中假冒產品的存在會對國家、社會和個人帶來巨大經濟損失,防偽成為應用廣泛的反制技術。 由于整個防偽市場不規范,防偽技術產品水平偏低,妨礙了市場的健康發展,公眾對防偽產品的信任度在降低。 目前,許多被開發的防偽標簽具有物理上不可克隆的特征,如散射表面的隨機圖案、隨機分布的納米顆粒圖案和液晶紋理等。褶皺圖案是自然界生物體和工程材料領域常見的特殊現象,是一種微觀的隨機地形,擁有著廣泛而不可復制的信息,在防偽技術上有廣泛的應用前景。
通常,在聚合物襯底受熱膨脹的狀態下,在其表面上沉積一層與之熱膨脹系數差異較大的薄膜,在冷卻過程中,表面上的薄膜受到基底壓縮應力作用。 當壓縮應力超過表面金屬薄膜的承受范圍,會導致薄膜失穩產生復雜隨機的褶皺圖案[1],如PDMS/Au 褶皺圖案結構[2]。 這種隨機褶皺結構具有穩定、不可克隆的防偽標簽特性,引起人們廣泛研究興趣。當前國內外常用的褶皺類紋理識別方法有局部二值分類器[3]、多光譜精細紋理提取和識別[4]、K 均值聚類算法[5]、灰度共生矩陣[6]等。這些方法通常需要對防偽標簽先進行特征提取,基于熱膨脹系數失配形成的隨機褶皺圖案特征不夠明顯,往往不利于防偽標簽的識別。角度、光線、清晰度等條件會影響部分細節特征提取,降低褶皺圖像的正確識別率。同時,現有方法往往存在著檢測時間長、識別率低等缺陷,不能滿足現實生活中防偽識別的需求。
如今,深度學習已在圖像識別、語音識別和自然語言處理等領域獲得了廣泛的應用。 其中,卷積神經網絡(Convolutional Neural Network,CNN)已成功應用于像素級的語義分割技術中。 在卷積神經網絡的基礎上,LONG J 等人提出了使用卷積層代替全連接層的全卷積神經網絡(Fully Convolution Network,FCN)[7]。 2015 年RONNEBERGER O 等 人 為 解 決 小數量級樣本的分割,提出了編解碼結構的U-Net網絡[8]。 隨后,CHEN L C[9]等人提出將空洞卷積代替普通卷積的思想,創建了DeepLab 模型,使用ASPP(Atrous Spatial Pyramid Pooling)模塊解決多尺度信息,分別提出了v2[10]、v3[11]、v3+[12]三個版本,不斷優化模型和改進訓練策略,將語義分割精度提高到新的高度。 本文將DeepLabv3 語義分割模型應用于褶皺防偽標簽圖案的特征提取, 并對DeepLabv3 模型進行改寫, 使優化后的DeepLabv3 網絡能夠很好地適用于褶皺紋理防偽圖案分類識別。
如圖1 所示,利用人眼可初步在宏觀尺度上辨別標簽圖案的真假;采用搭配放大鏡的手機對雙重防偽標識“笑臉”點陣中的特定點的褶皺圖案進行圖像獲取,采用深度學習圖像識別方法,對比商品上的防偽標識褶皺特征信息與數據庫中真實褶皺特征信息,實現高級防偽功能。
隨機褶皺紋理圖案呈個性化條形卷曲迷宮狀,細節信息豐富具有不可重復性,但由于不同類別圖案均由同一機理制備,會增加識別難度。 K 均值聚類算法對選取初始聚類中心的敏感性較高,會直接影響結果的準確性和穩定性。 灰度共生矩陣法提取紋理圖像特征可以獲得理想的識別結果,但是計算工作量大。 對比多種方法后本文選擇DeepLabv3 語義分割網絡提取出細膩的圖像特征,結合后端的全連接層進行圖像分類,匹配已有的防偽褶皺紋理圖案實現高級防偽識別。
卷積神經網絡是一種基于感受野概念的針對二維圖像的多層神經認知器。 網絡結構包括數據輸入層、卷積層、池化層和全連接層,其中卷積層和池化層是卷積神經網絡的核心功能層,用來自動提取目標特征信息。 邏輯回歸分類器進而處理特征圖的結構,使用全連接層將提取到的圖像特征綜合以獲得最終的圖像分類。 采用卷積神經網絡算法對褶皺紋理圖像進行分類,避免了復雜的數據重建,有效減少了自由參數的數量,分類精度得到了顯著提高的同時,還避免了過擬合現象。
理論上神經網絡的深度與性能之間成正比,然而實際中會造成梯度爆炸和梯度消失的問題。權重參數更新困難, 導致準確率飽和甚至下降。深度殘差網絡(Residual Neural Network,ResNet)最早由HE K 等人提出[13],利用殘差學習原理實現網絡的加深以對抗梯度退化問題,將基本的網絡單元增加了一個恒等的快捷連接(shortcut connections),把原始輸入信息引到輸出層,通過直接學習上層網絡輸出的殘差,有效地簡化了學習難度和目標。

圖1 雙重防偽標識識別方法示意圖
Deeplabv3 是以ResNet 為骨干構建的語義分割網絡。 在使用FCN 實現圖像分割后,引入了空洞卷積以獲得多尺度的特征信息,通過金字塔結構挖掘更多語義特征信息以提升分類效果。
空洞卷積(Atrous convolution)是指通過設置膨脹率(rate)來對原圖進行采樣,如圖2 所示。 當rate=1時,它的作用與標準卷積無異,即全部像素采樣。當rate >1 時,它將通過膨脹率對卷積核進行擴張,在原圖上每隔(rate-1)個像素點進行采樣,用零來填充空白,擴大了感受野的范圍,在不增加參數量和計算量的條件下提取到更大范圍的語義特征。

圖2 空洞卷積
空洞空間卷積池化金字塔(Atrous Spatial Pyramid Pooling,ASPP)是指采用不同膨脹率的空洞卷積并行來學習多尺度特征,可以對任意尺度的區域進行更為準確的分類。
DeepLabv3 以ResNet 為網絡基礎。ResNet 網絡共有四個殘差塊,將第四個殘差塊復制三次后以級聯的方式連接在在殘差單元后,殘差塊4 ~7 采用不同膨脹率的空洞卷積,當輸出步長為16 時,殘差塊4~7 的膨脹率分別為2、4、8、16 來進行采樣,保證在卷積過程中圖像大小保持不變。 同時,采用一個并行的ASPP 結構處理前面輸出的特征圖,在feature map 的頂部采用4 個不同膨脹率(6、12、18、24)的空洞卷積核,通過全局平均池化層來捕獲上下文信息,再將ASPP 結構分支處理好的特征使用1×1 的卷積實現融合。
DeepLabv3 網絡模型中采用了編碼器-解碼器模塊(Enconder-Decoder),其中解碼器模塊使用了16倍的雙線性上采樣, 恢復圖像特征的細節和空間維度,以得到分割結果。 本文基于褶皺紋理圖案的防偽分類目的,將用于分割的此解碼器模塊更換為全連接層結構,softmax 為輸出層,將每一個神經元都與輸出相連,實現對輸入圖像的分類。 本文所用網絡結構如圖3 所示。
實驗方法采用兩種熱膨脹系數不同的材料,在冷卻過程中產生壓縮應力形成隨機褶皺防偽標識圖案。 首先,將PDMS 原液與固化劑以10:1 的比例混合攪拌均勻, 放置于負壓環境30 min 消除氣泡。取干凈的玻璃基板,利用酒精、丙酮和去離子水分別超聲清洗15 min,通過絲網印刷將PDMS 印刷于玻璃基片上形成宏觀防偽標簽圖案。
采用原子層沉積技術,在PDMS 襯底表面上生長一層Al2O3無機膜層。 制備Al2O3的前驅體是三甲基鋁(Trimethylaluminum,TMA)和水(H2O),反應過程中高純氮氣(N2,99.999%)作為載氣,沉積溫度為90 ℃。 單個氧化鋁制備循環過程包括:TMA 脈沖0.2 s、N2吹掃6 s、H2O 脈沖0.15 s、N2吹掃10 s。

圖3 網絡結構圖
圖4所示為實驗制備的具有不同亮度的隨機褶皺防偽標識圖案。 隨機選擇六個防偽褶皺紋理圖案來建立防偽“真”圖類數據集,在手動采集過程中通過對同一張相同褶皺紋理圖案隨機移動和改變光照強度,獲得每個圖案的120 張圖像,共720 張“真”圖類圖像。同時用相同方法隨機采集了各不相同的200 張褶皺紋理圖案作為“偽”圖類數據集。 為了降低訓練過程中因數據樣本過少導致的欠擬合問題,并增強模型的泛化能力和分類精度,本文采用了旋轉、翻轉的數據增強方法豐富數據集,最終由720 張“真”圖類原始數據集擴充至2 800 張,200張“偽”圖類原始數據集擴充至800 張。 擴增后共獲得3 600 張圖像作為數據集。

圖4 具有不同亮度褶皺圖案示例
數據集中3 600 張圖像80%作為訓練集,20%作為驗證集。 實驗于Linux(Ubuntu18.04)系統上進行,CPU 型號為i7-9700,GPU 為型號GTX1080,基于Pytorch 深度學習框架實現,數據集圖像為1 318 像素×1 132 像素大小的防偽褶皺紋理圖案。 為了保證網絡學習效率,防止過擬合,本文網絡采用帶動量隨機梯度下降方法進行訓練實驗,動量因子為0.9,學習率初始值為0.001,batch_size 為16, 權重衰減為0.000 2。
為了實現對褶皺紋理圖案的防偽分類識別,本文將DeepLabv3 語義分割結構的解碼器部分更替為全連接層結構,最后使用softmax 激活函數作為分類訓練。 為了提高網絡的識別準確率和實時性,且減少冗余現象,簡化模型復雜度,實驗將全連接層數量分別設置為一層、二層、三層,神經節點數為1 024,結果如圖5、圖6 所示。

圖5 全連接層數對準確率的影響

圖6 全連接層數對損失值的影響
由圖5、圖6 可知,當全連接層為三層時,識別準確率最高;全連接層數減少為兩層時,識別準確率略有降低,但并沒有明顯變化;當全連接層數繼續減少至一層時,識別準確率明顯下降。 這可能是因為兩層或兩層以上的全連接層能夠有效地解決非線性問題。 從穩定性分析,三層全連接層的變化幅度最為明顯,當全連接層數為一層時,識別性能多展現出小幅度攀升趨勢,從網絡整體的變化趨勢觀察與比較可知,二層全連接層表現出的穩定性最為突出。 說明由于全連接層產生大量的參數,容易產生過擬合問題,但全連接層起到的是將學到的“分布式特征表示”映射到樣本標記空間的作用[14],層數過少時導致模型性能下降。 所以本文網絡選擇二層全連接層。
為了進一步提高網絡識別準確率,減少網絡參數,構建輕量級網絡模型,通過調整全連接層神經節點數來確定網絡模型最優值。 不同神經節點數對網絡模型性能影響如表1 所示。

表1 神經節點數對模型訓練效果的影響
由表1 可知,神經元節點數過多時可能會造成過擬合現象,空間語義信息丟失,減少全連接層神經元節點數可以精簡網絡模型結構,在降低計算消耗的提前下提高分類準確率和運算速度。 當全連接層神經節點數由4 096 減少至512 時, 訓練識別準確率提高了0.92%;神經節點數為128 時,比4 096個神經節點的訓練耗時節省了0.77 h。 盡管全連接層權重值個數占比較大,但由于網絡訓練的時間開銷主要來自于卷積運算,因此減少全連接層神經節點數對網絡運算速度的提高是有限的。 神經節點數繼續減少至64 時, 訓練耗時不減反增,16 個神經節點時所需的訓練時間比128 個神經節點訓練所獲得的最短耗時4.69 h 增加了0.45 h。 綜合對比網絡識別準確率、穩定性和訓練耗時,本文最終采用二層全連接層,將神經節點數確定在256。
為了驗證本文所提出的隨機褶皺防偽圖案識別分類模型的有效性,本文與三種經典方法進行了對比試驗,分類效果精度對比如表2 所示。 在其他的經典方法中,ResNet 獲得較高的識別準確率91.77% ,VGGNet 和 AlexNet 分 別 獲 得 85.23% 和83.96%的識別準確率,本文的分類識別模型效果是有效的。

表2 與經典方法的對比
綜上所述,本文提出一種利用PDMS 聚合物上AL2O3薄膜形成規則有序的褶皺圖案來制備宏觀及微觀雙重防偽標識,并構建相應網絡的特征提取和識別模塊證明其可行性。 本文所提供的PDMS/AL2O3 防偽褶皺圖案制備方法具有多重防偽、難以偽造、工藝簡單和成本低等優勢,通過對DeepLabv3網絡改進優化,使本實驗網絡的更好地權衡了運行時間和識別準確率,訓練耗時明顯縮短,獲得了96.58%的訓練準確率。 試驗證明,相較于其他傳統的經典方法,本文方法取得了更高的識別準確率,具有一定的實際應用價值。