999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于分塊離散余弦變換感知哈希算法與ResNet模型的供電安全圖像管理

2022-01-10 09:11:16曹增新朱龍輝
西安工程大學學報 2021年6期
關鍵詞:分類模型

曹增新,蔣 程,朱龍輝

(1.國網北京房山供電公司,北京 102401;2.西安理工大學 電氣工程學院,陜西 西安 710054)

0 引 言

電能是人類日常生活中必不可少的一部分[1-2],隨著電力系統的不斷更新完善,越來越多的設備加入其中,供電安全管控圖像的處理也被提上日程[3-4]。圖像分析常常被用來作為輔助管理的手段,在電力安全管控系統中也是如此,人們將各種設備以圖像的形式記錄下來,對其進行去重、分類等處理以便于進行后續的管理過程[5-6]。對于供電安全管控圖像地處理,使用人工智能的方法進行圖像整理,不僅可以大大降低人工操作的出錯率,還可以節省人力資源。

在圖像去重方面,許多學者進行了不斷的探索,傳統的圖像去重方法多數屬于文件級別,即將圖像視為一個二進制文件,然后再利用傳統哈希算法來實現去重,如塊級數據去重算法[7-8],該方法圖像會因壓縮變換導致文件大小發生改變,此時文件級別的去重方法將無法正確對圖像進行分辨,對感知相似的圖像無法判別。為了追求更高的去重效率,文獻[9]采取了圖像均值PHA簡稱AVG-PHA,通過將圖像轉換為灰度圖并壓縮大小在像素域得到圖像的哈希值,再借助漢明距離計算來判斷2幅圖像之間的哈希序列距離。這種方法較為簡單,主要基于圖像原本的各個像素信息,可以減少計算費用開銷,但圖像均值PHA無法對經過 JPEG壓縮,對比度發生變化后的圖像信息進行準確的判定。文獻[10]首先提出了基于DCT的PHA,簡稱DCT-PHA,利用提取頻域中特定系數產生的圖像哈希作為信號去重判斷,此后有學者對其方法進行了優化,并提出改進版高準確度感知哈希算法[11],該算法對相似圖更加敏感,準確度更高。上面所列舉的方法雖然能夠實現圖像分析分類,但是在穩健性、錯判率及去重率等方面性能仍然不高。

在圖像分類方面,深度學習模型常被用于圖像的分類[12-14]。自動編碼器就是一種由編碼器和解碼器組成的特殊的神經網絡結構。其中,編碼器將數據輸入到隱藏層,通過隱藏層進行表達,而解碼器可以通過隱藏層恢復輸入的原始數據。這種獨特的結構使得它在數據降維以及特征提取等方面都取得了不錯的成就。CNN主要包括卷積層和池化層,可以很好保持圖像的空間信息[15-17],但是網絡的性能在前期會隨著網絡層數的增多繼續提高,但當遇到一個閾值時,網絡的性能會隨著層數的增多逐漸降低,這是因為CNN模型出現了梯度消失的現象[18]。

針對上述圖像處理方面存在的問題,本文將深度學習算法應用于圖像處理技術中,通過深度學習算法實現供電安全管控圖像的去重與分類,完成電力安全管控系統下智能管理子系統的設計。對于供電安全管控圖像去重模塊,采用本文提出的BDCT-PHA進行去重管理,該算法穩健性好,去重準確率高,且誤判率小。對于供電安全管控圖像分類模塊,本文提出基于ResNet模型的CNN圖像分類方法,該方法可以防止出現梯度消失現象,同時減少了計算量,提高了準確率。

1 BDCT-PHA的圖像去重

哈希函數[19]可處理不同長度的原始數據,將其變為統一長度的消息摘要,通常用于數據加密以及數據壓縮,但由于其存在脆弱性與數據壓縮性的特點,逐漸被PHA[20]所取代。PHA是圖像數據集到感知摘要集之間的一種單向映射,滿足區分性、感知魯棒性和單向性的特點。與傳統哈希算法相比,PHA所生成的哈希序列值較短,因此它的數據所占用的容量不會很高;PHA很難通過輸出的哈希值去追溯到輸入,因此輸入信息可以得到很好地保護;PHA序列的生成過程不容易被模仿,無法通過對輸入圖像進行修改來得到與另一幅不同圖像相似的哈希序列值。PHA的生成過程通常被分為感知特征的提取和量化編碼2個部分,其中感知特征的提取是整個步驟的靈魂。

1.1 BDCT-PHA的優勢

從算法的穩健性、去重率、錯判率3個方面,對BDCT-PHA和AVG-PHA、DCT-PHA進行比較,來說明BDCT-PHA的優勢。

1) 算法的穩健性。漢明距離是判定PHA序列相似度的標準,漢明距離越大也就意味著2個序列越遠相距。因此在將閾值設定為同一個值的情況下,2幅相似圖像之間的漢明距離越大,識別的準確率越低,穩健性越弱。對失真圖像的已有研究表明,BDCT-PHA較另外2種算法相比,在多數情況下,漢明距離的平均值較小,穩健性更好。

2) 算法的去重率。據已有研究顯示,漢明距離的閾值取為1或5時,PHA對相似圖像的正確識別率較高。在閾值為1時,BDCT-PHA去重的正確率能達到99%,高于DCT-PHA與AVG-PHA;在閾值為5時,BDCT-PHA去重的正確率將達到95%以上,而AVG-PHA與DCT-PHA去重的正確率則在90%以下。

3) 算法的錯判率。PHA會嚴格區分不同源的圖像,不同源的圖像被識別為相似圖像的情況被記為錯判。已有研究表明,在有限大量數據的情況下,BDCT-PHA的錯判率幾乎為0,相較于其他2種算法有明顯的優越性。

1.2 圖像去重

BDCT-PHA會首先對圖像進行預處理,對其做分塊DCT變換并提取特征向量,得到感知哈希序列值,再使用漢明距離來描述2幅圖像之間的距離,并設定閾值來對圖像相似與否進行判別,具體操作如下:

步驟1:圖像的預處理。首先,使用RGB轉灰度公式Hgray(i,j)=0.299R(i,j)+0.587G(i,j)+0.114B(i,j)對彩色的圖像在(i,j)處進行灰度化處理,以降低圖像亮度對于分析的影響。最后,圖像的大小將會影響生成的感知哈希序列長度,因此需要提前對圖像的大小進行統一。本文采用雙線性插值的方式對圖像進行處理,分辨率統一設定為64×64。

步驟2:提取圖像的特征向量。首先,對經過預處理的圖像進行處理,將每個圖像分為64個8×8的塊,然后對其進行分塊DCT變換,得到每個分塊的DCT矩陣;其次,分別取每個塊的DC分量,按照AC1和AC5分量將相同位置的分量連接起來,連接方式為從上到下,從左到右,連接完成后組成3個一維向量Am,長度為64;再次,對得到的3組向量分別用式(1)進行二值化處理,即

(1)

最后,將3個Fm向量依次連接,生成一維特征向量F,其長度為192,且表示了圖像經過處理后的感知哈希序列值。

(2)

本文研究并判斷2個字符串之間的相似性是通過它們的漢明距離。判斷標準為:漢明距離越小,2個字符串差異性越小。對類似的字符串進行識別時,設置一個閾值T與所得漢明距離進行比較,當D(x,y)≤T時,兩者被識別為相似的字符串,否則識別為不同的的字符串。對應感知哈希序列則是當D(x,y)≤T時,2個感知哈希序列代表的圖像相似;當D(x,y)>T時,2個感知哈希序列所代表的圖像不同。

2 ResNet模型

在達到CNN性能閾值前,不斷增加CNN模型的深度會使模型的性能更好,但是當達到閾值后,不斷增加CNN模型的深度,會出現梯度消失現象,而基于殘差網絡結構的ResNet模型可以防止梯度消失現象[21-22]。ResNet模型把殘差網絡引入到深度CNN之中,實現了“短路”機制,可以較好地解決“網絡加深而準確率下降”的問題。

ResNet模型采用VGG的結構并在其基礎上進行了修改,在增加ResNet模型非線性激活函數數量的同時減少了ResNet模型參數,這使得ResNet模型的計算量變得更小,即不是采用大卷積核的方法,而是用多個非常小的卷積核。ResNet可以使用2種殘差單元,分別對應深層網絡和淺層網絡,兩者均可在輸入與輸出維度一致時,直接將輸入加到輸出上。

2.1 超參數設置

在訓練ResNet模型時,批量訓練的大小、學習速率的大小、分類數目與權值衰減率的選擇等都需要進行超參數的設置[23]。

1)批量訓練大小的選擇決定了ResNet模型下降的方向。當數據量較小的時候,為了對噪聲數據產生魯棒性,即減少噪聲數據的干擾,批量訓練值就應該較大。當數據量足夠龐大時,為了減少計算量,應該適當減小批量訓練的大小。ResNet模型在收斂精度和訓練時間上存在一個最優取值,因為批量訓練值按照經驗存在一個全局最優值。

2)學習速率的大小與權值更新的幅度緊密相關,所以應該把學習率設置在一個適宜的范圍。如果學習率設置過大,ResNet模型會在誤差較小的一端來回擺動,形成一種已達到最優的錯覺,因為其權值已經超過最優值,無法收斂到最優值。若學習率設置的過小,優化ResNet模型就需要大量時間,需要反復迭代,一步步靠近最優值,最不理想的情況下可能會導致ResNet模型無法收斂。

2.2 數據輸入

樣本數據的輸入主要包括選擇特征集、選取樣本以及生成TFRecords樣本數據集3個部分。

1) 選擇特征集,選擇的主要是待分類的圖像。為使特征集的維度更大,模型收到的信息更全面,可以通過提取不同維度的特征來構成特征集。但是過高的圖像數據特征維度,又會對ResNet模型產生不良的影響,特征維度也存在一個最優值。

2) 選取樣本,選取樣本點并提取樣本點的M維特征,每個樣本的特征是一個大小為M×N的矩陣。樣本的數據量在現實運用中是遠遠滿足不了ResNet模型的需求的,因此需要使用隨機擦除與變換對比度的方式對原圖像數據進行增強。

3)生成TFRecords樣本數據集。按照比例將數據集拆分為訓練集和測試集,并將其全部轉換成二進制文件,再根據文件夾名稱添加樣本標簽,轉換得到的TFRecords文件作為ResNet模型數據輸入。

2.3 ResNet模型卷積層

投影快捷方式用于在殘差網絡特征維度改變之前添加不同特征尺寸的特性。原始殘差網絡使用步幅為2的1×1卷積來改變通道的變化,如圖1(a)所示。但1×1卷積會丟失大量的信息,所以如圖1(b)所示,本文使用步幅為2的3×3最大池化層跟隨步幅為1的1×1卷積層來代替原始的投影快捷方式。

(a) 原始投影快捷方式 (b) 改進投影快捷方式

改進的投影快捷方式的好處是在投影時將考慮來自特征映射的所有信息,并在下一步選擇具有最高激活度的元素,以減少信息丟失。在通道流程方面,改進的投影快捷方式可以被視為軟下采樣和硬下采樣的組合,這補充了2種方法的優勢。硬采樣有助于進行分類,而軟采樣有助于不丟失所有空間背景。同時這種改進不會增加模型的復雜度和模型參數量。

當前,大量研究結果表明方差為1的正態分布的白化操作可以使模型的收斂速度變得更快,即通過把輸入數據拉伸為值為0的均值,將輸入數據規范化和歸一化。ResNet模型的每個輸出層的輸出結果都是下一場輸入層的輸入數據,因此,ResNet模型的白化操作,即為了克服模型訓練時由于參數變化對模型梯度下降所產生的不良影響,需要對數據輸出層增加規范化層,對每個節點的輸入數據做歸一化拉伸。批量歸一化的主要目的是加快模型的收斂速度,避免梯度消失現象的出現,其計算公式可表示為

(3)

因為圖像數據的特征具有稀疏性,即存在明顯的線性可分性,所以為了模型能自動引入稀疏性且通過線性分段緩解梯度消失現象,在本模型中使用稀疏性激活函數ReLU。

2.4 ResNet模型訓練

在對ResNet模型進行訓練時,設計的目標函數可表示為

(4)

設計的損失函數為樣本的真實類型與預測結果的交叉熵,可表示為

(5)

對于每批次樣本,損失函數可表示為

(6)

對ResNet模型訓練時,卷積層會進行特征提取工作,并把相應的參數值記錄下來。在統計樣本的分類值之前,會先將模型最底層提取的稀疏特征輸入到Logist層。

3 仿真實驗

本文的仿真實驗的流程為載入數據集→完成數據集去重→將去重后的數據集輸入待訓練模型→完成模型訓練→輸出結果。其中,原始圖像數據集為從現場收集到的關于開關柜、控制屏柜、刀閘等10類供電安全相關設備的圖片集共300張。將數據集進行去重后,仍有254張圖片。從中選取120張圖片作為訓練集,50張圖片作為測試集。

3.1 圖像去重驗證

當漢明距離的閾值選取為1與5時,去重率較高,但在圖像失真的情況下,閾值為5時的穩健性較好,故本文將漢明距離的閾值設定為5。

1) 選取要參與去重實驗的文件。本文選擇供電安全管控圖像的文件夾來進行示范實驗,32張圖像的編碼依次從00001到00032。

2) 存在1組相似圖像的去重實驗。對編號為00001到00022的22張供電安全管控圖像進行去重操作,結果如圖2(a)所示,可以顯示出較為相似的一組圖像的全部編號,對應編號圖像如圖3(a)所示。

3) 不存在相似圖像的去重實驗。對編號為00003到00021的19張供電安全管控圖像進行去重操作,結果如圖2(b)所示,不存在相似圖像提示。

4) 存在2組相似圖像的去重實驗。對編號為00001與00032的32張供電安全管控圖像進行去重操作,結果如圖2(c)所示,顯示出了2組相似圖像的全部編號,并清晰地表明了與其相似的對象,對應編號圖像如圖3(b)所示。

(a) 存在1組相似圖像的去重結果

(a) 第1組相似圖像的相似圖像

3.2 圖像分類重驗證

本文對供電安全管控圖像進行如下處理,以實現圖像的分類功能檢驗。

1) 打標簽。使用labelImg工具為每張圖像上的電力設備打上對應的標簽,例如switchgear、monitor等。

2) 數據增強。通過水平翻轉、旋轉等方式將訓練集數據增強至1 200張。

3) 轉換格式。將數據集轉化為VOC數據集的格式以便對其進行后續的訓練。

4) 對數據集進行訓練。本文通過損失函數來對圖像分類的正確性進行表示。使用之前準備好的數據集進行訓練,對過程中的各部分損失實現可視化,如圖4所示。

圖 4 損失函數計算結果

從圖4可以看出,損失在不斷變小,最終收斂于一個較為穩定的范圍內,即收斂于4.785%~4.894%,由此可以得出本次訓練結果良好。

5) 進行對比實驗。通過與densenet169[24]、vgg16[25]、mobilenetv2[26]以及原始Resnet進行準確率對比實驗,實驗結果如表1所示。

表 1 實驗結果

從表1可以看出,在識別分類不同電氣設備時,數據集去重操作在本實驗中可有效降低模型的損失率和提升模型的準確率。

4 結 語

本文在PHA的基礎上提出了一種BDCT-PHA,并采用改進的Resnet模型,最后實現電力安全管控圖像的去重和分類。仿真實驗表明:所提方法在有效地完成圖片去重的同時可以列出被去重圖片的編號,避免了重復或者過相似圖片對系統管理影響;利用損失函數和分類準確率來對結果進行可視化描述,損失值不斷降低并最終趨于一個相對穩定的區間,證明模型可有效被訓練;分類準確率的對比結果證明所提方法具有良好的分類效果。

猜你喜歡
分類模型
一半模型
分類算一算
垃圾分類的困惑你有嗎
大眾健康(2021年6期)2021-06-08 19:30:06
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
分類討論求坐標
數據分析中的分類討論
教你一招:數的分類
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
主站蜘蛛池模板: 狠狠v日韩v欧美v| a欧美在线| 久久亚洲高清国产| 亚洲国产成人精品无码区性色| 亚洲国产精品国自产拍A| 99精品视频在线观看免费播放 | 热这里只有精品国产热门精品| 国产精品三级av及在线观看| 欧美日韩在线第一页| 国产精品免费露脸视频| 成年人免费国产视频| 日本午夜三级| 国产三级国产精品国产普男人 | 另类重口100页在线播放| 国产91视频免费| 免费看a毛片| 欧美午夜在线观看| 国产电话自拍伊人| 久久久精品国产亚洲AV日韩| 中文字幕va| 日韩无码黄色| 精品久久高清| 青青草国产免费国产| 久久不卡国产精品无码| aa级毛片毛片免费观看久| 国产精品午夜电影| 亚洲欧美日韩中文字幕在线一区| 熟女视频91| 性色生活片在线观看| 无码'专区第一页| 国产正在播放| 亚洲精品波多野结衣| 国产正在播放| 国产超碰在线观看| 另类专区亚洲| 精品国产香蕉在线播出| 又大又硬又爽免费视频| 亚洲高清日韩heyzo| 亚洲精品在线观看91| 亚洲国产看片基地久久1024 | 国产尹人香蕉综合在线电影| 国产精品自在在线午夜区app| 国产精品成人观看视频国产 | 亚洲人成在线精品| 久久亚洲高清国产| 欧美精品1区| 在线亚洲天堂| av在线人妻熟妇| 国产成人精品午夜视频'| 亚洲视频影院| 国产激情在线视频| 欧美全免费aaaaaa特黄在线| 亚洲综合精品香蕉久久网| 亚洲精品无码AV电影在线播放| 国产三级毛片| 日本一区二区三区精品AⅤ| 成人毛片免费观看| 午夜欧美在线| 日韩午夜福利在线观看| 国产成人一二三| 97se亚洲| 免费视频在线2021入口| 58av国产精品| 国内自拍久第一页| 国产成人综合网| 亚洲狼网站狼狼鲁亚洲下载| 久久99热这里只有精品免费看| 国产草草影院18成年视频| 91免费精品国偷自产在线在线| 亚洲欧洲日产国码无码av喷潮| 理论片一区| 大陆精大陆国产国语精品1024 | 国语少妇高潮| 中文字幕久久波多野结衣| 美女国内精品自产拍在线播放 | 国产欧美视频综合二区| 一区二区午夜| 妇女自拍偷自拍亚洲精品| 青青青伊人色综合久久| 蝴蝶伊人久久中文娱乐网| 欧美天堂久久| 日韩无码视频播放|