楊云 吳戀 邱南亞 羅集景 黃小朝

摘要:本文旨在基于深度學習圖像識別的技術上對網絡色情圖片進行識別及過濾進行研究與探討。在人工智能的機器學習上的一個新興的探討方向就是深度學習,其技術可以實現在圖像中辨別出異類的目標和對象的效果,為實現這種效果此技術運用了多種算法對圖像進行必要的操作。圖像識別技術的核心在于對圖像的特征進行提取和分類,其中圖像識別技術中最主要的技術是圖像的特征的提取,也是用來權衡一個圖像識別算法的好與壞。本文通過基于深度學習的圖像識別技術進一步對色情圖片的識別及其過濾的模型進行探討。
關鍵詞:深度學習;圖像識別算法;模型
中圖分類號: TP311? ? ? ? 文獻標識碼:A
文章編號:1009-3044(2019)21-0191-02
開放科學(資源服務)標識碼(OSID):
21世紀,互聯網不僅可以作為人與人之間的一種通訊方式,還成了資源傳輸和共享手段,而手機作為終端處理器,不僅僅局限于通訊和發短信,人們還可以利用手機更加快捷地獲得所需要的信息,顯然互聯網對于人們的生活方式起到了不少的促進作用,但互聯網相比傳統的媒體傳播介質有所區別,互聯網顯得更加難以管理。這也導致了一些為了獲取網絡暴力的不法分子利用了互聯網的特性進行違法犯罪。各種不良信息諸如色情圖片,色情小說等,也在互聯網上肆意傳輸,這給網絡帶來了很多不健康的信息,對網絡使用者造成了傷害,特別是對于未滿18歲使用者的身心健康。那么如何對這些不良的色情圖片進行攔截就顯得至關重要了。本文將運用圖像識別技術來對網絡上的色情圖片進行攔截。
1 深度學習圖像識別的發展及歷程
近幾年來,人工智能在深度學習方向上的研究有了非常可觀的突破,特別在圖像識別方面。圖像識別的研究經過了三個階段,這三個階段分別是對字圖像和物體的識別。而這些技術原理都離不開神經網絡。可以不夸張地說,如今出現類似的模型都是屬于神經網絡的模型,比如著名的反向傳播算法[1],這一算法從1986年被威廉姆斯、欣頓和魯梅爾哈特在《自然》雜志上發表到現今都是普遍運用的。神經網絡的主要發展方向有兩個方面,其一:由2012年和2014年的ImageNet競賽冠軍獲得者用到的模型來看[2],模型的層次在加深,這也意味著未來研究模型的層次會不斷加深。其二:為使識別的正確性達到最佳,模型的結構復雜度會逐漸增加。有結果表明,為了在不同尺度上實現融合圖像的有效信息效果,需要并行多分辨率起始結構,才能在不同尺度上實現融合圖像的有效信息效果。另一方面,采用低秩分解的方法構造了參數尺寸較大的隱層,大大減小了模型的參數尺寸。可見神經網絡的發展對于圖像識別技術能在未來更多領域得到應用起到了不可磨滅的作用。圖像識別技術在未來的生活中必將隨處可見,它的應用前景是不可估計的。
2 基于深度學習圖像識別的模型及算法
建立在深度學習的基礎上,在對圖像識別方向進行研究的過程中,許多網絡模型被運用到,其中就包括了遞歸神經網絡、卷積神經網絡以及圖像處語義分割算法。下文將探討基于深度學習圖像識別的網絡色情圖片識別與過濾常用到的幾種網絡模型及算法。
2.1 卷積神經網絡(Convolution Neural Network,CNN)
卷積神經網絡是由多種算法層組成的神經網絡,通過這些層的計算,可以實現海量圖像數據的降維,最終使其能夠被訓練達到識別圖片的目的,卷積網絡簡單可以劃分為卷積、池化和上采樣三步來完成。對于傳送的圖片來說,要讓計算機判斷出該圖片是否是色情圖片,需要完成三個步驟,首先是卷積,需要選擇一個合適尺寸的卷積核(也可看作過濾器)來對圖片進行卷積操作,過濾掉各個小區域,由此可以在現實訓練中取到過濾掉的小區域的特征值;其次是池化(也就是下采樣),將原始圖片不斷縮小到一個很小的尺寸得到一個特征圖,不斷縮小是因為即使做了卷積圖片還是很大,所以下采樣來降低數據維度;最后是上采樣(反卷積),其和卷積相像,運算的方法都為相乘和相加,上采樣目的是為了放大還原圖片。通過這些操作來實現對計算機的訓練,使之實現在使用網絡時可以自動清除掉那些色情圖片的效果和目的。
2.2 圖像語義分割算法
在對海量的圖片數據進行處理和理解時,圖像的語義分割和自動標注技術在工作中占據主要地位[3],為了使計算機實現視覺上與人類相同的目的,人們研發出了很多技術和模型,其中就有圖像語義分割算法技術,此技術也成了計算機在視覺上的核心技術。語義分割過程就像PS摳圖一樣,需要盡可能地貼合每個物體的邊框,由此讓計算機對圖片完成像素級的理解,并給圖片中的各個像素點進行標注標簽和分類。對于網絡上的發送傳播的色情圖片,需要對該圖片進行語義分割,完成圖片的分割、標注和理解。圖像語義分割的實現需要用到以下三類方法,分別為“閾值法”、像素聚類法和圖像邊緣分割法,在色情圖片的分割上,利用這些方法獲取到前后背景、圖片紋信息和邊緣信息,最終得到預期的分割結果。
3 基于深度學習的網絡色情圖片識別算法分析
3.1 色情圖片識別原理分析與探究
色情圖片識別是利用神經網絡的模糊識別來實現的,就像人類可以辨別并判斷出很多顏色各異或形狀不一的圖像是什么類型的圖像一樣,這就是所謂的模糊識別。圖片的模糊識別需要對圖片的特征進行提取和訓練,并對圖片進行分類處理,大概流程如圖1所示。這里主要探討的是圖像分割技術在圖片識別中的實現。為了提取到圖片的特征,可以對圖片顏色、形狀和紋理等進行分割標記。最后利用統計法、結構法、神經網絡發、模板匹配法和集合變換法進行圖片識別。在這過程中也會用到BP[4]來確定權重的數值表示,隨后構建FP[5]來確定圖片是否是色情圖片。
3.2 圖片特征提取
圖片識別過程中,對圖片的特征提取是很重要的一個步驟,為了達到提取這些特征的目的,人們研究出了很多算法和技術。基于在網絡上傳送的圖片大部分都是有明顯差異的,比如顏色,可以利用顏色直方圖的方法在海量圖片數據中進行色情圖片和非色情圖片的比對,如圖2所示,可明顯看出圖片的差異。但是在這海量的圖片數據中還有很多圖片是顏色相近的,這就很難使計算機識別出哪些是色情圖片而非健康的圖片,因此只能從除顏色以外的特征去獲取其他的特征信息,比如形狀和紋理特征,利用卷積算法和圖像分割算法等算法來對圖片進行特征提取和分類。
4 總結與展望
圖像識別其實就是在做視覺上的認知,讓計算機能模擬人的思想去辨別、認識事物。要想實現對圖片的識別工作其實難度不是很大,因為該技術的基本算法思想并不是很復雜,只是在實現信息處理上較為麻煩。提取出的特征信息有時會十分突出,有時又很個別,這便會影響機器的識別速率,然而圖像特征信息通常是用來表示圖像的信息的,這些問題都是可以解決的。因此圖像識別技術會更多并且更好的應用在人們的生活中。有了圖像識別技術就可以解決網絡的發展帶來的色情信息的泛濫的問題,堵截色情圖片的發送與散播,可以給廣大網民朋友營造一種健康舒適的網絡環境,這個舉措對提高各界網民的綜合素質有著不可或缺的作用,也對網絡能夠在未來建造出一個健康且文明的環境有著很大的意義。
參考文獻:
[1] Rumelhart D E, Hinton G E, Williams R J. Learning internal representations by error propagation. Nature, 1986,323(99):533-536.
[2] Szegedy Christian. Going deeper with convolutions.arXiv preprint arXiv:1409.4842 (2014).
[3] 董志貴,王福林,宋慶鳳,等.基于BP神經網絡的無約束優化方法[J].統計與決策,2019(1):79-82.
[4] 吳福朝,張鈴.基于FP算法的神經網絡綜合方法[J].小型微型計算機系統,1998(1):69-72.
[5] 曹攀,錢軍浩,陳智,等.基于圖像分層樹的圖像語義分割方法[J].計算機應用研究,2018,35(8):2514-2519.
【通聯編輯:唐一東】