謝婷婷 楊祖恒 陳美松 王朋豪 張鵬程 楊滟濤




課題:西南石油大學第十九期(2019-2020年度)大學生課外開放實驗校級重點項目,編號:KSZ19906 指導教師:丁顯峰
摘要:隨著科技的進步,如何快速從圖像或視頻中提取出信息成為研究的熱點。因為種種外界因素,圖像或視頻不一定清晰,本文通過比較選取了中值濾波去噪算法對視頻中所提取的關鍵幀進行去噪處理,處理后的圖像利用數學模型進行圖像坐標系和現實坐標系的轉換,從而得到有用的視覺情報信息,實驗證明本文方法有效可行。
關鍵詞:圖像視頻;中值濾波去噪;關鍵幀;信息
1 引言
圖像中需要被檢測出來的運動目標稱為前景,前景是視覺任務中感興趣的區域,圖像中除去前景部分稱為背景,是視覺任務中要忽略的區域,進行運動目標檢測的目的就是提取出視頻幀中的前景區域,方便下一步進行運動目標識別或運動目標跟蹤。在一個復雜場景的圖像中難以準確地定義出什么是前景,尤其是在光線漸變、突變、動態背景偽裝效應、陰影,鬼影等具有挑戰性的場景中,準確地定義出前景并且提取出前景是一件非常困難的任務[1]。本文通過研究對視頻幀序列圖像中容易出現的干擾噪聲、顏色相似等因素的影響,對圖像進行去噪和形態學處理,使得圖像中目標特征信息更加明顯,有利于目標圖像的檢測提取。
2 視頻關鍵幀提取
視頻的本質是一種由圖像快速播放而得的,視頻的組成是由一組時間和內容相關的圖像組成的。視頻技術包含對靜態圖片的捕捉、操作和存儲。視頻播放利用了人眼的局限性。由于人眼存在視覺暫留現象,當每秒鐘刷新顯示的圖像幀數大于24 張時,人類會誤認為這些單獨且為靜態的圖像是運動的,從而得到連續的觀看體驗,能夠提供這類觀看體驗的連續圖像被稱作視頻[2]。因此,視頻的本質就是圖片,頻率一般為25張圖片/秒,即25幀/秒(這便是幀率的概念)。因為Matlab編譯簡單,語言容易學習,實際操作簡單,同時在圖像處理方面應用廣泛,因此運用Matlab按照一定的時間間隔截取視頻關鍵幀并保存為圖片從圖片中篩選出我們所需要的關鍵幀,然后進行中值濾波去噪處理。
3 圖像去噪算法選擇
3.1圖像去噪一般算法比較
圖像在各種傳達或輸送過程中,多種不同的噪音或其他干擾都會對圖像造成影響,因此,輸送的圖像的品質以及質量將會受到不同程度的受損,對于人類的視覺系統進行圖像分析以及傳感器對圖像的系統分析和理解會造成一定程度上的阻礙,對于人們進一步的圖像處理的需求也有很大的阻礙,因此需要進行圖像去噪。圖像去噪的經典算法主要有均值濾波、中值濾波、高斯濾波。濾波就是對原來圖像的每個像素周圍一定范圍內的像素進行運算,但運算通常分為兩種,當運算只是對各像素灰度值進行一個簡單的處理(如乘一個權值)最后求和,稱之為線性濾波;但如果對像素灰度值進行比較復雜的運算,而不是簡單的處理求和運算,就稱之為非線性濾波。所以高斯濾波、均值濾波是線性濾波,中值濾波和雙邊濾波是非線性濾波[3]。
同時不同的濾波器在處理不同類型的噪聲是效果不同,對于線性平滑濾波,在處理像素鄰域內的噪聲點時,噪聲或多或少都會影響該點的像素計算(以高斯平滑為例,距離近則影響大,距離遠則影響小,與距離的平方呈反比);但是中值濾波一般可以將噪聲點直接忽略掉。同時,中值濾波在降噪的同時引起的模糊效應較低。所以本文采用中值濾波來消除椒鹽噪聲。
3.2中值濾波去噪算法
無論平均平滑還是高斯平滑,在處理圖像噪聲時,都或多或少會對圖片產生一 定的模糊,損失部分信息。較為理想的情況,是可以選擇性地進行濾波,只在噪聲區域進行平滑,而在無噪聲區域不進行平滑,將模糊的影響降到最低[4],這就是自適應性濾波的思想。通常噪聲的存在,可能會使得附近鄰域內,極值的上下差距較大,或者是方差較大,我們可以設置一定的閾值來判斷該點是否需要進行平滑。這時就可以采用中值濾波,中值濾波本質上是一個統計排序濾波器,是以該點為中心的的鄰域內的所有像素的統計排序中值作為該點的響應。
4 實驗分析及結果
4.1關鍵幀提取
對于一段視頻,也可以稱之為圖像序列,首先運用Matlab按照一定的時間間隔將視頻截取為圖片儲存于文件中,然后選取所需要研究的圖片進行去噪處理,如此便將連續的視頻圖像轉化為單幅的靜態圖片,更有利于情報信息的提取。以下便是將一段視頻按照一定的時間間隔截取。
4.2圖像去噪
從視頻中提取出關鍵幀后利用MATLAB進行圖像去噪處理,首先對原圖像進行色彩處理得到黑白圖像,由圖1變為圖2。
之后利用MATLAB采用中值濾波消除椒鹽噪聲得到如下清晰圖像。
4.3坐標轉換
處理完成的圖片建立針孔成像模型,將像素坐標二次轉化為圖像坐標,圖像坐標經過透視投影變為相機坐標,相機坐標利用剛體變換得到了現實坐標,從而從圖像中提取出有效的視覺情報信息。
處理完成的圖片建立針孔成像模型,將像素坐標二次轉化為圖像坐標,圖像坐標經過透視投影變為相機坐標,相機坐標利用剛體變換得到了現實坐標[5],從而從圖像中提取出有效的視覺情報信息,即可計算得到兩點間的距離為4.893米。
5 結論
本文提出了利用中值濾波對圖像進行去噪處理,運用Matlab語言進行視頻關鍵幀提取,對圖像處理完畢后,采用數學模型進行圖像坐標系和現實坐標系的轉換,有效提取視頻圖像中的情報信息。
參考文獻:
[1]許辰銘. 視頻圖像中的運動目標檢測與跟蹤[D].南京郵電大學,2012.
[2]強子謙.基于運動矢量的視頻關鍵幀提取及虛擬現實顯示方法研究[D].天津大學,2018.
[3]于虹,甄彤.圖像去噪經典算法研究[J].信息與電腦(理論版),2020,32(14):66-67.
[4]]張錚, 王艷平, 薛桂香. 數字圖像處理與機器視覺[M].人民郵電出版社, 2010.
[5] 劉美連. 基于多視圖三維重構目標電磁散射計算方法研究[D].西安電子科技大學,2018.
作者簡介:謝婷婷(2000.05.10—),女,漢族,陜西省寶雞市人,本科在讀,研究方向:數學與應用數學。
西南石油大學理學院 四川 成都新都區 610500