摘 要:機器學習是現在一個很熱門的研究方向,利用機器深度學習來進行行人的檢測是一個科學有效的辦法。文章通過對于圖像提取與壓縮的方案探討,結合信號的稀疏表達的技術,對行人的檢測方法進行了分析,結果表明,機器學習的檢測方案是準確而有效的。
關鍵詞:機器學習;稀疏表達;行人檢測
1 圖像提取的方法
1.1 分割
在計算機視覺中,圖像分割是將數字圖像分割成多個片段或者像素集合的過程,分割的目標是將圖像的表示簡化和改變為更有意義和更容易分析的東西。圖像分割通常用于定位圖像中的對象和邊界。更精確地,圖像分割是向圖像中的每個像素分配標簽,使得具有相同標簽的像素共享某些特性的過程。圖像分割的結果是集合地覆蓋整個圖像或從圖像提取的一組輪廓的集合的片段。區域中的每個像素相對于某些特性或計算的屬性是相似的。相對于相同的特征,相鄰區域是不同的。當應用于成像中的圖像堆疊時,在圖像分割之后產生的輪廓可以采用插值算法生成。常見的是閾值分割,使用這種成像技術可以精確地進行黑白和彩色圖像的自適應圖像分割。
1.2 濾波
迭代過濾算法是用于對觀察的圖像進行最大似然推斷的工具,對未知參數的隨機擾動用于探索參數空間。將順序蒙特卡羅粒子濾波器應用于該擴展模型導致選擇與數據更一致的參數值。適當構造的程序,迭代與連續減少的擾動,收斂到最大似然估計。迭代過濾方法迄今為止被廣泛用于研究圖像的提取與濾波。首先,它們平滑了似然面,使算法能夠克服全局搜索早期階段可能出現的小規模特征。其次,蒙特卡羅變化允許搜索從局部最小值逃脫。第三,迭代過濾更新使用擾動的參數值來構建最大似然的導數近似值,即使該量通常不是以閉合形式可用。第四,參數擾動有助于克服在順序蒙特卡羅期間可能出現的數值估計困難。
2 基于稀疏表達的圖像特征壓縮
稀疏表達可以理解為將一個原始信號用一組字典元素的線性組合進行表示,將一段時間內的信號中的每一個作為一個向量輸入到矩陣中,進行矩陣分解,可以得到其低秩部分、稀疏部分和噪聲部分。信號的稀疏表示近年來引起了研究人員相當大的興趣,假設自然信號(例如圖像)允許在冗余字典上進行稀疏分解,導致處理這種數據源的有效算法。特別地,用于圖像的良好適應的字典的設計已經是一個主要的挑戰。K-SVD最近已經被提出用于這個任務并且被示為對于各種灰度圖像處理任務執行得很好。為解決學習彩色圖像的字典的問題,并擴展基于K-SVD的灰度圖像去噪算法。來自稀疏信號表示的技術通常在非傳統應用上開始在計算機視覺中看到顯著影響,其中目標不僅是獲得觀察信號的高保真表示,而且還提取語義信息。詞典的選擇在彌合這種差距中起著關鍵作用,由訓練樣本組成或從訓練樣本本身學習的非常規詞典是獲得最先進結果和將語義含義附加到稀疏信號表示的關鍵。理解這種非常規字典的良好性能又需要新的算法和分析技術,這項工作提出了處理非均勻噪聲和丟失信息的方法,為如彩色圖像去噪、去馬賽克和修復等應用中的最先進的結果鋪平了道路。
由于提取到的圖像特征數據的維數過高、數量過大,不利于存儲和進一步的機器學習,因此需要進行相應的壓縮。對于特征提取,我們顯示如果識別問題中的稀疏性正確利用,特征的選擇不再是關鍵。然而,關鍵的是特征的數量是否足夠大以及稀疏表示是否被正確地計算。非常規特征,例如下采樣圖像和隨機投影,以及常規特征,例如特征面和拉普拉斯面,只要特征空間的維度超過某一閾值,由稀疏表示的理論預測。該框架可以通過利用這些誤差相對于標準(像素)基礎常常是稀疏的事實來統一地處理由于遮擋和破壞引起的錯誤。稀疏表示的理論有助于預測識別算法可以處理多少遮擋以及如何選擇訓練圖像以最大化遮擋的魯棒性。
3 基于機器學習的行人檢測
3.1 機器學習技術
機器學習是計算機科學的子領域,它使計算機能夠學習而不用明確編程。從模式識別和計算學習理論在人工智能的研究演變而來,機器學習探索學習對數據進行預測算法的研究和構建,這樣的算法克服了嚴格的靜態程序指令數據驅動的預測或決策,通過從樣本輸入來建立一個模型。機器學習在一系列計算任務中使用,其中有著明確算法的設計和編程是不可行的,比如垃圾郵件過濾、檢測網絡入侵者或惡意內部人員、光學字符識別、搜索引擎和計算機視覺,這些方面都沒有明確的算法表示。機器學習與計算統計密切相關,并且經常與計算統計重疊,計算統計也集中在通過使用計算機的預測中。它與數學優化有著緊密的聯系,它將方法、理論和應用領域傳遞到現場。機器學習有時與數據挖掘相結合,后者的子領域更側重于探索性數據分析。機器學習也可以是全自動化的,用來學習和建立各種實體的行為預測,然后用于發現有價值的異常情況。在數據分析領域,機器學習是一種用于設計適合預測的復雜模型和算法的方法,在商業應用中,這被稱為預測分析。這些分析模型允許研究人員、數據科學家、工程師和分析師通過學習數據中的歷史關系和趨勢來產生可靠的、可重復的決策和結果并揭示隱藏的規律。
3.2 支持向量機技術
支持向量機(SVM)表示一組從訓練數據創建函數的受監督學習技術,訓練數據通常包括輸入對象(通常是向量)和期望輸出的對象。學習的函數可以用于預測新對象的輸出。SVM通常用于其中函數輸出有限類之一的分類。SVM也用于回歸和偏好學習,為此他們分別稱為支持向量回歸SVR和排名SVM。SVM屬于一類廣義線性分類器,其中分類(或邊界)函數是特征空間中的超平面。SVM的特殊性質是SVM可以實現高度的泛化,泛化表示學習函數對測試數據或在訓練中排除的未知數據的性能。
將表征圖像梯度特征的HOG特征和圖像紋理特征的LTP特征相結合,發揮二者的優勢,并利用稀疏表達的方法進行特征數據的壓縮,利用二者相結合訓練的SVM分類器進行了行人檢測的測試。檢測時,首先對圖像進行預處理,例如圖像仿射糾正幾何形變、圖像去噪、曝光過度圖像的濾除;然后進行前景提取,因為行人在圖像中是以前景的形式出現,所以可以得到行人的候選區域;再對輸入圖片進行尺度縮放,對于每一層圖像,采用大小為128×64的窗口進行滑動計算,提取出每個滑動窗口的HOG特征和LTP特征,并利用SVM分類器進行判別,可以得到該窗口中是否有目標。如果當前窗口符合行人的HOG特征和LTP特征,就將其存儲作為目標區域;如果沒有,則檢測下一個窗口。
4 結束語
本文利用基于HOG特征和LTP特征相結合訓練的SVM分類器進行行人檢測,該方法可以應用于靜止攝像頭的監控場景中,將前景圖像、背景圖像和噪聲分離,理論意義和實際應用價值都比較高。前景提取方法可以很好地抵抗噪聲,并將圖像的3個組成部分:低秩部分、稀疏部分和噪聲部分進行有效地分離。實驗結果表明提出的算法有精度高、速度快等優點。然而,實驗中的前景提取和行人檢測是相分離的,如何將二者進行結合將是下一步的研究方向。
參考文獻
[1]李紫微.淺析計算機圖像處理技術的應用[J].通訊世界,2016(06).
[2]閆鳳,石磊,張國英,等.計算機圖像處理技術的應用[J].電子技術與軟件工程,2016(20).
作者簡介:徐政超(1984,12-),男,漢族,籍貫:河南沁陽,當前職務:實驗技術人員,當前職稱:助理工程師,學歷:碩士,研究方向:計算機科學與應用。