
[摘 要]人的視覺是一個復雜的系統,人類有80%的外界信息來自視覺,所以隨著科學技術發展,可視媒體開始出現并得到廣泛的應用。但由于可視媒體的規模越來越大,在帶寬、計算效率的限制下,數據分割技術越來越受到關注。基于此,本文以圖像分割技術為研究對象,展開論述,分析了圖像分割技術的基本方法,并探討了關鍵實現技術,僅供參考。
[關鍵詞]圖像;數據;分割;可視媒體;方法;技術
doi:10.3969/j.issn.1673 - 0194.2016.22.084
[中圖分類號]TP391.41 [文獻標識碼]A [文章編號]1673-0194(2016)22-0-02
1 圖像分割概述
圖像分割就是將一張圖分割成相似但不相交區域的過程,在可視媒體的應用當中,高質量的圖像分割是后續更高水平操作如語義解釋、識別等的前提。
在計算機視覺和圖像處理領域分割是非常重要的操作,它代表著處理圖像底層的第一步。以數字圖書館來說,大量圖像視頻的收藏需要按照圖像視頻的內容構建目錄、排序及存儲,實現最有效率地瀏覽和檢索可視媒體數據。在圖像視頻的底層屬性當中顏色和紋理是最重要的兩個,所以為實現上述目的可基于顏色和紋理進行分割構建目錄和索引。另一個典型的例子是使用互聯網傳輸信息,互聯網上大規模的多媒體數據流需要傳輸,數據壓縮成為有限使用帶寬來完成的關鍵,當前使用的編碼方法就是通過模仿人類視覺來減少由于壓縮所帶來的缺陷,也就是將場景在視覺上細分為有意義的區域去尋找語義表示,這顯然涉及了圖像分割。
顏色表示法在彩色圖像處理當中最為常用,比如:常見的RGB空間,其色彩由紅藍綠成分以及透明度表示,例如用Photoshop打開一張圖片,在上鎖狀態下顯示的是RGB通道,解鎖后有四個通道即紅藍綠通道以及Alpha通道。這是基于直角笛卡爾空間的,這與人類視覺系統當中3個不同種類感光圓錐細胞(三波段濾過器)獲得彩色圖像三色理論一致。可惜的是RGB空間并不能夠完全實現顏色感知的高層次處理。
2 圖像分割的基本方法
2.1 EM算法
期望最大化算法(Expectation-Maximization,EM)在解決數據殘缺問題方面十分出色。事實上,數據集當中通常會少一些變量或是觀察不到的隱含變量的模型均可歸屬于數據殘缺,這類問題中觀察不到變量,對于所有可觀察對象均是未知的。EM算法是一種在殘缺數據中計算極大似然估計的迭代統計技術,其基礎是模型聚類方法當中的統計方法。也就是將某個數學模型和給定的數據進行最佳擬合。以高斯混合模型對圖像顏色分布建模為例,假設混合分布產生一系列的觀察值,該分布有多個同方差高斯分布組成,若取其中一個獨立同方差高斯分布,并由此產生一個樣本獲取數據點,設定多個這樣的數據點為指定的數據集,在多維空間中找到數據集對應的點,作為一定分布樣本值。那么該分布就能夠由多個高斯密度函數的加權平均值所表示的概率密度函數來描述。多個高斯密度函數的有限集合也就是高斯混合模型。
EM算法作為迭代算法,每次迭代均由求期望和極大化兩個步驟組成,前者用于計算對數似然函數的期望,后者用于選擇期望最大參數,然后代入前者再次計算期望,如此循環往復,直到獲得最優解。
2.2 馬爾可夫隨機場
馬爾可夫隨機場理論(Markov Random Field,MRF)的應用已經十分廣泛,它通過直接方便的方法用概率描述圖像像素的空間相關特性。數據統計當中馬爾可夫過程保持離散的時間和狀態,這個過程稱為馬爾可夫鏈,條件概率決定這個過程的統計特性。它很好地描述了平面網格結構中圖像像素間的空間相關性。因此在二維平面上,可以將圖像看作二維隨機場,必須考慮空間相關性。
根據上述分析,條件分布可以用來描述馬爾可夫隨機場,其中條件分布表示隨機場的局部特性,不過這樣一來通過局部特性定義整個隨機場很困難,所以Besag將Gibbs與馬爾可夫隨機場聯系起來,提出了關于方形網格的數據統計模型,獲得了實際應用方法。
在實際的運用當中,馬爾可夫隨機場常與估計理論和同級決策結合,按最優原則確定目標函數,比較常用的是MAP(最大后驗概率)。二者結合形成MAP-MRF體系。若觀測圖像和原始圖像同屬于二維平面上的隨機場,進行圖像分割,原始圖像成為標記場,通常情況下,觀測圖像會受到關照條件、系統原因或是隨機噪音的影響出現圖像失真現象。所以,要直接由觀測圖像得到原始圖像幾乎不可能,只能給出一個估計,此時利用MAP計算最大值。事實上MAP估計是一個優化問題。
2.3 ICM算法
尋求條件概率最大數的迭代方法(Iterated Conditional Modes,ICM)算法中,Modes為眾數,ICM是確定松弛的方法,其目標在于減少隨機退火的計算負擔,速度快,但選取初始值比較關鍵,因為僅允許干擾負增長,所以常出現局部最小的局面。典型的隨機松弛方法是隨機退火算法,速度慢,迭代過程當中新計算結果在接受過程中會產生隨機擾動,理論上能夠得到全局收斂。
2.4 區域生長算法
這種算法的基本思想就是集合相似性質的像素點構成區域,即先將要分割的區域找一個起始點像素作為生長點;然后將周邊與生長點像素有相似性質的像素集合到同一個區域內;再將這些新添加的像素作為生長點繼續上述操作,直到所有滿足條件的像素均被包含進來,這樣就獲得了一個完整的區域。
值得注意的是,實際應用中需要解決以下問題:一是起始點像素的選擇;二是選取周邊相似特性像素的準則;三是生長停止的規則和條件。
可通過具體問題的特點選取起始點像素,也就是用迭代方法由大到小依次收縮最終找到想要的像素點,這種方法適用于2D圖像和3D圖像,比如:軍用紅外圖像,通常檢測目標輻射大,其亮度就會比較高,所以可選擇最亮的像素作為生長點。如果沒有具體問題先驗知識,可以利用生長所用準則計算每個像素,若結果顯示出聚類特點,那么可選擇最為接近聚類中心的像素作為生長點。
在區域生長過程當中,還需注意一個要素——堆。因為區域生長過程中起始點像素周邊像素要不斷依照生長準則來判斷,確定其是否具備同起始點像素相似的特性,若是則需要進行關鍵字排序,并作為新的生長點。堆排序中,每個需要排序的記錄僅占一個存儲空間。
HeapAjust堆調整,這個步驟是保持堆特性的關鍵,其輸入參數是一個數組及其元素的索引,調整前要保證以二叉樹為根的子樹保持堆特性。不過索引的元素值可能會比其下屬節點的值小,可能破壞堆特性,HeapAjust就是將索引節點下滑使索引的節點為根的子樹符合堆特性。
Heap_min小頂堆,可以利用由下到上的方法,調用HeapAjust將數組轉化成堆。
Delete_min刪除堆頂元素,然后將剩下的堆內元素重構小頂堆。
3 實現技術研究
上文對圖像分割技術的基本方法進行了研究,基于這些內容,下文利用Matlab軟件+C語言的方式來實現圖像分割。
MATJWORKS公司的Matlab數學軟件將數值分析、矩陣計算、圖形顯示和信號處理集成為一體,含大量函數可以調用,功能強大,其使用解釋性語言,在執行速度方面有待改進而且開源在算法和保密方面不利,運行環境受限。C語言成熟,速度快但比Matlab復雜,將二者結合起來,協同工作,應用范圍更廣。
要實現二者的結合,Mex文件必不可少,這是一種能夠在Matlab中調用的C語言衍生程序,使較大規模的C語言程序能夠易于在Matlab中調用,無需重寫Mex,如果出現不可避免的循環計算瓶頸時,可用C語言重寫Mex文件來解決。
如圖1中的(a)(b),(a)為原始灰度圖像,(b)為求反顯示結果。
在使用Mex文件時要注意:第一個輸入宗量是原始圖像數據,prhs[]是雙精度指針,所以做double處理,然后作為第一輸入宗量;API函數同樣返回雙精度指針,所以通過Mex得到的圖像需進行uint8處理,這樣才能顯示。
利用上述方法,只需對Mex文件稍作調整就可以在Matlab軟件當中,利用上文提供的基本方法實現圖像分割。
4 結 語
圖像分割作為數據分割高級應用的第一步,一直是焦點也是難點,同時圖像分割也是圖像處理轉變為圖像分析的關鍵。所以本文將圖像分割作為研究對象,研究可視媒體數據分割技術。本文分析了圖像分割技術當中的EM算法、MRF算法和區域生長,并利用Matlab/C混合編程實現圖像分割,有一定的參考價值。
主要參考文獻
[1]錢吟,曲建峰,鄭巧英.多種媒體特色資源的可視化應用研究[J].圖書館雜志,2016(3).
[2]汪淼,張方略,胡事民.數據驅動的圖像智能分析和處理綜述[J].計算機輔助設計與圖形學學報,2015(11).