李麗麗
(順德職業技術學院,順德 528300)
數據驅動下的圖像智能處理技術發展研究
李麗麗
(順德職業技術學院,順德 528300)
本文論述對數據驅動下的圖像進行表達和分析,簡要分析圖像內容獲取的兩個步驟,分析數據驅動的圖像智能編輯,希望為我國圖像智能處理技術的提升做出貢獻。
數據驅動 圖像處理 智能處理技術
近些年,隨著互聯網以及數字多媒體的不斷創新,相關技術人員將兩者相互融合,從而很大程度上擴大了線上可視媒體規模。可視媒體包括圖像、視頻和數字幾何等,其中圖像作為最直觀的信息載體,可調動所有用戶的視覺,傳達出最有效的信息。然而,如何采取有效手段從大量數據信息中抓取和分析視覺內容,是值得深入探索的問題。同時,提高圖像智能處理的技術也是我國正面對的挑戰。
眾所周知,互聯網中包含的圖像數據和信息非常多,并且大多信息沒有順序,多數信息的質量也不高,還夾雜著大量沒有相關性的信息,給用戶尋找所需信息增加了難度。因此,急需一種智能圖像理解方法,以便從繁雜的圖像中提取和分析視覺內容,從而對提取出的有效視覺內容進行處理。
1.1 圖像內容的表達方法
一直以來,對圖像內容進行有效抽取和表達都是相關技術人員積極探索的問題。為了使提取出的內容有緊湊的效果,且將圖像描述和表達地更加精準,相關技術人員都在針對魯棒效應進行探索。針對提取圖像這一方面,相關技術人員先后探索出GIST特征描述方法、基于直方圖對比度方法、基于區域對比度的顯著性提取方法。其中,第一種方法主要從圖像的顏色和梯度分布等特征的角度對整個圖像進行描述,第二種方法主要利用視覺顯著性區域對圖像進行描述,而第三種方法將視覺顯著性與空間關系相結合,主要用于提取出對象外形輪廓,準確性更高,且具有自動提取的功能。如今,由于研究人員的不斷主動探索,研究人員Hu探索出一種新的圖像結構表達方法,即片網。這種結構表達方法可將某一區域用具有代表性的片進行標示,進而將這些區域用某種方式聯系起來,形成層次結構,最終實現對整個圖像的描述。片網的結構如圖1所示。

圖1 片網對于一幅圖像的表達
1.2 數據驅動的圖像內容分析
以數據驅動方法為工具,針對傳統的圖像內容分析問題,取得了較大進展。其中,成就最大的是算法性能。例如,研究人員通過探索發現,可利用三維模型庫將二維圖像做出并形成對比,對比內容包括形狀與結構,從而達到對圖像深度信息進行估算的效果。與此同時,分析圖像庫中的物體形狀和外觀特征也非常必要。針對這一問題可采用科學的方法,如在數據集中應用機器學習的方法。該種方法可提高對象的分析能力,也可對同類物體所有外形特征的子空間進行學習,從而將其內在視覺屬性更精準地刻畫出來,且這種方法不受物體發生變形的影響。在這個互聯網圖像技術極其發達的年代,相關技術人員逐漸將注意力轉移到理解用戶意圖方面。因此,手繪草圖的方法應運而生。這不但可以很好地理解用戶意圖,而且很大程度上提高了草圖交互方法的智能性。
近幾年,圖像內容的表達和分析方法已有很大進展,打破了傳統方法中的禁錮,將重點轉移至對圖像語義內容的智能提取和對圖像庫中圖像結構、關系的挖掘。然而,這種方法仍受到目前科學技術水平的限制,運行時分析效率不高。因此,仍需要相關技術人員不斷地挖掘和探索。
2.1 對圖像進行檢索
對圖像進行檢索,使用的方法大多與圖片顏色、紋理和梯度有關。例如,支持向量機的機器學習方法。從圖像檢索方法橫空出世至今,圖像檢索方法二十年的時間內取得了非常大的進展。例如,1995年出現的多尺度圖像檢索方法,后來改進的倒排索引結構,2006年的視覺詞匯樹結構以及后來視覺等級方法等。如今,隨著互聯網技術的發展,有關研究人員提出交互圖像搜索框架。該種方法操作起來非常簡便,用戶只需將圖片移動到檢索范圍內即可。搜索系統可根據不完整的局部信息提取物體整體輪廓,從而根據物體輪廓在數據庫中進行檢索。
2.2 將圖像對象進行匹配
一般而言,互聯網中的圖像信息繁多,其中不乏相似度非常高的圖像。而從海量的圖像中準確將圖像進行匹配,難度相當大,這也是圖形學與計算機視覺領域極其重視的問題。針對背景較簡單且對象簡易的圖像,匹配方法大多以對象的外形輪廓相似性為基礎。運用頻率最高的方法是上下文方法。這種方法運用采樣和二分圖匹配算法的方法,首先需要在該對象的外形輪廓上采樣,并對其周圍的采樣點分布情況進行統計;而后采用二分圖匹配算法,將其中兩個采樣點進行最優匹配,從而得出這兩個點的相似度。而針對背景較復雜的圖像,通常運用層級過濾機制。該種機制綜合考慮對象外形輪廓、內容以及視覺顯著性,考察其一致性,從而對與輸入對象的相似處進行提取。近幾年,有關技術人員提出非監督互聯網圖像物體聯合提取方法。這種方法通過圖像搜索引擎對用戶輸入的關鍵詞進行搜索,然后從圖像庫中對其稠密對應關系信息進行提取,并根據輸入關鍵詞的語義提取前景物體。如今的匹配方法更加精確,因為該種方法加入了一種新的手段,可將物體對象的形狀信息劃分為不同小組,并結合互聯網對圖像物體進行提取和匹配,從而為數據驅動的圖像編輯應用提供多樣化的圖像內容。
面對繁雜多樣的數據圖像信息,內容檢索和對象匹配均是非常重要的部分。一方面可為圖像的合成提供更準確的素材,另一方面大大降低用戶交互的復雜性。其中,內容檢索主要依據輸入關鍵詞語義進行,對象匹配主要在用戶交互的基礎上根據關鍵詞語義進行。
3.1 與圖像智能編輯相關的基礎技術
數據驅動的圖像智能處理用到的基本技術包括許多,其中包括上文介紹過的圖像內容自動提取技術和匹配技術,還包括友好的人機交互方式。正是由于綜合了這幾種基本技術,才能依據用戶輸入的關鍵詞推測出用戶意圖,并精準將圖像中的對象提取出來。
3.2 數據驅動的圖像合成
數據驅動圖像處理的核心在于圖像合成環節,而圖像合成環節大致可分為兩大類。這兩類的主要區別在于作為基礎的對象不同。一類以物體對象為基礎,一類以區域一致性為基礎。其中,第一類合成方法主要從數據庫中提取對象用于合成圖像,第二類合成方法主要從數據庫中提取部分區域與用戶輸入的圖像進行一致性合成。
縱觀圖像處理技術的發展過程,在相關技術人員的努力鉆研下,我國的圖像處理技術不斷得到提升。如今,互聯網技術更新速度非常快,用戶對數據驅動下的圖像處理要求逐漸提高。在這個大數據時代,應適應潮流的發展,將圖像技術與互聯網技術結合,將智能化靈活運用于圖像處理技術中。
[1]汪淼,張方略,胡事民.數據驅動的圖像智能分析和處理綜述[J].計算機輔助設計與圖形學學報,2015,(11):2015-2024.
[2]戴昌達,姜小光,唐伶俐.論發展遙感圖像應用智能處理技術[J].地球信息科學,2003,(4):77-82,1.
Research on the Development of Intelligent Image Processing Technology for Data Driven
LI Lili
(Shunde Polytechnic, Shunde 528300)
This paper discusses the image of data driven expression and analysis, a brief analysis of the two steps of image content acquisition, image intelligent analysis of data driven editing, hope to make a contribution to enhance the intelligent processing technology of China’s image.
data driven, image processing, intelligent processing technology