楊澤昊,閆 宇,戰國棟
(大連民族大學 a.計算機科學與工程學院;b.設計學院;c.大連市漢字計算機字庫設計技術創新中心,遼寧 大連116605)
水印嵌入到載體圖像后,圖像中的特殊信息以可見的形式顯示出來,即稱為可見水印,這主要應用于版權維護和紀念留影[1]。 在某些場景下需要逆向恢復原圖像。
去除水印的前提是鎖定文本水印區域,文本作為語言的物理化身,是保存和交流信息的基本工具之一。傳統上,文本識別一直專注于文檔圖像,其中OCR技術非常適合數字化平面紙質文檔。當應用于自然場景圖像時,這些OCR技術效果會變差,甚至失敗,因為它們被調整為黑白色差、基于行的打印文檔環境。自然場景圖像中出現的文本在外觀和布局上變化很大,從大量字體與樣式中提取,受到不同光照、遮擋、方向、噪聲的影響。此外,背景對象的存在會導致虛假誤報檢測,這使得自然圖像文本定位更具有挑戰性。
去除水印算法的相關研究中。Lin等[2]提出一種子采樣技術自適應去除水印,維持圖像質量。Zhang等[3]提出了一種加密圖像的可逆方案,此方案利用逐位異或運算對原始圖像加密,并修改了對應二進制標志的部分嵌入可見水印。Weng等[4]提出一種基于動態圖像同時保持上下文聯系的水印方案,隱藏信息不同位置提取方法和恢復方式各不相同。Chen等[5]提出差分擴展的可逆宿主圖像的水印方案。利用深度學習去除水印的方法主要利用信號重建去除水印圖像。Lehtinen等[6]提出一種無需損壞統計似然模型或圖像先驗的模型,該模型從訓練數據間接學習的方案。深度學習運算周期長,需要大量標注性數據集。
本文提出一種端到端的混雜文本型自然圖像可見水印去除方法,該方法依靠文字區域檢測結合色差值,鎖定水印確切位置,再利用快速推進算法消除水印,達到在多樣本條件下的精細化去除。
本次數據集主要采自中國少數民族藝術平臺的文物圖像,共有22 379張圖像,劃分為17類,特征歸屬于自然圖像。它們不僅具備自然圖像背景復雜,顏色與布局差異大的特點,還集中體現了水印文字與內容文字混雜的特殊問題。此類圖文混雜的自然圖像,無論是傳統方法還是新興的深度學習方法,都很難有效處理非水印文字區域內容,容易造成誤刪,去水印錯誤示例如圖1。

a)水印圖像 b)錯誤去除圖1 去水印錯誤示例
為解決上述問題,本文提出一種端到端的可見水印去除方法,過程如圖2。
Step 1:通過文字區域檢測內容結合色差值定位水印區域;
Step 2:融合快速修補算法去除可見水印;
Step 3:輸出去除水印圖像。

圖2 去水印流程
尋找水印位置的工作可以視作文字區域定位,作為數據的藝術圖像多數是畫作或文物圖像,不僅水印文字是明顯的文本區域內容,字畫書法、雕刻印章、文物刻字等同樣會作為干擾內容。
本文融合基于RPM(region proposal mechani-sm)的文字區域檢測內容[7]。利用首部分的region proposal,首先保證較高準確度,盡量把所有可能的文字區域檢測出來,然后經過一個filtering階段,提升文字檢測的精度。
此步驟為泛化的文本區域檢測,如果圖像只存在水印文字,則可以很好地定位文本區域。但由于部分藝術圖像存在文物文字及相關的圖形印章,如圖3a。文本區域定位掩圖a的目標塊會出現錯判現象,將其認定為水印類文本,從而導致刪除原有圖畫真跡,變為沒有文字的文物畫作。這明顯不是我們想要的去除效果,需要繼續處理掩圖數據,讓掩圖只保留水印文字。
為進一步鎖定水印區域范圍,我們根據可見水印的顏色特征進行二值化處理,將RGB(120,120,120)至RGB(160,160,160)以外的顏色變成0,生成掩圖3b。最后將3a圖像的目標區域與b圖像的白色區域進行融合,形成掩碼圖像3c。

圖3 掩圖水印區域定位
根據本次數據集水印特征,去除水印算法需要提供大約為90×38像素寬高的文字掩碼塊。在區域位置進行范圍限制,最終得到希望的文字掩碼圖像,利用此掩碼圖像可以準確地定位水印文字,避免破壞自然圖像中的文本信息。
在獲得掩圖后,即可利用掩圖來去除水印內容。關于去除水印的具體方法,本文融合了基于快速推進法的圖像修復技術[8]。其主要考慮圖像中要修復的區域,算法從該區域的邊界開始,然后進入區域內,逐漸填充邊界中的所有內容。它需要在鄰近像素周圍的一個小鄰域進行修復。該像素由鄰近所有已知像素的歸一化加權和代替。
因此,選擇權重是一個重要的因素,對于靠近該點的像素,靠近邊界的法線和位于邊界輪廓上的像素,給予更多的權重,遠離此點的則給予更小權重。一旦像素被修復,它將使用快速行進方法移動到下一個最近的像素。算法確保那些靠近已知像素的糟糕部分首先被修復,這就像一個輪替式啟發器,直到區域修復完成。
根據水印位置定位結果,獲取掩圖圖像如圖4b。將掩圖與原圖進行融合,利用圖像修復技術,進行水印去除。其結果完美的保留了文物圖像原有的印章刻字,并且對水印文字進行模糊化處理,周邊像素色彩幾乎沒有改變。

圖4 水印去除效果
由于水印區域在右下角,且文物圖像的背景顏色具有一致性,在模糊化進程中不會有多余的色塊冗雜,修復區域能夠很好的與原背景色融合,看不出修改后的痕跡。在修補方面,快速推進法的圖像修復技術可以很好的補充缺失,對邊界線上的像素填補給予更多權重,能夠將水印文字的殘留痕跡覆蓋,修復效果良好,且不會對圖像本身文字內容錯誤刪除。
本文采用的數據為藝術文物圖像,屬于混雜文本型自然圖像的典型,且樣本數量巨大。本文方法主要考慮解決去除水印的重復性工作,并處理水印文字區域精確定位問題,消除水印后的圖像分類導入至中國少數民族藝術平臺。
目前去除水印的算法有多種多樣,但效果最好的主要是Noise2Noise[6],利用深度學習來構建網絡模型,本質上還是去噪應用,對于混雜文本型自然圖像,文字識別效果不佳,且容易將文物原刻字磨損去除。另外,深度學習的網絡模型側重于深度和寬度來加強網絡,需要計算的樣本內容極大,在缺乏大量標注好的樣本時,效果很不理想。對于文物圖像來說,幾乎沒有合適的數據集供網絡學習,去除大量畫作水印成本太高。若單純使用RPM文本區域檢測并消除水印,可以有較好地去除效果,色塊融合也較為理想,但文字內容處理方面不佳,容易將畫作原刻字消除,造成圖像信息丟失。特別是對于文物圖像,其最高優先級應該是保留原畫作的真實內容。
從定性角度分析,選取各類文物圖像對比去除水印效果如圖5。利用深度學習算法Noise2Noise[6]進行水印去除,在100次標準化迭代后,仍有較明顯痕跡;單純使用RPM文本區域檢測并消除水印,雖然能夠很好的定位文本內容,但會把不屬于水印的文本內容消除;本文的端到端水印去除算法,可以針對文物文字復雜背景情況,得到較好效果。

a)Noise2Noise算法 b)RPM算法 c)本文算法 圖5 算法水印去除效果對比
本文主要對混雜文本型自然圖像進行可見水印去除研究,實現對中國少數民族藝術平臺兩萬余張文物圖像進行去水印操作,從而擴展到更具有普遍性的自然圖像。
首先,融合基于RPM的文字區域檢測內容并進行色差區域定位,確定水印文本掩圖,利用掩碼圖像配合基于快速推進法的圖像修復算法進行水印去除,形成一套端到端的可見水印去除流程。結果分析表明本文的方法具有極高穩定性,準確鎖定水印區域并進行去除,避免誤刪自然圖像所包含的文本內容,節省人工成本,有較好的應用價值,提高了去除水印的效率。
最后,利用去除水印較好的結果圖,與原圖進行一對一匹配,可以制作用于深度學習網絡使用的數據集,能夠為混雜文本型自然圖像的水印去除增添一份新的學習數據。雖然本文方法對于各位置水印可以很好識別,但也有部分不足之處。因為利用顏色特征進行二值化處理,當水印文本與周邊底色高度相似,則無法進行高效區分,會產生模糊效應,減弱水印去除的效果。