鄧學雄, 楊志成, 朱正海
(華南理工大學設計學院,廣東 廣州 510006)
圖像檢索中的主要問題是“語義鴻溝”。“語義鴻溝”的實質是,人無法向計算機清楚地描述自己對圖像的認知,計算機不明白人是怎樣理解和描述圖像的,人機之間缺少一套“共同語言”,從而導致人和計算機無法溝通。因而解決“語義鴻溝”的關鍵是選擇有效的特征描述語言,能準確描述圖像特征。商標檢索是圖像檢索的一個子問題。其檢索方式主要有類目檢索、文本檢索和內容檢索。由于商標對象的構成復雜多樣,很多商標圖像既不易歸類,也不易通過文本方式來描述。
本研究提出了一種新穎的形狀描述子——字母描述子,以其來描述圖像。所謂“字母描述子”就是利用拉丁字母的物象、抽象、意象等性質,將字母作為描述語言對圖像進行描述編碼和檢索。該方法符合人對圖像(圖案)的理解方式,并且突破了不同語言的限制,在不同使用人群中具有的魯棒性,適用于多語種環境下的檢索。比如o代表“圓”,l代表“直線”,是人類共同的認知。在人和計算機之間搭建了一座橋梁,人可以將圖像的有效特征用“字母描述子”向計算機方便地傳達自己的描述,計算機也可以很好地提取和理解這些特征。基于“字母描述子”的形狀特征描述,可以給圖像增加一類語義標簽,從而改變商標檢索的“無從下手”的困境,也為“語義鴻溝”問題提供了一個新的解決思路。
商標和文字同源,是由原始的圖畫、符契發展而來。兩者在描述思維和描述方法上有共同之處。有研究[1]總結了漢字和字母文字的結構:字素(筆劃或字母)→文(偏旁部首或詞綴詞根)→字(單字或單詞)(該公式中“文”、“字”定義取自許慎《說文解字》)。商標也有類似結構和基本元素,如點、線、面是商標視覺符號最基本的構成元素。通過分析這些基本元素的特征以及元素之間構成的規律,為商標檢索中的有效特征分析提供科學可行的依據。商標的構成和表現手法,直接關系到商標的視覺形態以及對商標的認知。
在人類的圖像理解系統中,底層的圖像描述通過感知分組[2]分層次地不斷組合,最終獲得一個能夠被推理過程使用的有意義的圖像表達,即構成圖像的主要特征。圖像識別是以圖像的主要特征為判斷依據的。對于熟悉的圖形,如果掌握了它的主要特征,就會把它當作一個單元來識別,而忽略它的細節部分。這種由孤立的單元材料組成的整體單位叫做“組塊”。
經過對大量商標圖像進行分析,我們認為商標圖像具有組塊特點。在此,我們將商標的結構分為 3個特征群:① 幾何特征,包括直線、弧線、圓等;② 交點特征,包括A型交點、Y型交點、X型交點;③ 邏輯特征,包括對稱、平行、全包圍等,如圖1所示為商標結構的部分特征形式。

圖1 商標結構的特征
本研究隨機選取了一批著名企業的商標進行統計,得到如下特征統計數據,見表1。我們將超過25%的特征作為顯著特征,包括:直線、弧線、折線、圓、A型交點、Y型交點、X型交點、對稱、平行、全包圍等,也就是說大部分的商標都可用這些結構特征進行描述。

表1 商標構成的特征統計
將商標解構成多個組塊,提煉出基本特征,并用字母作為有效的特征描述語言,向計算機傳遞商標的形狀特征,這就是本研究——字母描述子的基本理論。
原始字母本是埃及象形字[3],經過希臘文字、拉丁文字,演化到現代歐洲文字。現代字母具有豐富的物象、抽象和意象含義,以及靈活的描述能力。雖然與起源字母的形體、名稱、含義不一定存在嚴謹的對應關系,但是,其象形、象形背后的抽象及意象,以及文字構造的思維方法保留了下來。
字母能不能作為一種有效的語言來描述商標,是由字母本身的含義決定的。已有研究[1,4]通過大量事實論證了字母具有象形的屬性,比如:Oo象“日”,Cc象“月”,Mm 象“山”,Yy象“河”,Rr象“火”,Aa象“人”;并且,由象形的字母組成的字綴、字根以及整字仍然帶有象形的痕跡,比如:av象“鳥”,cl象“抓”,eye象“眼睛”,bed象“床”,bud象“花”。還有研究[5]分析了英語原始字母宏觀的傾向性語義,比如,H與“隱蔽”、“隱藏”有關,N與“否定”、“連接”有關。
經過深入系統地分析,我們對 26個字母含義作了歸納總結,表2列出了其中部分字母的含義。表中:
物象:也稱具象,是對客觀事物的如實刻畫。
抽象[6]:是指對事物非本質因素的舍棄和對本質因素的抽取。抽象具有概括性。
意象:物象和抽象事物的屬性,如形狀、顏色、聲音、動作、位置、方向、出現時間、影響等。

表2 部分字母的物象、抽象、意象含義
單個字母含有較大的信息量,且字母之間具有明顯的差別性,其外形和構造保留了最簡潔、最具代表性的特征,可以用來描述圖像特征,尤其是簡練的商標圖像,形成字母描述子。如果用字母對商標圖像特征編碼,就可以用字母描述子對商標進行檢索。根據以上的研究和分析,本研究總結出的字母描述子如表3所示。

表3 字母描述子
即商標圖像經簡化處理后,其結構特征均可以簡單地用 l、c、o、A、Y、X、M、E、P、O等拉丁字母來描述,即形成特征碼。
本研究開發了一個用于商標圖像檢索的系統,主要有商標的導入、預處理、特征檢測、特征編碼和檢索等功能。其應用過程是:
(1)將導入的商標圖像進行預處理,即使用細化、濾波、腐蝕、膨脹、開閉等算法,去除冗余或干擾信息。
(2)將預處理后的商標特征檢測出來,并自動編寫特征碼(用字母描述子表示)。
(3)將所生成的特征碼作為文件名,保存該商標圖像。
(4)重復以上步驟,建立商標圖像庫。
(5)輸入檢索碼(字母描述子表示的特征碼),在圖像庫中檢索出相應的商標圖像。
以下為應用實例,導入一商標圖像,經預處理和特征檢測后,即自動編碼:IoAYXMEPO,并將編碼“IoAYXMEPO”作為文件名保存該商標圖像,如圖2所示。

圖2 商標的編碼
在檢索時如輸入檢索碼:IoME,在商標圖像庫中,即可檢索出相匹配的商標圖像。其結果按匹配度從大到小排列,如圖3所示。

圖3 商標的檢索
以上的檢索方法進行了查準率、查全率及誤檢率作了統計,結果如表4所示。表中的數據表明,本研究提出用字母描述子對商標特征進行描述、編碼和檢索的方法具有一定的實用意義。

表4 查準率、查全率及誤檢率的統計
針對“語義鴻溝”問題,本研究提出了“字母描述子”概念,以此作為商標的有效特征描述語言,利用拉丁字母來對商標圖像進行描述和檢索。這種檢索方式較為方便,更接近自然語言,符合人的經驗,在圖像檢索方面作了新的嘗試。但“字母描述子”作為特征對商標圖像進行編碼和檢索的方法,目前只適用于小數據量的范圍。除了以上所提出的10個描述子外,其他16個字母有是否待于加以利用;還有字母與數字是否能相結合以增加組合,完善圖像的描述體系等,都有待于進一步的研究。
[1]袁 立. 字母文字與漢字同構象形論[J]. 北京社會科學, 1999, (2): 151-158.
[2]Qasim Iqbal, Aggarwal J K. Appling perceptual grouping to content-based image retrieval: building images [J].International Conference on Computer Vision and Pattern Recognition, 1999, (1): 42-48.
[3]伊斯特林. 文字的產生和發展[M]. 北京: 北京大學出版社, 2002: 284.
[4]袁 立. 字母文字象形論史證鉤沉[J]. 北京社會科學, 2000, (2): 151-157.
[5]戚建平. 論英語原始字母宏觀傾向性語義[J]. 信息工程學院學報, 1996, 15(1): 55-61.
[6]李敏艷. 淺談抽象藝術[J]. 中國商界, 2008, (7):277.