盛 艾
(中國美術學院圖書館,浙江 杭州 310002)
隨著信息技術的迅速發展,美術作品的載體由傳統紙質形態向數字化形態轉型。一方面,傳統的美術作品被數字化,建成相應的特色數據庫,如中央美術學院的年畫招貼畫庫、天津美術學院圖書館的世界美術作品賞析庫等;另一方面,當前功能豐富的軟件應用允許創作者直接生產數字美術作品。同時,針對數字化美術作品資源建設的項目也不斷推進,如全國高等藝術院校圖書館專業委員會的“區域數字藝術圖書館”項目、廣州美術學院的“數字化美術與設計文獻資源服務體系建設”項目等[1]。
隨著數字化美術作品數量的不斷增加,如何檢索并利用美術作品成為研究者關注的重點,有關美術作品檢索效率和檢索質量的研究不斷深入,成果涌現。為全面了解當前的研究現狀,筆者將對數字化美術作品檢索領域的研究文獻進行較為系統的統計與分析。
以中國知網(CNKI)學術期刊網絡出版總庫為數據源,檢索策略為關鍵詞=(“美術”or“書畫”or“壁畫”or“草圖”)and“檢索”,匹配模式為“精確”,時間截止到2014年6月31日,經篩選去除重復、非學術性及相關度不大的文章,最終檢得數字化美術作品檢索研究相關文獻71篇。
研究論文的數量是衡量某領域發展水平和研究程度的一個重要指標。通過對檢出文獻的發表時間進行統計,可以大致了解數字化美術作品檢索的研究趨勢。如圖1所示,國內對數字化美術作品檢索的研究開始時間較早,第一篇研究論文出現于1998年,之后隨著時間的推移逐漸增長,但速度不快,這主要與該領域研究技術要求較高有關。隨著數字化技術的不斷推進,數字化美術作品檢索將會得到越來越多的關注。

圖1 數字化美術作品檢索研究文獻年度分布

表1 數字化美術作品檢索研究文獻刊載期刊
由表1可見,71篇數字化美術作品檢索研究文獻中,在圖書情報類期刊上發表了19篇,占26.76%,其中包括國內權威期刊《中國圖書館學報》。其他期刊發表了26篇,占36.62%,比重較大,其主要分布在計算機和軟件科學領域,這主要是由于數字化美術作品檢索與圖像描述和檢索技術相關聯。值得注意的是,該領域博碩士論文的比重較大,有14篇,達19.72%,包括北京交通大學、北京郵電大學、中國科學院研究生院、浙江大學等高校,部分為計算機和軟件科學領域重點實驗室,說明數字化美術作品檢索的技術水平要求較高。
在71篇數字化美術作品檢索相關領域研究文獻中,共涉及關鍵詞279個,平均每篇3.93個關鍵詞,大多數文獻含2~5個關鍵詞。高頻關鍵詞能反映特定領域的研究現狀和研究特點,我國數字化美術作品檢索領域文獻中頻次排名前十的關鍵詞分布見表2。

表2 頻次排名前十的關鍵詞
當前數字化美術作品檢索研究主要集中在兩個方向:一是數字化美術作品的檢索技術和策略;二是不同類型美術作品的檢索方法。
數字化美術作品呈現的方式多為圖片形式,因此圖像檢索技術是數字化美術作品檢索的基礎。圖像檢索技術可以分為兩大類:一種是基于文本的圖像檢索(Text-Based Image Retrieval,TBIR),一種是基于內容的圖像檢索(Content-Based image Retrieval,CBIR)。基于文本的圖像檢索在之前以關鍵字詞、語句的形式實現從圖像到文本的映射,用戶檢索時是以文字描述作為查詢條件的,其實質是將圖像檢索轉換為文本檢索的形式。基于內容的圖像檢索通過對圖像的顏色、形狀、紋理、位置等視覺信息利用特定的算法和技術進行提取,用戶檢索時與其進行相似度匹配,檢索出一致或相似的圖像[2]。
吳靜[3]、孫小平[4]分析了兩種圖像檢索技術的優缺點,基于文本的圖像檢索產生時間較早,可以較為詳盡地描述美術作品的流派、作者、年代、風格等信息,但必須依賴人工標注,需要耗費的時間和精力較多,并且可能會帶有標注人員的主觀偏差。基于內容的圖像檢索能夠依賴計算機技術和特定算法進行圖像信息的自動提取,然而圖像的底層視覺信息和高層語義信息之間存在著差距,這在美術作品中尤為明顯,因此在檢索結果上常常不盡如人意。基于此種現狀,許多學者提出應針對具體的數字化美術作品的特點采用相應的圖像檢索技術方法,在語義網的架構下,利用本體技術對美術圖像進行需求分析,提取其風格、類別及內容等語義信息并進行分類,同時利用推理機實現基于語義的推理和解析,減少人與計算機的“語義鴻溝”,提高檢索質量。
關于數字化美術作品檢索策略的研究主要圍繞檢索過程展開,為相關用戶提供指導與教育。褚寧琳[5]介紹了美術信息檢索的主要技術和方法,并羅列了一些美術網站以供利用。王杭[7]討論了如何在網絡環境下滿足用戶個性化信息的檢索策略。周萍[6]、王杭[7]等學者則從搜索引擎、專業信息網站、數據庫等入手,介紹了美術與設計信息在互聯網上的分布及檢索的策略,并對比分析了各策略的優劣。
美術作品類型十分豐富,不同類型的數字化美術作品的檢索方法不同。
2.2.1 國畫的檢索方法
國畫是中國古代繪畫藝術的主要表現形式,從古至今有大量的畫作問世。黎宇帆等[7]根據國畫的差異性和相似性特點,應用向量機(SVM)算法將國畫分為山水畫、人物畫、花鳥畫、竹子畫和鞍馬畫這5種類型;并將數字化圖像轉化為HSV模式,對H、S、V分量進行非等間隔量化,組成一維特征向量;同時結合慣性比形成圖像顏色特征信息,使用灰度共生矩陣算法獲取紋理特征信息;最后,通過對比網格搜索、遺傳算法(GA)、粒子群算法(PSO)的參數尋優方法,應用網格搜索法對國畫圖像進行分類,并對比了BP神經網絡和判別分析算法的分類效果,證明SVM對國畫進行分類的正確率能達到97%,能有效提高數字化國畫作品的檢索效率。關曉惠[8]提出了一種國畫自動分類與檢索系統,其根據基于統計Gabor小波特征和顏色直方圖的國畫分類算法,統計畫作的顏色和紋理特征,并構建出一個特殊的特征空間,用戶在這個特征空間里實現檢索。鮑泓[9]針對國畫圖像語義則提出了一種基于低秩矩陣分解理論的圖像顯著區域提取算法,其原理是從低秩矩陣分解的理解角度出發,將圖像的語義內容劃分為顯著和非顯著兩部分,非顯著部分一般對應的是背景或干擾物,顯著部分則具有一個或多個特征的高差異性,該算法與人類視覺注意過程更為一致,能有效挖掘作品特點,提高檢索質量。此外,陳俊杰、杜雅娟和李海芳[10]也設計了國畫圖像語義分類系統,實現國畫圖像低階特征與高階語義之間的映射關系,為數字化國畫作品檢索的實現提供了基礎。
2.2.2 壁畫的檢索方法
壁畫具有極高的歷史價值和美學價值,隨著文化遺產數字化和數字人文的興起,數字壁畫圖像得到大量積累,為其進一步利用和傳播奠定了基礎。該領域最早的研究文獻當屬1998年魯東明和潘云鶴[11]發表的《基于形象語義特征的敦煌壁畫檢索》,該文從壁畫風格出發,探討了體現壁畫風格的基本特征、形象特征和語義特征,在特征的基礎上提出了“符號-符號”、“形象-符號-形象”和“形象-形象”三大類型檢索方式;引進壁畫數據模式、通用的壁畫查詢語言和實現算法,促成特征相互轉換,實現壁畫圖像檢索。梁廣昱[12]則探討了莫高窟壁畫數字圖像的存儲和檢索技術,嘗試基于內容的圖像檢索技術在該領域的應用,采用以HSV色彩空間上的亮度不變量進行基于色彩的圖像檢索的方法,可以在小規模圖像數據庫中僅憑圖像的色彩特征進行與分辨率和亮度無關的壁畫圖像檢索;嘗試進一步提取數字特征來作為索引來加速檢索,可濾掉87.5%的候選圖像,有效減少檢索時間;提出以二值化圖像的不變矩為特征進行基于草圖的圖像檢索的方法,有效實現對草圖和殘損圖像等的檢索。王曉光[13]等人在信息需求理論和圖像元數據的基礎上,對敦煌壁畫數字圖像提出了語義描述框架和領域主題詞表相結合的圖像語義描述方法,闡述了底層視覺特征、對象、場景、行為、情感等語義描述層次及之間的相互關系,試圖填補用戶需求和數字圖像描述之間的鴻溝,滿足用戶圖像查詢和檢索的需要。
2.2.3 古籍插圖的檢索方法
中國自古以來就有“左圖右史”之說,文不足者補之以圖,圖不盡者說之以文,圖文互補,由此也可見古籍插圖的重要地位。然而,一般來說古籍由于年代久遠,數字化掃描的圖像噪聲較多,圖像質量較差,因此在數字化檢索中存在著許多困難。當前有關該領域的研究相對較少,僅有3篇論文:魏宏喜[14]針對蒙古文古籍圖像檢索進行了研究,提出利用離散傅里葉變換將描述單詞圖像的每種輪廓特征向量都變換到頻域空間,滿足大規模文檔圖像檢索問題對檢索實時性的要求;孫清偉[15]對中醫本草古籍的圖像進行了研究,根據調研情況將其分為藥物圖、診斷圖、經絡穴位圖、內景臟腑圖、基礎圖、理論圖、養生練功圖、符咒圖、人物圖、星象圖10類,并對其檢索利用提出了相關建議;楊之峰[16]則論述了大型網站、商業搜索引擎和專題圖像數據庫中古籍插圖數字化檢索的發展狀況及主要的優缺點。
2.2.4 手繪草圖的檢索方法
基于手繪草圖的檢索的概念最早在20世紀80年代被提出,但是由于其線條的多變性和不確定性一直進展緩慢。直到近年來平板電腦、智能手機等觸屏設備的普及,人們可以輕松地在觸摸屏上畫出圖形,相關應用可以根據手繪圖形的輪廓和線條特點在圖片庫里進行檢索,手繪草圖的檢索獲得新的生命力,相關研究不斷增加。李曼舞[17]等利用傅里葉形狀描述方法來統一描述手繪草圖圖像庫和用戶輸入的手繪草圖形狀信息,在取得較好的檢索效果的同時也努力提高用戶體驗。高竹紅等[18]提出一種基于結構圖的草圖檢索方法,在保持圖像大致形狀的基礎上對圖像的輪廓數據進行有效的降維處理,解決了輪廓的起點選擇、旋轉、平移以及縮放等不變性,形成了圖像的標準化形狀描述子,并生成相應的結構圖,提取結構圖的4種特征,分別進行形似性度量。錢晶、汪增福[19]提出了一種基于仿射變換自適應的形狀和骨架特征的手繪草圖檢索算法,采用一種基于傅里葉變換的降維濾波方法對對象進行規范化處理,并以此為基礎提取對象輪廓和區域特征;然后提出一種仿射變換自適應骨架提取算法提取對象骨架,得到骨架樹特征描述子,并提出一種骨架樹匹配算法;最后結合對象輪廓區域和骨架特征來實現草圖檢索。
2.2.5 其他類型的檢索方法
韓立華等[20]在剪紙藝術平臺上結合了基于文本和基于內容兩種圖像檢索方式,引入自動標引技術,以提高圖像檢索的準確率和效率。胡維青、張艷花[21]則在服裝藝術特色圖像庫檢索中使用基于JEPG系數的檢索技術,從查詢圖像中提取信息與索引文件相比較,用于確定查詢圖片與數據庫中相應圖片不同之處。該方法在圖像壓縮時顯示出巨大優勢,原始圖像壓縮過程中獲得的信息將再次被利用,使早期大量的數據刪除成為可能。而劉爽、史萍[22]設計了一種基于文本和內容檢索的美術作品查詢系統,該系統能夠通過用戶輸入關鍵字以及提交查詢作品圖像進行檢索,具有圖像輸入、數據庫管理、圖像處理、圖像檢索等各項功能。
數字化美術作品檢索是在藝術資源數字化建設基礎上發展起來的,由于數字化美術作品的特殊性,其信息檢索需要通過圖片檢索技術實現。當前該領域的研究大部分熱點集中在圖片檢索技術上,包括如何更好地進行圖片視覺、語義信息的描述與提取等,許多學者針對美術作品的特點提出了相關的模型和算法,以期提高檢索結果的效率和質量。因此,數字化美術作品檢索的研究文獻目前主要集中在計算機和軟件科學,其次是圖書情報學領域;研究重點主要在于技術上,較少涉及用戶體驗,有關檢索策略的研究也較為淺顯。
由于科技的發展和用戶的需求,圖片檢索技術在未來將得到更大程度的提升,更多的美術作品將會在數字化檢索方面獲得新的發展和更多的關注。今后在數字化美術作品檢索的研究中,研究者可以更多地從人機交互、用戶體驗等角度切入,以期推動數字化美術作品資源建設和利用的進步。
[1]陸波.藝術類文獻資源數字化建設的方向探索[J].圖書館雜志,2013(5):59-61.
[2]婁海濤.中國書畫印章圖像的提取與識別[D].北京:北京郵電大學,2008.
[3]吳靜.基于本體的畫藏檢索系統設計與實現[D].北京:北京交通大學,2006.
[4]孫小平.基于顏色的圖像檢索在藝術教育中的應用[D].濟南:山東師范大學,2005.
[5]褚寧琳.現代網絡與美術信息檢索[J].南京藝術學院學報:美術與設計版,2002(2):94-96.
[6]周萍.利用Internet檢索美術與設計學信息資源的方法與技巧[J].農業圖書情報學刊,2007(6):112-114.
[7]王杭.例談網絡環境下的個性化信息服務——劉少奇美術作品的檢索方法與過程[J].現代情報,2008(9):119-122.
[8]關曉惠.計算機輔助的國畫:分類、鑒別與系統[D].杭州:浙江大學,2005.
[9]鮑泓.基于視覺感知的中國畫圖像語義自動分類研究[D].北京:北京交通大學,2012.
[10]陳俊杰,杜雅娟,李海芳.中國畫的特征提取及分類[J].計算機工程與應用,2008(15):166-169.
[11]魯東明,潘云鶴.基于形象語義特征的敦煌壁畫檢索[J].計算機學報,1998(11):1022-1026.
[12]梁廣昱.莫高窟檔案數據及壁畫圖象的存儲與檢索[D].北京:中國科學院研究生院,2000.
[13]王曉光,徐雷,李綱.敦煌壁畫數字圖像語義描述方法研究[J].中國圖書館學報,2014(1):50-59.
[14]魏宏喜.蒙古文古籍圖像檢索技術研究[D].呼和浩特:內蒙古大學,2012.
[15]孫清偉.中醫本草古籍圖像研究[D].北京:中國中醫科學院,2013.
[16]楊之峰.試論古籍插圖的數字化[J].江西圖書館學刊,2007(4):118-119.
[17]李曼舞,孫正興,顧慶東.基于輪廓的手繪草圖檢索研究[J].計算機應用,2005(2):344-347.
[18]高竹紅,湯進,羅斌.基于結構圖的手繪草圖檢索[J].計算機技術與發展,2008(3):32-35.
[19]錢晶,汪增福.一種基于規范化形狀的手繪草圖檢索算法[J].中國科學技術大學學報,2010(10):1043-1053.
[20]韓立華,王曉芬,王玉梅.剪紙藝術多媒體交互平臺中的圖像檢索技術研究[J].石家莊鐵道大學學報:社會科學版,2013(4):71-75.
[21]胡維青,張艷花.基于JPEG系數的服裝藝術特色圖像庫檢索[J].青島大學學報:自然科學版,2012(4):39-43.
[22]劉爽,史萍.基于文本和內容檢索的美術作品查詢系統[J].中國傳媒大學學報:自然科學版,2012(3):70-77.