徐彤陽 任浩然 張國標



〔摘要〕[目的意義]圖像包含了豐富、生動的信息,利用圖像檢索技術能夠有效的對大規模圖像信息進行分析、組織和處理,具有重要的實踐意義。近年來,各國對圖像檢索的研究力度不斷加大,有必要對國際圖像檢索文獻進行梳理。[方法過程]本文采用文獻計量方法和CitespaceⅢ可視化工具,對收集Web of Science數據庫中有關圖像檢索領域的文獻進行分析,梳理了文獻時間分布規律、學科分布狀況,并重點從作者、機構和國家和關鍵詞頻的角度探索了國際圖像檢索領域的主要研究力量和研究熱點。[結果結論]通過總結和分析發現:圖像檢索領域的主要研究作者和機構大部分來自于中國;國際作者合作尚未形成較為規模的團隊、美國與中國是圖像檢索領域研究的主要力量;目前的研究熱點主要集中在基于內容的圖像檢索、圖像分類和相關反饋這3個方面。
〔關鍵詞〕圖像檢索;文獻計量;Web of Science
DOI:10.3969j.issn.1008-0821.2017.10.024
〔中圖分類號〕G254927;G250252〔文獻標識碼〕A〔文章編號〕1008-0821(2017)10-0144-07
〔Abstract〕[Purposesignificance] The image contains rich and vivid information,and it is of great practical significance to analyze,organize and deal with large-scale image information effectively by using image retrieval technology.In recent years,the research of image retrieval has been increasing,so it is necessary to sort out the international image retrieval literature.[Methodprocess]By collecting the literatures in the field of image retrieval in the Web of Science database,this paper used the method of bibliometrics and Citespace Ⅲ visualization to sort out and analyze the time distribution of relevant literatures,the distribution of disciplines,and focused on the main research strength and research hotspot in the field of international image retrieval from the perspective of authors,institutions countries and key words.[Resultconclusion]Through the summary and analysis,it was found that most of the main research authors and institutions in the field of image retrieval come from China ;the cooperation of international authors had not yet formed a relatively large-scale team.The United States and China were the main forces in the field of image retrieval.The current research focus was mainly on content-based image retrieval,image classification and related feedback.
〔Key words〕image retrieval;bibliometrics;Web of Science
隨著數據庫技術、互聯網技術以及多媒體技術的不斷發展,數字資源早已不單單以文字的形式存在,互聯網中還有大量的圖像、音頻、視頻等豐富的多媒體資源。其中,圖像資源是客觀對象的一種相似性的、生動性的描述和寫真,是人類社會中最常見的一種信息載體。近幾年,由于博客、論壇、社交網絡、微博等社交平臺的發展,給人們提供了分享和交流的機會,而數據存儲系統和云服務也日益完善,使得圖像資源呈現幾何增長。為了有效的組織、管理信息資源,自20世紀50年代,信息檢索技術就已出現,它被描述為使用戶的信息需求能夠變為最終的有用信息的過程,對社會信息化進程起到了重大的促進作用[1]。圖像檢索作為信息檢索研究領域中的一個分支,對快速在龐大的數據庫中檢索出用戶需求的圖像,提高檢索效率具有重要的研究意義。經過20年的發展,科研人員以人工標注的方式對圖像進行索引,逐漸形成了初步的圖像檢索系統研究體系;90年代初期,圖像資源日益膨脹,以文本的方式檢索圖像出現了效率低、主觀性強和檢索結果差強人意等問題,需要新的方法去解決,因此,新一代圖像檢索系統應運而生。該系統通過提取圖像視覺特征進行查詢,大大提高了檢索的效率,被稱為基于內容的圖像檢索[2]。
近年來圖像檢索研究領域的發展速度很快,得到國內外學者的廣泛關注,并有了豐碩的研究成果。梳理國際圖像檢索領域發展進程并將當前學術研究熱點等特征進行系統的展示顯得尤為重要。國際圖像檢索研究較為完善和成熟,整體來看發展狀況領先于國內,并且近幾年國內對國際圖像檢索的總結性文獻較少。鑒于此,本文采用文獻計量方法對國際圖像檢索領域相關的文獻進行分析,深入探究該領域的研究結構,以期理清國際圖像檢索發展脈絡,為進一步推動國內相關研究的發展提供理論參考依據。endprint
1數據來源與分析方法
Web of science是世界上收錄最全面,具有影響力的學術期刊的數據庫之一,因此本文檢索來為Web of science數據庫。檢索時選擇“題名”字段進行檢索,因為主題檢索會造成大量誤檢,影響數據有效性,構造的檢索式為題名=(image retrieval or image search)and 文獻類型=(ARTICLE OR PROCEEDINGS PAPER OR REVIEW)。檢索時間跨度選擇2002-2016年近15年的文獻,最后使用NoteExpress軟件去除重復和不相關的文獻,共檢索出屬于研究范圍的2 894篇文章。
本文主要采用文獻計量方法和知識圖譜方法對檢索到的數據進行分析。結合兩種方法可以綜合的分析國際圖像檢索論文發表的規律,客觀評價不同國家、機構或作者對該領域的研究現狀和發展歷程,并將圖像檢索領域的研究熱點、趨勢和知識結構等以客觀、形象的可視化方式展現出來。主要工具選擇CitespaceⅢ可視化分析軟件。該軟件適用于分析多元、分時、動態的復雜網絡,是新一代信息可視化技術[3]。
2國際圖像檢索發展概述
21時間分布
研究圖像檢索領域的歷年文獻發文數量可以把握該領域的發展程度和水平,是衡量該領域發展的重要指標,對評價該領域所處的階段、預測發展趨勢和動態具有重要意義[4]。圖1顯示了國際近15年圖像檢索領域文獻發表數量狀況。
圖12002-2016年國際圖像檢索文獻發文時間分布
通過統計分析可得出,國際圖像檢索領域的發展大致經歷的3個階段。第一階段為2002-2005年,由于文本的檢索方式會浪費大量的人力,并且每個人對圖像理解不相同以及其他缺陷,相關學者開始提出了新的基于內容的檢索來滿足用戶的檢索個性化需求,同時隨著互聯網的普及和發展,圖像資源爆炸式增長,迫切需要新的技術來處理海量信息,因此圖像檢索的相關研究逐漸增加,發文量逐年上升。該階段主要提出了圖像檢索系統的概念和實現、基于紋理、形狀和顏色等基本的特征提取方法、相關反饋的概念和方法等內容。第二階段為2006-2009年,該階段發問數量逐年下降是因為圖像檢索技術達到瓶頸,但每年發文量在100篇以上,表明仍然得到學者的持續關注。第三階段為2010~2016年,在互聯網、多媒體技術以及移動端不斷發展的背景和跨媒體檢索、人工智能等技術的推進下,圖像檢索又獲得了廣泛的關注和重視,近幾年發文量迅速增長。
22學科分布
探索國際圖像檢索領域的發展狀況還可以著眼于研究所屬的學科性質,通過深入分析其研究方向,可以揭示不同學科對推動圖像檢索領域的發展所做出的貢獻及應用前景。表1直觀展示了國際圖像檢索科研成果的學科分布情況。
本文統計顯示了發表數量最多的前10位有關圖像檢索的學科領域,表1統計的數據顯示,圖像檢索涉及多種學科,屬于多學科交叉領域。其中,所屬計算機科學的文獻最多,共1 728篇,占總數的5967%,說明圖像檢索領域的發展離不開計算機技術的支持,計算機科學為推動圖像檢索做出了重要的貢獻;其次依次為:工程學875篇占3023%、成像科學攝影技術242篇占8359%、光學226篇占7807%、電子信息136篇占470%、圖書情報科學132篇占456%以及其他交叉學科的文獻等。通過統計不同學科領域的發文數量,我們可以看出圖像檢索領域的文獻廣泛應用于自然科學領域,發展前景廣闊。計算機科學、工程學是該領域的研究的基礎,除此之外圖像檢索還應用于其他各個學科,這為社會發展的方方面面都起了不可忽視的作用。
從表中我們還可以得出,在今后的研究中,進一步了解圖像檢索領域的研究特點和發展狀況時,可以重點從以上學科入手,同時可以借鑒其他學科的研究方法,擴大圖像檢索領域研究的內容。
3主要研究力量
31核心期刊
核心期刊是期刊中學術水平較高的刊物,是進行刊物評價而非具體學術評價的工具。核心期刊對教學科研單位申請高級職稱、基本的核心館藏、申報科研項目、科研機構或高等院校學術水平評估等都具有重要的意義。研究國際圖像檢索領域的核心期刊有助于了解主要發文期刊,把握國際學術研究前沿動態,對今后圖像檢索理論的研究具有指導意義。
依據布拉德福定律,如果科學期刊按其所刊載某一學科論文的數量多少,依遞減順序排列并劃分出一個與該學科密切相關的期刊所形成的核心區期刊區以及、相關區和非相關區,各個區的文章數量相等,此時核心區、相關區、非相關區期刊數量成1∶ n∶ n2的關系。將所有相關文獻劃分為3個區,使每個區的文獻數大致相等。筆者經過統計后,2 894篇圖像檢索的文獻資料共有1245種涉及圖像檢索領域的期刊,均刊載文量為2篇。計算出屬于核心期刊的刊物11種,占全部期刊類別總數的09%,相關區期刊的刊物為120種,占全部期刊類別總數的96%,非相關區域期刊的刊物為1 114,占全部期刊類別總數的894%,它們之間的比率為1∶109∶1013(n約10),并且每個區域發表文獻數量大致相等,符合布拉德福定律。核心區相關期刊刊名及發文數量見表2。
由表可見,期刊《LECTURE NOTES IN COMPUTER SCIENCE》(計算機科學講義)以總篇數327排在第一,發文數量是排在第二名期刊《PATTERN RECOGNITION》(模式識別)的35倍。LNCS于1973年設立出版,至今已發行了8 000多卷,主要涉及人工智能和生物信息等主要領域的研究,LNCS一直與計算及科研院所、眾多知名學者、知名院校和學術團體之間有密切的合作,發表最新的計算機科學和信息技術的研究報告和會議論文等,學術水準較高。期刊《PATTERN RECOGNITION》于1968年設立出版,是最早發行模式識別相關文獻的主要期刊之一,比較注重理論、方法的創新和應用。期刊發表涉及的主要方向有計算機視覺、圖像處理、視覺神經網絡、文本和文檔分析、生物信息學、多媒體數據分析等,因此圖像檢索領域在該期刊的發文量也相對較多。endprint
在核心期刊中,除了以上2種期刊,還有《多媒體工具與應用》、《圖像處理協會》、《神經計算》、《IEEE多媒體事物》、《圖像和視頻檢索程序》和《視覺傳達與影像表現雜志》等期刊。這些核心期刊均屬于計算機領域的期刊,從側面說明計算機科學領域是圖像檢索研究的主要力量。同時,這些核心期刊大多都是有關多媒體檢索、圖像檢索領域的專業期刊,圖像檢索領域發表的相關文獻向專業領域的期刊集中,所以這些期刊屬于核心期刊也在情理之中。
32主要研究機構
研究機構是有明確研究方向和任務,有一定水平的學術帶頭人和一定數量科研人員組成的長期從事研究與開發活動的機構,是科研成果產生的重要來源。本文統計了圖像檢索領域排名前10的科研機構(見圖2)并對其進行分析。
圖2國際圖像檢索領域主要研究機構
從圖2中可以看出,中國科學院以92篇的發文量排在第一,新加坡國立大學和南洋理工大學分別以50篇和48篇的發文量排在第二和第三名。排在前10名的機構還有微軟亞洲研究院、印度理工學院、清華大學、中國科技大學、德克薩斯圣安東尼奧大學、浙江大學和美國國家航天局。通過分析發現:①中國科學院發文量遙遙領先,在圖像檢索領域占有一定的地位,其它機構發文數量相差不大,表明機構之間在圖像檢索領域之間研究水平差距較?。虎趫D像檢索領域發文量排在前10的機構有8家來自于高校,只有微軟亞洲研究院和美國國家航天局不在高校之列,表明各大高校是研究圖像檢索領域的主力軍;③排在前10的科研機構中,有4家來自中國,在科研機構中占據絕對優勢,表明我國科研機構成為該領域研究的主要群體,對推動圖像檢索領域的發展做出了積極的貢獻。
33作者發文情況
331重要影響力作者
因第一作者在文獻中的貢獻度較大,本文基于SSCI數據庫檢索結果,以第一作者發表的高被引文章數為基礎進行統計,對在該領域發表高質量文章數量總被引排名前10位的作者發文情況進行分析,見表3。
從表3中看出,瑞士保羅謝勒研究所(Paul Scherrer Institut,Switzerland)的Pfeiffer,F作者發表數量雖然僅有1篇,但篇均被引高達877次,發文質量高。該文提出利用低亮度X射線成像,可以有效的表示圖像,能廣泛適用于醫學成像和工業無損檢測等領域[5]。發文質量排在第二的作者Datta,Ritendra來自賓夕法尼亞大學計算機系,在圖像檢索領域主要研究圖像標注[6-7]。另外,排在前10的也有不少海外華人,比如澳大利亞莫納什大學的Liu,Ying,
主要研究圖像檢索中的高層語義檢索;英國倫敦大學伯克貝克學院的Tao,DC和美國西門子公司的Zhou,XS都分析了圖像檢索領域中的相關反饋機制存在的一些問題,并提出了改進的算法。
332核心作者
核心作者是推動學術創新與學科發展的骨干力量,同時也是提升期刊學術影響力和競爭力的重要因素之一。計算核心作者可以采用普萊斯指數,計算公式為:M=0749(Nmax)12,式中M 代表論文篇數,Nmax 代表統計年限中發文數最多的作者的論文數,M為核心作者。據本文統計,發表數量最多的作者論文數量為38,因此,發表了5篇以上的作者為圖像檢索領域的核心作者。15年間,圖像檢索領域發表了5篇以上的核心作者共有250人,發文數量共1 914篇,占文獻總數的61%,大于半數論文,符合普萊斯指數定律。這些核心作者中,大部分作者來自中國,是圖像檢索領域研究的關鍵力量。限于核心作者數量較多,本文列舉了前10位核心作者,具體見表4。
Tian,Q等人共同合作發表了許多有關圖像檢索模型的結構和算法,如提出基于耦合二進制嵌入的單詞模型圖像檢索,融合了顏色和SHIF紋理特征可以有效提高視覺匹配精度[8];構建了基于視覺次模型和反向索引結構,提出了一種由兩個連續的模塊組成的有效的重新排列方法,提高了檢索效率[9]。ZHANG HJ等人從關鍵詞和標簽等語義檢索方向來提取圖像信息,并在檢索中引入了相關反饋方法,改善了檢索效果[10-11]。其他的核心作者也提出了許多有關圖像檢索領域的相關理論和創新,對推動圖像檢索研究發展做出了重要的貢獻。
333作者合作情況
探究科研人員合作情況有利于發現國際圖像檢索領域的主要研究團隊,揭示核心團隊的研究方向、了解當前該領域的前沿動態等。本文通過CitespaceⅢ軟件繪制團隊合著情況,其中圓點間的線條表示發文關系,圓圈表示作者,大小代表發文質量,如圖3。
從圖3看出,國際圖像檢索領域之間的作者整體聯系較為稀疏,主要有3個合著團隊。①Qi Tian為中心的合作網絡,主要研究圖像索引和聚類方法來提高圖像檢索效率,該團隊中Qi Tian來自浙江大學、Zhou WA來自中國科技大學、Huang QM來自中國科學院、Wang SJ來自清華大學;② Tao Dacheng為中心的合作網絡,Tao DC來自悉尼科技大學,主要研究醫學圖像檢索,提出了醫學圖片特征提取的若干方法,如多視點的局部線性嵌入(MLLE)[12],可以有效的降低維數,提升圖像的檢索速度和效率。Shen HL來自北京大學,Wang M與Hua XS均來自中國科技大學,Lu YJ來自西南德克薩斯州立大學;③Zhang HJ為中的合作網絡,其中Zhang HJ、Jing F、Li MJ均來自微軟亞洲研究院,Zhang B來清華大學,主要研究圖像檢索領域中的相關反饋和基于區域的圖像檢索,他們還共同合作發表了許多國際會議文獻。通過分析看出,國內的相關學者努力尋求合作,共同致力于圖像檢索領域的研究并在國際中積極扮演重要的角色。
34國際發文情況
341國際發文發展趨勢
通過統計分析主要國家每年發文量變化,可以了解不同國家地區學術水平的的高低以及變化發展趨勢。本文根據SSCI自有的國家地區統計功能,列舉了發文量排在前6位的國家地區,如圖4。endprint