兌紫璇



摘要:該文基于CiteSpace并利用文獻計量法,采用關鍵詞共現(xiàn)網(wǎng)絡及突現(xiàn)詞分析,分析了計算機視覺領域國內(nèi)外近十年的研究熱點與研究前沿。研究結果顯示,該領域的熱點研究方向為圖像處理、圖像分割、特征提取、圖像識別、三維重建等,而計算機視覺對深度學習、卷積神經(jīng)網(wǎng)絡的應用成為該領域的研究前沿趨勢。
關鍵詞:CiteSpace;計算機視覺;知識圖譜;文獻計量法;機器視覺
中圖分類號:TP391 文獻標識碼:A
文章編號:1009-3044(2020)08-0216-03
1 背景
隨著計算機視覺領域的發(fā)展,越來越多的知識信息進入了研究者的視野。海量的文獻數(shù)據(jù)在給人們提供了豐富研究資源的同時,也為研究增添了難度。由于數(shù)據(jù)繁多復雜,人們往往不能對信息進行全面分析,在大量文獻中難以抉擇關鍵信息。利用文獻具有的可計量性,文獻計量法采用數(shù)理統(tǒng)計學方法,可以對計算機視覺這一領域的學術現(xiàn)狀和發(fā)展趨勢進行定量描述、評價和預測[1-2]。并且隨著CiteSpace、SCI2、VOSviewer等工具陸續(xù)出現(xiàn),為信息可視化提供了可能,我們可以利用文獻圖譜并基于文獻計量學的方法,對計算機視覺領域進行共引分析、共詞分析和聚類分析等,對信息進行全面分析,發(fā)現(xiàn)大量數(shù)據(jù)之間的聯(lián)系,理清該領域演進脈絡,找到研究熱點并挖掘研究前沿[3]。
2 研究設計
2.1 收集處理數(shù)據(jù)
本文分析近十年來國內(nèi)外計算機視覺領域的研究狀況,原始數(shù)據(jù)來源于CNKI,以SCI\EI與CSSCI中2010-2019年的699篇論文為研究對象。其中選擇計算機視覺為主題進行檢索,將篩選結果有選擇的導出,并利用CiteSpace中格式轉換工具將CNKI中導出的數(shù)據(jù)轉換為軟件能夠處理的格式,放入CiteSpace_data文件夾中。
2.2 利用CiteSpace得到知識圖譜
我們利用CiteSpace對收集并經(jīng)過清洗的文獻數(shù)據(jù)進行可視化分析,可得到文獻圖譜。其中本文以共現(xiàn)分析和突現(xiàn)詞分析為主,發(fā)現(xiàn)文獻之間潛在關系并從中獲得信息[4]。引用科學計量學界專家劉則淵教授對CiteSpace的評價“一圖展春秋,一覽無余;一圖勝萬言,一目了然”,可知其可視化方法是文獻計量學與計算機圖像處理的完美結合,其分析結果可為領域的研究提供清晰的指南。
3 計算機視覺領域研究熱點
作為對一篇文章的核心概括,從關鍵詞中往往可了解文章的主題,而一篇論文中的幾個關鍵詞又圍繞文章核心有著緊密的關聯(lián)。共詞分析通過對關鍵詞共同出現(xiàn)頻次以及相互連接的緊密程度進行分析,可以找到該領域各主題之間的關系。在CiteSpace中創(chuàng)建新項目,對導人數(shù)據(jù)進行分析,可得到圖l所示關鍵詞共現(xiàn)圖譜。
可知該關鍵詞共現(xiàn)圖譜中十字標記最大的關鍵詞為機器視覺,表示機器視覺在所有文獻關鍵詞中出現(xiàn)頻次最高。而機器視覺實際是計算機視覺的別名,作為本文的研究對象,可將兩者除去。然后依次為圖像處理、深度學習、圖像分割、特征提取、圖像識別、算法、神經(jīng)網(wǎng)絡、卷積神經(jīng)網(wǎng)絡、模型、分級、目標跟蹤、識別、人工智能、無損檢測等,這些主題構成了在計算機視覺領域近十年間的研究熱門。且可得圖像處理為最中介中心性節(jié)點,說明此關鍵詞與多個關鍵詞相連,是較為關鍵的熱門。線條的粗細代表了關鍵詞之間的聯(lián)系,線條越粗,表示這些主體之間的聯(lián)系越緊密。而對比圖像上方的時間線的顏色與連線的顏色,我們可知這些關鍵詞主要出現(xiàn)在哪一具體的年份。從圖中可知圖像分割、圖像識別、特征提取之間的連線都為紫色,說明這些主題在2010-2013年之間都密切相關。之后我們利用CiteSpace的聚類功能,可以得到如圖2所示關鍵詞聚類圖譜。
該關鍵詞聚類圖譜表示多個緊密關聯(lián)的關鍵詞進行聚類,一共聚成了13類。每一類上都有一個標簽,是聚類中值最大的關鍵詞,分別為人工智能、圖像處理、圖像分割、三維重建、特征提取、深度學習、圖像識別等。標簽從小到大排序,表示聚類中包含的關鍵詞越來越少。有圖分析可知(#0)聚類包含的關鍵詞最多,說明與很多關鍵詞都與人工智能相關。
另外通過Modularity(Q值)=0.6196,可知該聚類結構顯著。而Silhouette(S值)=0.3254.說明該聚類有待于改進,但由于網(wǎng)絡不是過于復雜,反而剪枝后的圖譜嚴重不符合實際,所以可認為該圖譜合理并可用于分析。
將2010-2019年關鍵詞的高頻詞羅列出來如表1所示。
由表1可知在2010-2019年間,除去機器視覺和計算機視覺,圖像處理在計算機視覺領域最為熱門。圖像處理即計算機對圖像進行分析的技術,主要包括進行壓縮、復原、描述等。其主要利用數(shù)學函數(shù)和圖像變化,使圖像完成如平滑、銳化之類的轉換,以之滿足所需。因為計算機視覺處理的核心是圖像,所以兩者密不可分,可認為圖像處理為計算機視覺的一個子集[5-6]。
而圖像分割作為第三熱門的研究主題,其關注的是目標,完成將目標從背景中分離出來的任務,其作為圖像理解的初步操作,是計算機視覺的基礎。從表中還可以看出,圖像識別、三維重建為計算機視覺較為熱門的研究方向,而無損檢測、缺陷檢測、目標跟蹤則為計算機視覺領域較為熱門的應用。深度學習、卷積神經(jīng)網(wǎng)絡也成為計算機視覺應用的熱門算法與模型。
4 計算機視覺領域研究前沿分析
一個研究領域當前的發(fā)展狀況可被定義為研究前沿,具體表現(xiàn)為施引文群組。而研究前沿的共被引聚類則形成了該領域的知識基礎。CiteSpace可通過共引分析發(fā)現(xiàn)研究前沿與知識基礎。而在本文中,利用CiteSpace的突變檢測功能,通過對詞頻的時間分布進行考查,可發(fā)現(xiàn)計算機視覺領域近十年來文獻中的突變術語,并得}H變動趨勢。如圖3為從CiteSpace中得到的突變詞表:
由上圖可知2010-2019年有8個突變詞,分別為攝像機標定、農(nóng)產(chǎn)品、目標跟蹤、神經(jīng)網(wǎng)絡、棉花、深度學習、卷積神經(jīng)網(wǎng)絡、模型。Begin列為這些關鍵詞首次出現(xiàn)的年份,End列為這些關鍵詞最后出現(xiàn)的年份。通過對此表的分析可得2010-2019年計算機視覺領域的前沿演進情況。其中在2010-2012年期間,計算機視覺主要集中于攝像機標定、農(nóng)產(chǎn)品檢測、無損檢測等應用方面,可以發(fā)現(xiàn)這一時間段計算機視覺技術的進步推動了檢測技術的發(fā)展,人們可以利用計算機完成更多基于視覺的分析任務。
而在2017-2019年間,出現(xiàn)了深度學習、卷積神經(jīng)網(wǎng)絡、模型等關鍵詞。這意味著計算機視覺的發(fā)展不僅僅滿足于當前完成的任務,而是向算法設計、更新網(wǎng)絡結構、完善模型等理論與設計層面進行結合與探究來完善基于學習的視覺。其中將卷積神經(jīng)網(wǎng)絡應用于計算機視覺領域是該領域的研究前沿。因為傳統(tǒng)的計算機視覺主要利用特征提取算法如尺度不變特征變換匹配算法、加速魯棒特征算法等從圖像中提取特征,完成邊緣檢測、角點檢測、圖像分割等任務。但由于算法執(zhí)行的效果有時會因輸入圖像的性質(zhì)而不如意,所以人們通過特征工程來預先對圖像進行處理。不同的任務所需要提取的圖像特征不同,使特征工程成為一個復雜困難的問題。而應用深度學習算法的卷積神經(jīng)網(wǎng)絡可對原始輸入圖像完成特征提取的工作,其提取輸入圖像中局部特征,進行訓練學習可得到最正確有效的特征。另外卷積神經(jīng)網(wǎng)絡權值共享降低了網(wǎng)絡復雜性,其特殊的布局在原始圖像輸入網(wǎng)絡時避免數(shù)據(jù)重建的繁雜工作,這些優(yōu)勢可極大的推動計算機視覺的發(fā)展進步[7-9]。目前深度學習領域飛速發(fā)展,各種網(wǎng)絡模、算法逐漸更新,未來計算機視覺與深度學習的聯(lián)系也將更加緊密。
5 結束語
本文通過對2010年-2019年近十年計算機視覺領域國內(nèi)外權威期刊的文獻進行收集、處理,利用CiteSpace得到知識圖譜,同時采用文獻計量學的方法進行分析可得計算機視覺領域的研究熱點方向為圖像處理、圖像識別、圖像分割、三維重建、特征提取等,而目標跟蹤、無損檢測、缺陷檢測等則為計算機視覺領域較為熱門的應用。深度學習、卷積神經(jīng)網(wǎng)絡是計算機視覺應用的熱門算法與模型,成為計算機視覺領域的研究前沿。
由于對文獻的不同選擇將直接影響分析的結論,本文以CNKI庫為基礎,得到的數(shù)據(jù)維度比WoS得到的要少。在選取文獻時還可以WoS得到的信息為數(shù)據(jù)基礎,以保證對研究領域的知識基礎、研究現(xiàn)狀與研究概述有更全面、更準確的判斷與分析。
參考文獻:
[1]鄭文暉.文獻計量法與內(nèi)容分析法的比較研究[J].情報雜志,2006,25(5):31-33.
[2]趙蓉英,許麗敏.文獻計量學發(fā)展演進與研究前沿的知識圖譜探析[J].中國圖書館學報,2010,36(5):60-68.
[3]陳悅,陳超美,劉則淵,等.CiteSpace知識圖譜的方法論功能[J].科學學研究,2015,33(2):242-253.
[4]張福俊,趙文斌,葉權慧,等.機器學習領域研究熱點與前沿演進——基于CiteSpace的可視化分析[J].軟件導刊,2019,18(9):5-8,225.
[5]張五一,趙強松,王東云.機器視覺的現(xiàn)狀及發(fā)展趨勢[J].中原工學院學報,2008,19(1):9-12,15.
[6]王愛民,沈蘭蓀.圖像分割研究綜述[J].測控技術,2000,19(5):1-6,16.
[7]張順,龔怡宏,王進軍.深度卷積神經(jīng)網(wǎng)絡的發(fā)展及其在計算機視覺領域的應用[J].計算機學報,2019,42(3):453-482.
[8]李彥冬.基于卷積神經(jīng)網(wǎng)絡的計算機視覺關鍵技術研究[D].成都:電子科技大學,2017.
[9]盧宏濤,張秦川.深度卷積神經(jīng)網(wǎng)絡在計算機視覺中的應用研究綜述[J].數(shù)據(jù)采集與處理,2016,31(1):1-17.
【通聯(lián)編輯:謝媛媛】