張 亞,賈振軍
(1.中國人民公安大學研究生院,北京 100038;2.中國人民公安大學偵查與刑事科學技術學院,北京 100038)
大數據時代,各種互聯網智能設備的不斷發展和普及[1],如何保護個人隱私不外泄逐漸成為當下的熱門議題,與之相關的生物特征識別技術蓬勃興起。生物特征識別技術是一種基于人臉、指紋、血管模式或擊鍵、步態等特征的身份認證方法[2],相較于傳統的密鑰技術具有更高的安全性能,而其中的指靜脈識別由于具有采集設備便攜、無接觸、抗攻擊能力強、活體等其他生物特征所不具有的優勢[3],成為相關學者的研究焦點,發展迅速。目前,指靜脈識別作為第二代活體生物特征識別技術[4],最先在全球開始產業化應用,發展前景廣闊,許多國家都致力于指靜脈識別的相關研究,成果顯著,文獻頗豐。而文獻是科研信息的載體,具有重要的參考價值,采用統計學的方法對文獻信息進行統計分析,以數據來描述或揭示文獻的數量特征和變化規律,可以幫助作者準確把握該領域的最新信息[5-7]。本文采用文獻計量和可視化分析的方法對指靜脈識別的研究現狀、總體趨勢、高產研究力量分布、主要研究內容、研究熱點及方向進行探究,為相關學者提供參考,輔助科學研究。
采用web of science 核心合集數據庫,選擇關鍵詞finger vein recognition,時間不限,搜索相關文獻,文獻最早可追溯至1999年,將搜索到的452篇文獻的標題、作者、關鍵詞、期刊、機構、出版年份等信息保存為純文本格式,并導入到Excel 中進行儲存,以便后期分析,其中英文文獻447篇,中文3篇,西班牙語1篇,土耳其語1篇。
采用Excel 制表功能對文獻年度發表量、發表形式、涉及學科相關數據繪制圖表進行分析,采用陳超美教授開發的CiteSpace 軟件對導入的txt 數據進行主要研究力量分析、主要研究內容、研究熱點和方向的分析,把握指靜脈識別領域發展新趨勢和新動態。
圖1統計結果顯示,年度文獻發表量呈現波浪式增長,其中,2016-2019年連年穩定增長,總占比50%,文獻貢獻比非常高,大膽預測,近年來文獻發表量將會繼續持續上升。

圖1 文獻發表走勢圖
表1統計結果顯示,以學報論文形式發表的文獻總計230篇,而以期刊論文形式發表的文獻總計223篇,其余7篇為待出版論文和審查階段論文,可見目前論文是文獻的主要發表形式,選擇學報比期刊的可能性略高。

表1 文獻發表形式
圖2統計結果顯示,納入文獻涉及學科25種,其中電子電氣工程、計算機科學人工智能、計算機科學理論方法、計算機科學信息系統、光學位居前列,占比非常高,可見目前涉及學科發展還不均衡,涉及范圍還較窄,具有很大的發展空間。

圖2 涉及學科類別
文獻共涉及240個機構,總體呈“大分散、小集群”分布,如圖3所示,分布密度為0.0052,可見機構間合作關系不密切,缺乏交流。其中引用次數排名最高的是中國山東大學,引用計數為52,第二個是中國民航大學,引用計數為36,第三個是韓國的東國大學,引用計數為20。其后的依次是引用計數為12的韓國全北國立大學,引用計數為11的中國天津大學科技學院、北京大學,引用計數為10的黑龍江大學、杭州師范大學,引用計數為9的哈爾濱工業大學。馬來西亞大學、中國科學院大學、韓國木浦國立大學、挪威基約維克高等學院引用次數均為8,并列第10。位于前列的機構里,中國高校占比近62%,韓國占比近23%,總體來說亞洲地區的貢獻比非常高。圖4突變分析圖譜顯示,近年來,中國山東大學的研究備受矚目,引用頻次高。

圖3 機構分布圖譜

圖4 機構引用頻次突變分析
文獻涉及作者385 個,中國的楊金鋒、尹義龍、楊公平、楊璐、石一華學者,韓國東國大學的Kang Ryoung Park 學者,韓國北立大學的Dongsun Park 博士,奧地利薩爾茲堡大學的安德烈亞斯、烏爾教授,中國的襲肖明、楊居成學者分別位居前10。位于前列的作者均為團隊協作,團隊間合作關系密切,但團隊外缺乏經驗交流,如圖5所示。

圖5 主要作者分布
文獻共涉及44個國家,分布密度為0.037,國家間合作關系較為密切。表2統計結果顯示,中國的引用頻次遠超其他國家,穩居首位。印度、韓國、馬來西亞、美國、奧地利、挪威、意大利、瑞士、阿爾及利亞引用頻次相繼位居其后。表3數據統計顯示,在中介性層面,中國、美國、馬來西亞、英國、意大利、瑞士、韓國、印度、挪威、阿爾及利亞中介性數值依次位居前列。與表2相比,可以發現排名發生了巨大的變化,還新增英國,可見引用頻次高不代表該國家在指靜脈識別發展過程中的中介性強。表4統計結果顯示,在創新性層面,英國、中國、瑞士、馬來西亞、美國、印度、意大利、韓國、挪威、突尼斯位居前列。

表2 國家引用頻次

表3 中介性統計表

表4 Sigma值統計表

0.10 印度 5 0.09 意大利 2 0.06 韓國 5 0.05 挪威 5 0.05 突尼斯 1
圖6關鍵詞共現分析聚類結果顯示,指靜脈識別的主要研究內容為局部二值模式、指靜脈融合、指靜脈驗證、指靜脈圖像、圖像增強、線性判別分析、卷積神經網絡、靜脈識別、指靜脈、手指幾何識別,其中融合和卷積神經網絡這兩個主要研究內容的平均年份分別為2016和2017年。

圖6 關鍵詞聚類分析
圖7關鍵詞時區分析結果顯示,關鍵字引用次數排名最高的指靜脈識別自2004年開始出現一直引用到現在,引用次數排名第三的多模態生物特征首次提出在2006年,而關鍵字提取引用次數第二,在2008年首次提出。引用次數排名第四的局部二值模式首次出現在2011年,引用次數排名第五的圖像增強首次提出在2008年,排名第六的融合首次提出在2010年,排名第七的驗證首次提出在2004年,排名第八的系統首次提出在2014年,排名第九的分類首次提出在2009年,排名第10的卷積神經網絡首次提出在2016年。

圖7 關鍵詞時區圖
圖8統計結果顯示,近年來文獻共引分析的主要內容為靜脈紋理、結合各向異性擴散、使用深度神經網絡、基于卷積神經網絡的手指靜脈識別、準確的手指靜脈、二叉樹模型、指關節、基于熵的歐氏距離、探索手背靜脈模式、圖像模糊增強;作者共引分析的主要研究內容為靜脈、生物特征、多生物特征、局部編碼、區間類型2模糊集、指關節、掌紋。

圖8 2015-2020年文獻共被引分析(左)、作者共被引分析的主要研究(右)
圖9統計結果揭示了近年來主要研究內容的時間發展,可見局部編碼、靜脈識別算法、canny 邊緣檢測、指關節、二元模型決策級融合、卷積神經網絡、全視角3D 手指靜脈驗證技術一直是當前研究的主要內容,而特定質量的手靜脈識別系統自提出后大于2019年沒有了熱度,不再是研究重點內容。

圖9 2015-2020年關鍵詞聚類時間線圖
綜合上述分析,可見當下的研究熱點為二元模型生物特征的手指靜脈融合、深度學習與神經網絡相結合、3D 手指靜脈識別技術、圖像增強技術。
當下,互聯網技術發展迅速,保護信息安全刻不容緩[8],大膽預測,多模型生物特征的手指靜脈融合技術、多視角下的手指靜脈識別技術將是未來的研究重點。
文章采用文獻計量和可視化相結合的方法,通過對1999-2020年全球指靜脈識別相關文獻的年度發表量、文獻發表形式、涉及學科、重點機構、主要作者、主要國家、關鍵詞聚類的分析,預測了未來的發表趨勢,高產研究分布、主要的研究內容及發展脈絡,通過對2015-2020年文獻共引分析、作者共引分析、關鍵詞聚類時間線的挖掘,多角度分析了當下的研究熱點,預測了研究方向。此外,文章也存在一定的局限,2020年文獻發表的時間尚短,對統計結果有一定程度的影響。