姚寧寧,董春麗,陳興榮,韓慧霞
(1.滁州學院 數學與金融學院,安徽 滁州 239000;2.中國地質大學 數學與物理學院,湖北 武漢 430074)
由于具備過程可信和去中心化兩大特點,區塊鏈能夠在多利益主體參與的場景下以低成本的方式構建信任基礎,旨在重塑社會信用體系[1]。伴隨著以太坊等開源區塊鏈平臺的誕生以及大量去中心化應用的落地,區塊鏈技術在更多的行業中得到了應用。
中國政府近年來也積極部署區塊鏈技術研究與應用創新,不斷提升區塊鏈研究定位。2019年習近平總書記在主持中共中央政治局第十八次學習時強調:“要把區塊鏈作為核心技術自主創新的重要突破口,加快推動區塊鏈技術和產業創新發展”。2020年區塊鏈產業政策迎來井噴式增長。截至2021年,中央、各部委及各地方政府發布區塊鏈相關政策至少700部,較2019年上漲近8倍。在中央號召下,各地積極響應紛紛出臺區塊鏈相關政策,扶持區塊鏈產業發展。
學術界對區塊鏈的研究也在開展,以中國知網期刊數據庫為例,2015年前發表的區塊鏈相關文獻不足百篇, 而近三年呈現指數級增長。作為新興研究領域,了解當前研究進程、剖析未來研究趨勢尤為重要。以往針對區塊鏈文獻進行梳理,其研究大致可以分為兩類:一是綜述類技術原理研究,該類文獻一般從定性分析的角度,論述區塊鏈的概念原理、核心技術、研究現狀、現存問題和未來趨勢。如袁勇區塊鏈技術研究綜述:原理、進展與應用[2];曾詩欽等設計了一個層次化區塊鏈技術體系,將現有針對區塊鏈的研究納入該體系中[1]。二技術原理應用研究,區塊鏈技術的應用已經從最初數字貨幣延伸到金融領域,并逐步發展壯大擴展到情報科學、教育、醫療、征信、政府管理等社會生活中[3-7]。應用型研究文獻是從某一方面入手,研究區塊鏈技術在該領域的初步應用,難以直觀了解區塊鏈研究框架、熱點主題和未來趨勢,當然國內外也有學者通過文獻計量來研究,通過對現有文獻的可視化計量工具如Citeplace、Bicomb、Ucinet等從文獻時間序列、主要研究機構、學科分布、熱點主題挖掘的視角進行論述[8-12]。但以上文獻主體研究內容大體都是基于文獻基本特征→基于關鍵詞詞頻和共現的熱點分析→未來展望思路展開。該類研究能夠在一定程度上揭示區塊鏈研究概貌,但以關鍵詞的詞頻或中心度表征的研究熱度只能代表研究者的關注點,卻并不能完全有效聚焦凝練研究主題,為此,本文在以上研究的基礎上,創新地增加了從文獻共被引視角對國內區塊鏈領域共被引文獻進行分析,從而挖掘當前的研究熱點主題。
期刊以“時間性強,報道及時,內容廣泛,觀點新穎”著稱,因此為保證分析結果的可信度,在中國知網期刊數據庫中進行文獻檢索,期刊來源類別設定為“核心期刊”,經過預分析比較,選擇主題為“區塊鏈”為檢索詞進行準確檢索[12],檢索最新時間是2021年,共檢索出2 774篇相關文獻.剔除與主題無關或者存在撤稿的文獻,最終獲得2 567條有效文獻,檢索到的文獻記錄下載并以“完整記錄及引用文獻”的格式保存為一個純文本文件,作為本論文分析數據的樣本文獻。
CiteSpace 軟件系統是由美國華人學者陳超美(Chaomei Chen)博士開發,應用于科學和技術領域[13],通過直觀的知識圖譜,識別并展現該領域的熱點關鍵詞、研究進展和前沿方向的一款知識可視化軟件。本文將中國知網期刊數據庫和中國科學引文數據庫中檢索區塊鏈主題文獻進行分時動態的可視化圖譜分析,主要包括被引文獻以及關鍵詞等分析科學展示知識的宏觀結構及其發展脈絡。
1973年, 美國情報學家Small首次提出了文獻共被引(Co-citation)的概念, 作為測度文獻間關系程度的一種研究方法。后經不斷發展,文獻共被引正式定義為兩篇(或多篇論文)同時被后來一篇或多篇論文所引證,則稱這兩篇論文構成共被引關系[14]。通過文獻共被引分析,既可以得到高被引文獻,也可以得到聯系緊密文獻(即經常一起出現在后來發表的多篇文獻中),則這些共同被引用的文獻一定在內容上具有相似性,共被引越強大說明兩者在內容上越相似。利用CiteSpace聚類功能進行文獻共被引的聚類分析,挖掘相似文獻的共同主題,這些主題便能反映一定時期該領域的研究熱點。考慮到中國知網期刊數據庫中進行文獻檢索的文獻,缺少參考文獻部分,故本部分樣本文獻摘自中國知網文獻“CSSCI”文獻類別。
為了挖掘區塊鏈研究熱點,在文獻共現圖基礎上,根據CiteSpace聚類算法log-likelihood-ratio(LLR)繪制成文獻共被引聚類圖譜如圖1所示,網絡中共有360個節點,971條連線,圖中每個節點代表一個被引文獻,節點的大小顯示共被引頻率(圖中顯示被引文獻頻率閾值為80)。節點越大,共被引頻率越大;線條代表著被引之間的聯系,表示一起出現在后來發表的多篇文獻中,中心度反映該被引文獻所起的橋梁作用,關鍵詞中心性越大,表示與其它關鍵詞聯系越緊密,也就越重要。另外Modularity被用來評價圖譜網絡模塊化指標,其值介于0至1之間,大于0.3表示網絡聚類社團效果顯著[15],圖1中為0.74,表示聚類效果很好。

圖1 文獻共被引聚類圖譜
系統初始聚類事每個類別中包含的成員樣本至少是10個以上,否則該類別實際意義,為更精確地對樣本分析,本文將類中包含的成員樣本增加到17個,聚類結果顯示共有11個類別,用不同顏色表示,其中輪廓圖(Silhouette)系數都在0.8以上,表示聚類成員內部之間比較緊簇,聚類效果較好,具體信息可從軟件導出,整理成表1。

表1 聚類主要信息表
聚類結果顯示共有11個類別,在圖中用不同的顏色表示。結合關鍵詞聚類結果分析,發現區塊鏈領域的研究熱點幾乎集中在“法定數字貨幣”“著作權”“供應鏈金融”“技術風險”“國家治理”“互聯網金融”和“精準扶貧”等,具體體現在以下三個方面:第一,區塊鏈加速與實體經濟結合,多場景賦能產業鏈迭代升級;第二,區塊鏈商業模式更加成熟,中心化與去中心化的界限趨于模糊;第三, 區塊鏈被納入法治框架,相關標準體系更加健全。
突發事件檢測是一種用于檢測一定時期內的重要信息的分析工具[16],為了更深層次挖掘區塊鏈典型研究熱點,進行引用文獻突現分析,高強度爆發的文獻可以從反映當前該領域的個別極大熱點。圖2顯示了前12名CiteSpace在2016年至2020年期間檢測到最強參考藍色部分表示時間間隔,紅色部分表示時間間隔引用發生的時間段。圖2突發檢測可以分為兩個階段,在第一階段期(引用時間段2017-2018年),圖中前7篇引文都是在該時間段爆發的,共持續了一年,是此期間的研究熱點文獻。其中最大引文爆發強度4.29來自袁勇2016年在自動化學報發表的一篇論文,該論文提出了區塊鏈系統的基礎架構, 在此基礎上闡述了區塊鏈基本原理,技術與應用現狀,最后介紹了基于區塊鏈的平行社會發展趨勢[2]。在第二階段期(引用時間段2018-2020年),即圖2靠后的5篇被引文獻,其中爆發強度較大是譚小荷2018年在新聞界發表關于區塊鏈驅動下的新聞商業模式創新[17]和聶靜2017年基于區塊鏈的數字出版版權保護的研究等[18-19],此階段突現文獻主要體現在區塊鏈涉及多媒體行業如新聞業、數字出版等迅速發展,一直持續到2020年且可能持續更久,此階段爆發的文獻可以反映當前該領域的研究熱點。

圖2 最大引文爆發強度(前12)
知識可視化軟件 CiteSpace有兩種顯示共現網絡圖譜的視圖方式,分別為聚類視圖和時區視圖。時區視圖的顯示突出共現網絡節點隨時間變化的結構關系[14],表示某一領域研究主題主要研究內容隨時間變化關系,用來反映某一時間段內的研究前沿。
運行 CiteSpace軟件得到區塊鏈關鍵詞共現網絡節點的時區視圖,如圖 3所示,圖中共有 272個節點,377 條連線,圖中最底部對應的時間表示該關鍵詞是在分析的數據集中首次出現年份,最左邊對應是2014年,最右邊對應是2022年,共9個年份區間。
通過圖3顯示,區塊鏈節點是所有節點中最大的,在2015年國內首次出現,之后隨著時間相繼衍生出多個主題。由于2016-2018年國內相關核心期刊發文量較少,而在2019年區塊鏈相關論文實現大爆發,首次出現多個主題的相關關鍵詞如智能合約、共識機制、去中心化、人工智能、大數據、物聯網、聯盟鏈、數字貨幣、隱私保護、供應鏈金融、數字經濟、金融科技等高頻關鍵詞,這些表示2019年出現的新興前沿主題。到2020年涉及的主題高頻關鍵詞如共識算法、以太坊、供應鏈、圖書館、訪問控制,加密貨幣、金融監管、技術賦能等。結合圖3整理出 2021-2022年新興前沿主題統計可以反映當前區塊鏈研究新興趨勢,如表2。

表2 2021-2022年新興前沿主題統計

圖3 區塊鏈關鍵詞主題時區圖(2014-2022年)
從2021年首次出現的相對高頻關鍵詞如非對稱加密、社交網絡、密碼學、智能媒體、融資模式、私人數字貨幣、數字人民幣等可以看出,隨著區塊鏈技術和要素融合趨勢的加強,數據和資產、數據和信用的融合將成為新的方向,區塊鏈開始“脫虛向實”,區塊鏈的金融屬性也逐漸向產業屬性轉化,在“智能合約+平臺”的基礎上實現規模化、網絡化落地。在2022年首次出現的關鍵詞有區塊鏈模型、協同分工、農機設計、創業孵化、數字化設計等。谷曉婷在農機數字化設計平臺上引入了創業孵化區塊鏈模型,對于提升農機產品的設計和研發效率具有重要意義[20]; 湯尚提出基于區塊鏈的圖書館數字閱讀推廣技術框架[21], 通過面向數字閱讀的區塊鏈共識機制激勵策略促進用戶積極閱讀與創作,形成一個良性循環的閱讀生態圈。這在某種程度上證實了區塊鏈領域從理論轉變為滿足市民的生活需求實際場景和應用的重要研究趨勢。
借助文獻計量方法研究分析了截至2021年中國知網期刊數據庫關于區塊鏈的有效期刊論文,自2017年以來,區塊鏈方面的出版物數量呈快速增長趨勢,目前處于欣欣向榮階段。在文獻共現圖基礎上,對區塊鏈領域研究熱點挖掘,根據LLR聚類算法繪制成文獻共被引聚類圖譜,聚類結果顯示共有11個類別,按大小排序分別是法定數字貨幣、著作權、供應鏈金融、智能合約、金融風險、技術風險、國家治理、互聯網金融、精準扶貧、真實性、有價證券,反映了區塊鏈當前領域的研究熱點。為了更深層次挖掘區塊鏈典型研究熱點,進行引用文獻突現分析,高強度爆發的文獻可以從反映當前該領域的個別極大熱點,結果表明,在當前時期在爆發強度較大的突現文獻主要涉及多媒體行業如新聞業、數字出版等,較大爆發強度從2018年持續到2020年且可能持續更久,此階段爆發的文獻可以反映當前該領域的研究熱點。
從關鍵詞時區視圖視角探析區塊鏈領域研究前沿,運行 CiteSpace軟件得到區塊鏈關鍵詞共現網絡節點的時區視圖,在2021年、2022年首次出現的高頻關鍵詞表明隨著區塊鏈技術和要素融合趨勢的加強,數據和資產、數據和信用的融合將成為新的方向,區塊鏈開始“脫虛向實”,區塊鏈的金融屬性也逐漸向產業屬性轉化,在“智能合約+平臺”的基礎上實現規模化、網絡化落地,進一步證實了區塊鏈領域從理論轉變為滿足市民的生活需求實際場景和應用的重要研究趨勢。
盡管本文確定了主要的研究熱點和前沿,但對于每個研究主題,如安全性、區塊鏈標準與最新技術的比較以及區塊鏈技術的全球商業影響等,仍需要更深入的信息。需要指出的是,CiteSpace已被用于許多文獻計量研究,其分析結果穩定可靠,幾乎不受主觀經驗的影響。