





摘" 要:文章運(yùn)用科學(xué)知識(shí)圖譜可視化分析的方法,對(duì)2016—2023年期間智能合約的研究成果進(jìn)行量化分析,發(fā)現(xiàn)智能合約的發(fā)文數(shù)量持續(xù)增長(zhǎng),研究者的群體規(guī)模在不斷擴(kuò)大,該主題的社會(huì)關(guān)注度和重要性在不斷地提高。研究主題主要分布在區(qū)塊鏈、漏洞檢測(cè)、以太坊、訪問控制、演化博弈、合同制度、代碼漏洞、去中心化等探究熱點(diǎn)。
關(guān)鍵詞:智能合約;譜聚類分析;關(guān)鍵詞共現(xiàn);研究熱點(diǎn)
中圖分類號(hào):TP301" 文獻(xiàn)標(biāo)識(shí)碼:A" 文章編號(hào):2096-4706(2024)11-0163-04
Hotspot Analysis of Smart Contract Keywords Clustering Based on CiteSpace
HE Feng
(Information School of Yunnan University of Finance and Economics, Kunming" 650224, China)
Abstract: This paper uses the method of scientific Knowledge Graph visualization analysis, analyzes quantitatively the research outcomes of smart contract from 2016 to 2023. It finds that the number of smart contract papers continues to grow, the group size of researchers continues to expand, and the social attention and importance of this topic is constantly increasing. The research topics are mainly distributed in blockchain, vulnerability detection, Ethereum, access control, evolutionary games, contract systems, code vulnerabilities, decentralization, and other research hotspots.
Keywords: smart contract; spectral clustering analysis; keywords co-occurrence; research hotspot
0" 引" 言
智能合約作為區(qū)塊鏈當(dāng)中的重要組成部分,在金融支付、證券交易、商業(yè)物流、醫(yī)療衛(wèi)生、政務(wù)服務(wù)和博彩娛樂等各個(gè)領(lǐng)域起到了越來越重要的作用。它是一種自動(dòng)化的合同,可以自動(dòng)執(zhí)行代碼,并在區(qū)塊鏈上記錄每個(gè)操作。而這種自動(dòng)執(zhí)行和去中心化的特性,使得智能合約成為實(shí)現(xiàn)各種業(yè)務(wù)流程的理想工具。
智能合約(smart contract)作為一種兩方或多方締結(jié)并且具有法律效力的可執(zhí)行計(jì)算機(jī)協(xié)議,于1994年被計(jì)算機(jī)學(xué)家和法學(xué)家Szabo [1]首次提出,他指出:“智能合約就是執(zhí)行合約條款的可計(jì)算交易協(xié)議”,并且他認(rèn)為計(jì)算機(jī)代碼可以代替手工操作,從而進(jìn)行自動(dòng)化的復(fù)雜數(shù)字財(cái)產(chǎn)交易。但是,由于當(dāng)時(shí)缺乏可信的執(zhí)行環(huán)境,智能合約這一概念一直沒有得到廣泛地應(yīng)用。直到區(qū)塊鏈技術(shù)的出現(xiàn),為智能合約提供了一個(gè)天然的去中心化、可信任且不可篡改的合約執(zhí)行平臺(tái)。因此,隨著區(qū)塊鏈技術(shù)的不斷發(fā)展,也讓智能合約擁有了更加廣闊的發(fā)展空間。
1" 智能合約的特點(diǎn)
智能合約是一段可以在區(qū)塊鏈平臺(tái)上自動(dòng)運(yùn)行的代碼,用于描述并且自動(dòng)執(zhí)行一份合約。而區(qū)塊鏈的去中心化和數(shù)據(jù)的防篡改,決定了智能合約更加適合于在區(qū)塊鏈上來實(shí)現(xiàn)。例如,在一個(gè)公平的游戲合約中,一旦參與者滿足了合約中設(shè)置的獲勝條件,合約便會(huì)自動(dòng)地向參與者賬戶發(fā)放獎(jiǎng)勵(lì)。整個(gè)合約執(zhí)行的過程不需要依賴于對(duì)任何第三方的信任,也不存在抵賴(不執(zhí)行合約)或者欺騙(錯(cuò)誤執(zhí)行合約)的問題[2]。
相對(duì)于傳統(tǒng)的紙質(zhì)合約或者合同來言,智能合約作為一種在滿足條件后自動(dòng)履行承諾的合同,是通過程序代碼手段來強(qiáng)制保證的。因此,在合同中的條件滿足之后,相應(yīng)的合同條款就會(huì)被強(qiáng)制締結(jié)并自動(dòng)執(zhí)行,其締結(jié)過程是:第一步,參與締約的雙方或多方用戶商定后將共同合意制定成一份智能合約;第二步,該智能合約通過區(qū)塊鏈網(wǎng)絡(luò)向全球各個(gè)區(qū)塊鏈的支點(diǎn)廣播并存儲(chǔ);第三步,構(gòu)建成功的智能合約等待條件達(dá)成后自動(dòng)執(zhí)行合約內(nèi)容。
由于智能合約在區(qū)塊鏈技術(shù)的發(fā)展中,不斷發(fā)揮著重要的作用。因此,本文通過中國(guó)知網(wǎng)CNKI,以“篇名:智能合約(精確)”進(jìn)行檢索,并結(jié)合CiteSpace進(jìn)行可視化分析,對(duì)智能合約研究熱點(diǎn)和其未來研究趨勢(shì)進(jìn)行梳理,為智能合約的科學(xué)發(fā)展提供理論依據(jù)和合理參考。
2" 智能合約發(fā)展的基本格局
文獻(xiàn)是進(jìn)行科學(xué)研究的重要載體和交流平臺(tái),可以從中國(guó)知網(wǎng)CNKI上的文獻(xiàn)發(fā)表量、核心作者和高產(chǎn)機(jī)構(gòu)可以總體上把握智能合約發(fā)展的基本格局。
本文采取的是高級(jí)檢索方式,以篇名:智能合約(精確)為主題定制檢索,獲取文獻(xiàn)819篇,文獻(xiàn)的時(shí)間跨度為2016年2月10日至2023年10月12日,然后分批導(dǎo)出這些文獻(xiàn),再導(dǎo)入到CiteSpace 6.2.R4(64-bit)Basic中進(jìn)行分析。其中,2016—2022年期間,智能合約相關(guān)篇名研究的發(fā)文總量達(dá)668篇,發(fā)文數(shù)量持續(xù)增長(zhǎng),如圖1所示。
在圖1中可以得出,2016—2017年是智能合約研究的萌芽期,這時(shí)的發(fā)文量較少,但到了2017—2020這三年,是智能合約研究的高速期,這時(shí)的發(fā)文量呈現(xiàn)出逐年翻倍增長(zhǎng)的勢(shì)頭,這表明了在區(qū)塊鏈技術(shù)實(shí)踐發(fā)展的過程中,出現(xiàn)了一系列的熱點(diǎn)或問題,使得對(duì)智能合約研究有了越來越多的參與者。而到了2021—2023年,隨著區(qū)域鏈應(yīng)用的范圍越來越廣,無論是在法律上,還是在技術(shù)上和安全上,需要關(guān)注和考慮的因素也會(huì)更多,這使得對(duì)智能合約研究始終會(huì)保持在穩(wěn)中有升的上漲勢(shì)頭中,這也反映出智能合約研究者的群體規(guī)模在不斷擴(kuò)大,該主題的社會(huì)關(guān)注度和重要性在不斷地提高。
3" 核心作者群與高產(chǎn)機(jī)構(gòu)
3.1" 譜聚類算法的含義
核心作者群與高產(chǎn)機(jī)構(gòu)的產(chǎn)生需要使用聚類算法來實(shí)現(xiàn)。聚類(Clustering)是一種無監(jiān)督學(xué)習(xí)的數(shù)據(jù)挖掘算法,它能將數(shù)據(jù)集劃分為若干相似對(duì)象組成的多個(gè)組(group)或簇(cluster),從而使得同一組中對(duì)象間的相似度最大化,不同組中對(duì)象間的相似度最小化。也就是說,聚類能夠很好地衡量不同數(shù)據(jù)源之間的相似性,自動(dòng)把各個(gè)數(shù)據(jù)分類到不同的簇中。這也是人們常說的“物以類聚,人以群分”。
從形式化的角度來說,聚類是指假定樣本集D = {x1,x2,…,xm}包含m個(gè)標(biāo)記樣本,每個(gè)樣本xi(xi1;xi2;…;xin)是一個(gè)n維特征向量,則聚類算法將樣本集D劃分為k個(gè)不相交的簇{Cl | l = 1,2,…,k},其中Cl′ ∩ l′≠1 Cl = ?且 。相應(yīng)地,我們用λj ∈ {1,2,…,k}表示樣本xj的“簇標(biāo)記”(cluster label),即xj ∈ Cλj。于是,聚類的結(jié)果就可以用包含m個(gè)元素的簇標(biāo)記向量λ = (λ1;λ2;…;λm)來表示[3]。
聚類算法在其使用中,有其優(yōu)缺點(diǎn)。其優(yōu)點(diǎn)在于:
1)無監(jiān)督學(xué)習(xí):不需要對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行標(biāo)注,這比較適用于無標(biāo)簽的數(shù)據(jù)集;2)靈活性:適用于各種數(shù)據(jù)類型和問題領(lǐng)域;3)可解釋性:聚類結(jié)果可以幫助我們理解數(shù)據(jù)的內(nèi)在結(jié)構(gòu)和關(guān)系。4)原理較為簡(jiǎn)單,容易實(shí)現(xiàn)。比較適用于探索性數(shù)據(jù)分析;5)收斂速度較快。
其缺點(diǎn)在于:
1)初始參數(shù)敏感:聚類算法對(duì)初始參數(shù)的選擇和數(shù)據(jù)的初始化敏感,初始值影響較大,對(duì)數(shù)據(jù)有一定的要求;2)聚類結(jié)果不確定:不一定總是能夠反映出數(shù)據(jù)的真實(shí)分類,結(jié)果會(huì)時(shí)好時(shí)壞;3)聚類的結(jié)果在很大程度上取決于事先設(shè)定的參數(shù)(如類別,初始點(diǎn)等);4)對(duì)超參數(shù)比較敏感;5)在高維空間中,對(duì)距離度量和聚類結(jié)果的解釋就會(huì)變得困難起來。
總之,聚類算法作為一種廣泛使用的數(shù)據(jù)挖掘算法,有許多種不同的算法和計(jì)算方式,其性能也各有優(yōu)劣。在這里,為了更好地解決高維數(shù)據(jù)的降維問題,使用的是譜聚類算法。
譜聚類作為一種聚類算法,它是基于圖論的鏈接關(guān)系進(jìn)行分析的,這使得它與傳統(tǒng)的聚類算法(比如說K-means算法、EM數(shù)據(jù)迭代優(yōu)化算法等)不同,因?yàn)楹笳咧挥性跇颖究臻g為凸時(shí)才有效,而譜聚類算法卻可以解決樣本空間不為凸的情況。
譜聚類中最重要的數(shù)學(xué)工具是拉普拉斯矩陣。
要實(shí)現(xiàn)譜聚類,就需要使用拉普拉斯矩陣把一個(gè)帶權(quán)無向圖分為兩個(gè)或多個(gè)子圖,并讓子圖最優(yōu)化,使子圖內(nèi)部的內(nèi)容盡量相似,子圖之間的間距盡量更遠(yuǎn),從而能夠識(shí)別任意形狀的樣本空間且收斂于全局最解。譜聚類在利用樣本數(shù)據(jù)的相似矩陣(即:拉普拉斯矩陣)進(jìn)行特征分解后,對(duì)得到的特征向量進(jìn)行了很好的聚類。因此,它就比較適用于CiteSpace中的共線圖譜生成。
3.2" CiteSpace的譜聚類應(yīng)用
CiteSpace自動(dòng)聚類的實(shí)現(xiàn)是依據(jù)譜聚類算法。CiteSpace中的譜聚類算法有三種使用方式,分別是:title terms clusters(主題聚類)、indexing terms clusters(關(guān)鍵詞聚類)和 abstract terms clusters(摘要聚類)。在這里,點(diǎn)擊“All in One:clustering.optimizing layout and style”按鈕,讓CiteSpace自動(dòng)進(jìn)行優(yōu)化選擇,在三種聚類方式中優(yōu)化選擇一種,進(jìn)行聚類分析,產(chǎn)生分布格局圖。CiteSpace中的聚類是按共線圖譜來進(jìn)行調(diào)整的,只有在共線的基礎(chǔ)上做深度研究,才能產(chǎn)生相應(yīng)的聚類[4-10]。
通過分析機(jī)構(gòu)、作者、機(jī)構(gòu)和作者合作等情況,可以獲知該領(lǐng)域中研究力量的分布格局,如圖2和3所示。電子科技大學(xué)、北京郵電大學(xué)和蘭州大學(xué)三所高校分別在2019年和2020年大量產(chǎn)出關(guān)于智能合約的學(xué)術(shù)論文,成為智能合約領(lǐng)域的高產(chǎn)機(jī)構(gòu),這也可以從圖1中看出,2019—2020年是高速產(chǎn)出的階段。而在核心作者群方面,則是胡凱-北京航空航天大學(xué)計(jì)算機(jī)學(xué)院、劉國(guó)偉-北京市經(jīng)濟(jì)和信息化局、朱巖-北京科技大學(xué)計(jì)算機(jī)與通信工程學(xué)院、李潔-北京物資學(xué)院信息學(xué)院、周潤(rùn)-國(guó)浩律師(重慶)事務(wù)所。這說明,多數(shù)核心作者主要是計(jì)算機(jī)行業(yè)和法律界的研究人員。
4" 智能合約研究的主題分布
為了對(duì)智能合約的主題分析進(jìn)行深入的研究,可使用關(guān)鍵詞共現(xiàn)來實(shí)現(xiàn)。因?yàn)樗梢愿玫仡A(yù)測(cè)和判斷研究的發(fā)展方向和動(dòng)態(tài)。通常,在共現(xiàn)圖譜中,某關(guān)鍵詞與其他關(guān)鍵詞如果同時(shí)出現(xiàn)的頻度和概率越高,就說明該關(guān)鍵詞的中心性越強(qiáng),就越是該階段的研究熱點(diǎn)。
而通過譜聚類算法所產(chǎn)生的高頻關(guān)鍵詞,產(chǎn)生自動(dòng)的聚類后,形成以此為準(zhǔn)的聚類分析視圖,則可更好地研究該領(lǐng)域的知識(shí)結(jié)構(gòu),因?yàn)橥ㄟ^視圖,能夠形象地呈現(xiàn)出文獻(xiàn)的分類情況和標(biāo)簽的順序。
在這里,按2016—2020年和2011—2023年分為兩個(gè)階段,以Keywords進(jìn)行節(jié)點(diǎn)聚類分析,效果如圖4和5所示。
從圖4中可以看出,在2016—2020年,所產(chǎn)生的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜,有224個(gè)節(jié)點(diǎn)和565條連線。由聚類節(jié)點(diǎn)圖可以發(fā)現(xiàn),節(jié)點(diǎn)最大的是“智能合約”。此外,部分聚類序號(hào)與聚類大小也有一定的關(guān)系,序號(hào)在前的聚類有些會(huì)大一些。相較于其他關(guān)鍵詞,還有幾個(gè)關(guān)鍵詞的節(jié)點(diǎn)也較大:“區(qū)塊鏈”“以太坊”“超級(jí)賬本”“物聯(lián)網(wǎng)”“去中心化”“法律規(guī)制”“數(shù)據(jù)共享”等。表明在這期間,這幾個(gè)領(lǐng)域是智能合約探究的熱點(diǎn)。
而從圖5來看,在2021—2023年,所產(chǎn)生的關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)圖譜,有248個(gè)節(jié)點(diǎn)和610條連線。由聚類節(jié)點(diǎn)圖可以發(fā)現(xiàn),節(jié)點(diǎn)最大的還是“智能合約”。此外,部分聚類序號(hào)與聚類大小也有一定的關(guān)系,序號(hào)在前的聚類有些會(huì)大一些。相較于其他關(guān)鍵詞,還有幾個(gè)關(guān)鍵詞的節(jié)點(diǎn)也較大:“區(qū)塊鏈”“漏洞檢測(cè)”“以太坊”“訪問控制”“演化博弈”“合同制度”“代碼漏洞”“去中心化”等。表明在這期間,這幾個(gè)領(lǐng)域是智能合約當(dāng)前的探究熱點(diǎn)。
通過對(duì)比2016—2020年和2021—2023年的關(guān)鍵詞節(jié)點(diǎn),由CiteSpace中Keywords節(jié)點(diǎn)生成的列表,選擇Count前十的Keywords進(jìn)行比較,如表1所示,可以進(jìn)一步地發(fā)現(xiàn):
1)“智能合約”“區(qū)塊鏈”和“以太坊”這三個(gè)概念始終未變;2)2016—2020年,由于區(qū)塊鏈才開始逐漸興起,所以比較重視概念層面,因此“去中心化”和“合同法”是研究的熱點(diǎn),而2021—2023年,由于前期區(qū)塊鏈在應(yīng)用過程出現(xiàn)的一系列問題,一次又一次的智能合約安全漏洞攻擊事件表明了,智能合約的安全形勢(shì)十分嚴(yán)峻,因此,對(duì)于智能合約安全漏洞的研究也十分迫切,越來越多的研究工作開始關(guān)注于智能合約的安全漏洞問題,因此研究的熱點(diǎn)開始走向“漏洞檢測(cè)”和“訪問控制”這樣的技術(shù)層面了,這也說明信息技術(shù)在區(qū)塊鏈的不斷發(fā)展中彰顯出越來越重要的作用了;3)在區(qū)塊鏈的發(fā)展和研究中,“隱私保護(hù)”和“法律規(guī)制”始終是不變的研究熱點(diǎn),這說明重視安全,遵守法律,是現(xiàn)代社會(huì)人人都時(shí)刻意識(shí)的話題。
5" 結(jié)" 論
通過中國(guó)知網(wǎng)CNKI的文獻(xiàn)檢索與 CiteSpace 的可視化數(shù)據(jù)分析,本文系統(tǒng)分析了2016—2023年智能合約所涉及領(lǐng)域的科研論文,同時(shí)利用知識(shí)圖譜的聚類分析總結(jié)了智能合約當(dāng)前的熱門主題,得出了智能合約在區(qū)塊鏈的應(yīng)用研究中起到了舉足輕重的作用,其發(fā)文量在不斷地增長(zhǎng),電子信息類的高校和高產(chǎn)作者居多,并且其研究熱點(diǎn)開始不斷地關(guān)注信息安全方面,這對(duì)國(guó)家經(jīng)濟(jì)的發(fā)展和國(guó)家網(wǎng)絡(luò)安全的保護(hù)將會(huì)起到重要的作用。
參考文獻(xiàn):
[1] SZABO N. Formalizing and Securing Relationships on Public Networks [J/OL].First Monday,1997,2(9):(1997-09-01).https://doi.org/10.5210/fm.v2i9.548.
[2] 倪遠(yuǎn)東,張超,殷婷婷.智能合約安全漏洞研究綜述 [J].信息安全學(xué)報(bào),2020,5(3):78-99.
[3] 周志華.機(jī)器學(xué)習(xí) [M].北京.清華大學(xué)出版社,2016:197.
[4] 孟博,劉加兵,劉琴,等.智能合約安全綜述 [J].網(wǎng)絡(luò)與信息安全學(xué)報(bào),2020(3):1-13.
[5] 胡甜媛,李澤成,李必信,等.智能合約的合約安全和隱私安全研究綜述 [J].計(jì)算機(jī)學(xué)報(bào),2021,44(12):2485-2514.
[6] 汪永菊,杜秀娟,陳浩章.區(qū)塊鏈智能合約技術(shù)研究綜述 [J].計(jì)算機(jī)仿真,2023(40):1-4+65.
[7] 張文博,陳思敏,魏立斐,等.基于形式化方法的智能合約驗(yàn)證研究綜述 [J].網(wǎng)絡(luò)與信息安全學(xué)報(bào),2022,8(4):12-28.
[8] 李棟旭.區(qū)塊鏈智能合約的合同法適用 [D].長(zhǎng)春:吉林大學(xué),2020.
[9] 張?zhí)煊?智能合約的構(gòu)造與風(fēng)險(xiǎn)防治問題研究 [D].蘭州:蘭州大學(xué),2020.
[10] 李曉宇.以太坊代幣智能合約形式化驗(yàn)證技術(shù)研究 [D].合肥:中國(guó)科學(xué)技術(shù)大學(xué),2020.
作者簡(jiǎn)介:何鋒(1973—),男,白族,云南鶴慶人,副教授,碩士,主要研究方向:數(shù)據(jù)挖掘、信息安全、區(qū)塊鏈和編譯原理。
收稿日期:2023-11-02