摘 要:在物聯(lián)網(wǎng)智能設(shè)備任務(wù)協(xié)作場景中,為解決設(shè)備交互不受信以及存在惡意設(shè)備破壞協(xié)作的問題,提出一種基于區(qū)塊鏈的信任管理方案。半分布式的架構(gòu)克服了集中式和分布式架構(gòu)的不足,任務(wù)協(xié)作過程中兼顧了雙方的信任,并設(shè)計了審查機制確保任務(wù)評價的真實可靠。信任的衡量中使用狄利克雷分布模擬任務(wù)評價的多樣性,構(gòu)建信任為數(shù)個狀態(tài),并利用馬爾可夫鏈評估信任狀態(tài)和全局信任。仿真結(jié)果表明,提出的方案可以客觀衡量設(shè)備的信任,同時在檢測惡意設(shè)備、提高協(xié)作任務(wù)成功率及避免誤判方面具有優(yōu)勢,因此可以有效確保任務(wù)交互的可信和協(xié)作環(huán)境的安全。
關(guān)鍵詞:物聯(lián)網(wǎng); 區(qū)塊鏈; 任務(wù)協(xié)作; 信任管理; 狄利克雷分布; 馬爾可夫鏈
中圖分類號:TP311
文獻(xiàn)標(biāo)志碼:A
文章編號:1001-3695(2023)07-004-1947-05
doi:10.19734/j.issn.1001-3695.2022.11.0634
Blockchain based task collaboration trust managementscheme for Internet of Things
He Yunhang, Dai Chen
(School of Communication amp; Information Engineering, Chongqing University of Posts amp; Telecommunications, Chongqing 400065, China)
Abstract:In the smart devices task collaboration scenario of the Internet of Things, aiming at the problem that interactions between devices are untrusted and malicious devices disrupt collaborations, this paper proposed a trust management scheme based on blockchain. The semi-distributed architecture overcame the deficiencies of the centralized and distributed architectures, and the collaboration process considered the trust of both sides of the task. The scheme designed a review mechanism to ensure the authenticity and reliability of the task ratings. The trust measurement adopted Dirichlet distribution to simulate the diversity of task ratings, constructed the trust into several states, and evaluated trust states and global trust using the Markov chain. Simulation results show that the proposed scheme can objectively measure the device’s trust, and has advantages in detecting malicious devices, improving the success rate of collaborations, and avoiding misjudgment. Therefore, it can effectively ensure the credibility of task interactions and the security of the collaboration environment.
Key words:Internet of Things; blockchain; task collaboration; trust management; Dirichlet distribution; Markov chain
0 引言
隨著物聯(lián)網(wǎng)的不斷發(fā)展,智能設(shè)備包括智能終端和智能車輛等,具有不斷增強的處理能力,支持更豐富多樣的本地和云端應(yīng)用,隨時可能產(chǎn)生大量資源需求不同的任務(wù)。網(wǎng)絡(luò)中的智能設(shè)備具有強弱不同的計算處理能力,將獨立或協(xié)作地完成各種任務(wù)。智能設(shè)備間的任務(wù)協(xié)作可以充分利用空閑資源,緩解網(wǎng)絡(luò)擁塞和連接擁堵問題[1]。然而,物聯(lián)網(wǎng)動態(tài)開放的網(wǎng)絡(luò)特性給任務(wù)協(xié)作帶來了挑戰(zhàn),陌生的智能設(shè)備間缺乏必要的信任基礎(chǔ),協(xié)作往往是不受信的。同時可能存在惡意設(shè)備,拖延或破壞任務(wù)完成,并返回虛假的任務(wù)評價。這樣的行為無疑會對任務(wù)的成功率和網(wǎng)絡(luò)公平性造成巨大損害。因此為任務(wù)協(xié)作建立一個客觀、公正、可信的信任管理方案是必要的。
現(xiàn)有的信任管理架構(gòu)主要分為集中式和分布式兩種。在集中式架構(gòu)中,中央服務(wù)器負(fù)責(zé)存儲和更新所有設(shè)備的信任信息,位于云端的中央服務(wù)器往往無法滿足任務(wù)的時延要求,同時集中式架構(gòu)還具有維護(hù)成本高、易受到單點攻擊等缺陷。因此,一些研究使用分布式的基于區(qū)塊鏈的架構(gòu)來實現(xiàn)信任管理[2]。區(qū)塊鏈作為一種新興技術(shù),以其分布式、防竄改、信息透明、可追溯等特性受到人們的廣泛關(guān)注[3,4]。區(qū)塊鏈技術(shù)減少了對第三方管理機構(gòu)或硬件設(shè)施的依賴,分布式的結(jié)構(gòu)減少了中心節(jié)點的壓力[5~7]。區(qū)塊鏈技術(shù)可以在不受信的物聯(lián)網(wǎng)網(wǎng)絡(luò)環(huán)境中實現(xiàn)節(jié)點的安全交互,在此基礎(chǔ)上可以構(gòu)建信任[8~11]。文獻(xiàn)[12]提出了一種基于區(qū)塊鏈的信任管理方案,實現(xiàn)了信任信息分布式更新和共享。該方案通過貝葉斯推斷對節(jié)點交互進(jìn)行評價,并根據(jù)歷史評價中積極和消極評價的偏移量來衡量信任。文獻(xiàn)[13]設(shè)計了一個基于區(qū)塊鏈的信任和信譽模型。將信任定義為點對點的直接信任,同時將信譽定義為一個全局概念,是多個節(jié)點信任的聚合,并通過信任的衡量實現(xiàn)對惡意節(jié)點的檢測和排除。與之相似,文獻(xiàn)[14]提出了一種可擴展的基于區(qū)塊鏈的信任管理方案,通過節(jié)點間直接信任和霧節(jié)點的推薦值來衡量信任。該方案允許以可擴展的方式評估和共享有關(guān)其他設(shè)備的信任建議,且無須參考任何預(yù)受信任的實體。事實上,物聯(lián)網(wǎng)中的任務(wù)協(xié)作非常頻繁,大多數(shù)協(xié)作都發(fā)生在陌生設(shè)備之間,只呈現(xiàn)出較弱的社會關(guān)系,點對點的信任衡量會帶來較大的計算和管理難度,因而基于直接信任和間接信任的方案有其局限性。Wang等人[15]將信任衡量建模為馬爾可夫穩(wěn)態(tài)問題,并利用局部信任和預(yù)信任節(jié)點增強網(wǎng)絡(luò)抵抗攻擊的能力。文獻(xiàn)[16]通過考慮歷史記錄中完成任務(wù)的激勵和不良行為的懲罰來計算信任,并將已處理的任務(wù)數(shù)量和任務(wù)處理的速度納入衡量標(biāo)準(zhǔn)。Guo等人[17]在衡量信任時考慮了任務(wù)服務(wù)時延,超過時延閾值會對節(jié)點信任產(chǎn)生不利影響,并且開發(fā)了基于信任值的區(qū)塊鏈共識機制,降低了共識成本。現(xiàn)有的工作大多基于完全分布式的區(qū)塊鏈,設(shè)備與設(shè)備的交互在沒有權(quán)威第三方監(jiān)督的情況下進(jìn)行,在這種架構(gòu)中達(dá)成共識需要較高的通信和計算成本[18,19],不適用于高連接性要求的物聯(lián)網(wǎng)網(wǎng)絡(luò)。同時在衡量設(shè)備信任時,研究中往往只考慮了二元評價,即積極和消極兩種評價情況,而在復(fù)雜動態(tài)的物聯(lián)網(wǎng)場景中,客觀上存在因通信連接等非主觀因素導(dǎo)致協(xié)作失敗的可能,將此類交互直接判定為消極是不合理的。針對上述問題,本文提出一種新的基于區(qū)塊鏈的任務(wù)協(xié)作信任管理方案:
a)針對集中式架構(gòu)和完全分布式架構(gòu)的不足,提出基于區(qū)塊鏈的半分布式信任管理架構(gòu),任務(wù)協(xié)作過程兼顧雙方的信任,同時設(shè)計審查機制對評價進(jìn)行追溯,防止惡意評價對信任衡量產(chǎn)生不良影響。
b)區(qū)別于其他研究中將信任直接衡量為某個單一的數(shù)值,本文在使用狄利克雷分布模擬任務(wù)評價多樣性的基礎(chǔ)上,依據(jù)記錄在區(qū)塊鏈中的歷史評價將設(shè)備的信任構(gòu)建為數(shù)個狀態(tài),信任狀態(tài)的轉(zhuǎn)移被模擬為馬爾可夫鏈上的游動,并將全局信任的計算建模為馬爾可夫穩(wěn)態(tài)問題。
c)仿真結(jié)果表明,該方案可以客觀地衡量設(shè)備的信任,同時提高惡意設(shè)備檢測率和協(xié)作任務(wù)成功率,并減少正常設(shè)備被誤判為惡意設(shè)備的可能。
1 系統(tǒng)模型
1.1 基于區(qū)塊鏈的信任管理架構(gòu)
基于區(qū)塊鏈的信任管理架構(gòu)如圖1所示。
半分布式的架構(gòu)包含智能設(shè)備層以及區(qū)塊鏈接入層。智能設(shè)備層中注冊有大量智能設(shè)備,具有強弱不同的任務(wù)處理能力和不同的信任水平。設(shè)備的信任是動態(tài)的,將根據(jù)智能設(shè)備完成協(xié)作任務(wù)后獲得的評價情況而更新。分布在網(wǎng)絡(luò)邊緣的無線接入點(access point, AP)及控制中心構(gòu)成了接入層,并部署了區(qū)塊鏈。在該層中,區(qū)塊鏈將保存任務(wù)交互記錄并維護(hù)設(shè)備的信任信息。半分布式的架構(gòu)中,控制中心是受信的權(quán)威實體,負(fù)責(zé)完成對網(wǎng)絡(luò)中各AP及設(shè)備認(rèn)證信息的管理。與分布式架構(gòu)通過競爭的方式選舉節(jié)點打包區(qū)塊不同,控制中心還負(fù)責(zé)收集AP上傳的信息并統(tǒng)一發(fā)布待驗證的區(qū)塊,并在區(qū)塊鏈網(wǎng)絡(luò)中進(jìn)行共識。通過區(qū)塊鏈實現(xiàn)信息的記錄和管理,可以有效降低控制中心受到單點攻擊的風(fēng)險,避免了集中式架構(gòu)的缺陷。由于控制中心具有強大的處理和存儲能力并要執(zhí)行綜合管理的職能,所以需要部署完整的區(qū)塊鏈來存儲所有的數(shù)據(jù)。而AP擁有的計算和存儲資源相對緊張,存儲完整的區(qū)塊鏈副本會帶來不必要的成本。因此在AP處僅部署了輕量化的區(qū)塊鏈,在不影響區(qū)塊鏈安全、透明等優(yōu)勢的前提下,減少AP處的資源壓力。
1.2 任務(wù)協(xié)作過程
智能設(shè)備任務(wù)協(xié)作包含數(shù)個階段,分別是認(rèn)證階段、任務(wù)請求階段、協(xié)作方匹配階段、設(shè)備互認(rèn)與協(xié)作階段、任務(wù)評價階段及區(qū)塊鏈共識階段。
a)認(rèn)證階段。控制中心將對網(wǎng)絡(luò)中的AP和新加入的智能設(shè)備進(jìn)行數(shù)字認(rèn)證,并分配公私鑰對{PK,SK},同時根據(jù)智能設(shè)備的認(rèn)證信息賦予其初始信任TS。
b)任務(wù)請求。智能設(shè)備SDA產(chǎn)生一個任務(wù)需求,首先向距離最近的接入點APi發(fā)送任務(wù)協(xié)作請求ReqSDA→APi,請求中主要包括任務(wù)的基本屬性TA(包含任務(wù)類型、數(shù)據(jù)包大小、處理時限等信息)、任務(wù)內(nèi)容TC以及請求方的數(shù)字簽名SigSDA。該請求可以描述為
其中:EAPi()表示內(nèi)容通過APi的公鑰PKAPi進(jìn)行加密;SigSDA=SignSDA(TA‖TC)代表用SDA的私鑰SKSDA對TA和TC進(jìn)行數(shù)字簽名。
c)協(xié)作方匹配。APi收到該任務(wù)協(xié)作請求ReqSDA→APi后,首先驗證請求方的身份并在區(qū)塊鏈中查詢其信任信息,若身份認(rèn)證信息驗證未通過或請求方信任不符合協(xié)作任務(wù)要求,APi將排除該任務(wù)請求。若核查通過,APi根據(jù)任務(wù)屬性和請求方的信任匹配協(xié)作智能設(shè)備,信任狀態(tài)較高的設(shè)備會以更高權(quán)值被選中作為協(xié)作方。假設(shè)匹配的協(xié)作智能設(shè)備為SDB,APi將向SDA返回響應(yīng)信息Re spAPi→SDA,包含SDB的公鑰PKSDB及其信任TSSDB。
其中:SigAPi=SignAPi(TSSDB)。同時APi還將向協(xié)作智能設(shè)備SDB發(fā)送信息MesAPi→SDB:
該條信息包含SDA的信任TSSDA,且APi會通過私鑰對信息進(jìn)行簽名Sig′APi=SignAPi(TA‖TC‖TSSDA)。
d)設(shè)備互認(rèn)與協(xié)作。協(xié)作雙方都收到APi傳回的響應(yīng)后,將根據(jù)對方的信任信息確認(rèn)是否與其進(jìn)行任務(wù)協(xié)作。如果同意協(xié)作,SDA將向APi和SDB發(fā)送確認(rèn)信息MesSDA→SDB并開始任務(wù)協(xié)作。
e)任務(wù)評價。任務(wù)完成后請求方SDA將生成評價信息EvalSDA→APi并發(fā)送給APi,評價信息中包括請求方對任務(wù)完成情況的評價RT及其簽名。
其中:Sig′SDA=SignSDA(RT)。
f)區(qū)塊鏈共識。APi驗證信息無誤后,會將各信息匯總成任務(wù)記錄,并上傳到控制中心。控制中心收集到各AP發(fā)來的一定數(shù)量的任務(wù)記錄后將其打包成待驗證的區(qū)塊,接著發(fā)送給各AP通過實用拜占庭容錯(practical Byzantine fault tolerance,PBFT)進(jìn)行共識,在獲得超過三分之二的認(rèn)證后,該區(qū)塊將會成為合法區(qū)塊,并存儲在各部分區(qū)塊鏈中。
1.3 評價審查機制
開放的物聯(lián)網(wǎng)網(wǎng)絡(luò)中存在各種惡意設(shè)備,當(dāng)其作為請求方時可能會返回錯誤的評價,評價審查機制可以消除惡意評價對信任衡量產(chǎn)生的不良影響。在區(qū)塊成功上鏈后,設(shè)備可以較為容易地在網(wǎng)絡(luò)邊緣的AP處查詢區(qū)塊中的任務(wù)記錄,如果發(fā)現(xiàn)疑似惡意評價,可在追溯期內(nèi)對評價結(jié)果提出審查申請。區(qū)塊鏈將會審查可疑部分,驗證區(qū)塊中留存的任務(wù)交互信息及參與方的數(shù)字簽名,識別可能存在的惡意行為,最終生成審查結(jié)果。惡意評價會被撤銷,同時降低被查實惡意設(shè)備的信任狀態(tài)。為防止過多地占用網(wǎng)絡(luò)資源,對于超出追溯期的評價,區(qū)塊鏈不會受理審查申請。
2 信任管理方案
2.1 任務(wù)評價的多樣性
在協(xié)作任務(wù)完成后,請求方將對任務(wù)完成情況進(jìn)行評價。以往的信任計算只考慮了積極和消極兩種評價,事實上在復(fù)雜動態(tài)的物聯(lián)網(wǎng)場景中,客觀上存在因網(wǎng)絡(luò)連接等因素導(dǎo)致任務(wù)失敗的可能,直接判定為消極會對設(shè)備信任產(chǎn)生不利影響,因此有必要考慮評價的多樣性。狄利克雷分布是多項分布的共軛先驗,基于狄利克雷分布的信任衡量可以模擬評價的多樣性。
假設(shè)任務(wù)完成后有K種評價,θ={θ1,θ2,…,θK}為一個概率向量,其中θi表示第i種評價出現(xiàn)的概率,且∑Ki=1θi=1,由狄利克雷概率分布模型有
其中:α={α1,α2,…,αK}是濃度參數(shù),另外有
區(qū)塊鏈中記錄了該設(shè)備的H次評價D={d1,d2,…,dH},由于每次評價獨立同分布,所以有似然函數(shù):
G={G1,G2,…,GK}是各評價出現(xiàn)次數(shù)的集合,其中Gi是第i種評價出現(xiàn)的次數(shù)。由貝葉斯公式可知
首先,根據(jù)式(6)(8)可以得知
另外,由推導(dǎo)可以得出:
將式(10)和(11)的推導(dǎo)結(jié)果代入式(9),可得到后驗分布為
即θ|D,α~Dir(α+G)。在本文中,請求方對任務(wù)完成情況的評價被分為積極評價、中性評價以及消極評價三個等級。協(xié)作方在時限內(nèi)完成任務(wù)會獲得積極評價,當(dāng)任務(wù)因通信連接等非協(xié)作方主觀因素導(dǎo)致失敗時,協(xié)作設(shè)備會獲得中性評價。另外,當(dāng)協(xié)作設(shè)備表現(xiàn)惡意、故意拖延或妨礙任務(wù)完成,將被給予消極評價。協(xié)作方可以在追溯期內(nèi)對評價結(jié)果提出異議,此時區(qū)塊鏈將通過審查機制進(jìn)行檢查。
2.2 信任狀態(tài)及狀態(tài)轉(zhuǎn)移
由于智能設(shè)備當(dāng)前周期的信任狀態(tài)只與前一周期所處狀態(tài)有關(guān),信任狀態(tài)的變化受到前一周期評價的影響,與馬爾可夫鏈規(guī)律有一定相似性,所以通過構(gòu)建馬爾可夫狀態(tài)轉(zhuǎn)移模型來衡量設(shè)備的信任。為了建立描述系統(tǒng)的數(shù)學(xué)模型,假設(shè)設(shè)備所處的信任狀態(tài)不會影響設(shè)備在任務(wù)中的表現(xiàn)。如表1所示,智能設(shè)備的信任水平由高到低分為高信任狀態(tài)、正常狀態(tài)、考察狀態(tài)以及低信任狀態(tài)四個狀態(tài)。高信任狀態(tài)代表設(shè)備在長時段內(nèi)評價水平較高,是信任最高的狀態(tài)。正常狀態(tài)表示設(shè)備信任處于正常的范圍。三種情況的設(shè)備可能處于考察狀態(tài):a)新加入的設(shè)備,由于其表現(xiàn)未知,應(yīng)給予考察時間;b)某些處于正常狀態(tài)的設(shè)備短時間評價水平較差,直接轉(zhuǎn)移到低信任狀態(tài)并實施懲罰有所不妥;c)已經(jīng)處于低信任狀態(tài)且懲罰期已過,被允許重新參與協(xié)作任務(wù)的設(shè)備,其短時間內(nèi)可能表現(xiàn)良好,但同樣需要考察時間以防止對協(xié)作任務(wù)再次造成損害。低信任狀態(tài)代表該設(shè)備表現(xiàn)惡意,嚴(yán)重?fù)p害協(xié)作任務(wù)完成。每次進(jìn)入低信任狀態(tài),網(wǎng)絡(luò)都會對設(shè)備給予懲罰期,期間網(wǎng)絡(luò)將暫時排除該設(shè)備,禁止其參加協(xié)作任務(wù),如果多次進(jìn)入低信任狀態(tài),設(shè)備將會被永久排除。
定義狀態(tài)集S={S1,S2,S3,S4}以及評價水平集O={o1,o2,o3}。制定狀態(tài)轉(zhuǎn)移規(guī)則如表2所示。評價水平o1~o3依次由高到低。設(shè)備下一周期的狀態(tài)將由當(dāng)前所處的狀態(tài)和當(dāng)前周期的評價水平?jīng)Q定。值得說明的是,已經(jīng)處于高信任狀態(tài)的智能設(shè)備,只有持續(xù)表現(xiàn)良好才會保持高信任狀態(tài)。處于低信任狀態(tài)且懲罰期已過的智能設(shè)備也需較長時間表現(xiàn)良好才能回到正常的信任狀態(tài)。
構(gòu)建馬爾可夫狀態(tài)轉(zhuǎn)移圖,如圖2所示。
圖2中的每個頂點代表該智能設(shè)備的一個信任狀態(tài),Pij表示由信任狀態(tài)Si轉(zhuǎn)移到Sj的概率,結(jié)合狀態(tài)轉(zhuǎn)移規(guī)則可以寫出馬爾可夫轉(zhuǎn)移概率矩陣A。
2.3 評價水平的分類
界定智能設(shè)備的評價水平,分類標(biāo)準(zhǔn)如表3所示。μi代表周期tn中第i種評價數(shù)占總評價數(shù)的比例,即
其中:G(tn)是該周期評價總數(shù)。設(shè)定比例閾值β1、β3、γ1及γ3。當(dāng)μ1>β1,即積極評價比例大于系統(tǒng)要求,同時消極評價的比例μ3<γ1,這種情況被定義為良好的評價水平o1。相對地,最差的評價水平o3將從兩方面討論,首先是積極評價的比例μ1低于要求的閾值β3,或者消極評價的比例μ3超過最高限制γ3。其余的情況可以歸類為中性的評價水平o2。
2.4 具有時間衰減的評價統(tǒng)計
評價的價值具有時間衰減的特性,最近產(chǎn)生的評價更能反映設(shè)備當(dāng)前的表現(xiàn)水平和信任程度,為了使信任狀態(tài)的轉(zhuǎn)移概率合理地受到新舊評價的影響,在評價的統(tǒng)計過程中引入了衰減函數(shù)。設(shè)初始周期為t1,當(dāng)前周期為tN,當(dāng)前周期的統(tǒng)計結(jié)果記為W(tN),其中第i種評價的結(jié)果wi(tN)可以計算為
其中:εi稱為衰減因子,控制第i種評價隨時間的衰減速度。惡意行為會給網(wǎng)絡(luò)帶來損害,為了更有效地記錄和識別惡意設(shè)備,消極評價應(yīng)該在統(tǒng)計中留存更長的時間,更難以被遺忘,因此相比于積極和中性評價,消極評價具有更大的衰減因子,以使得衰減速度更慢。
2.5 全局信任
本節(jié)計算設(shè)備的全局信任。由于所有的任務(wù)歷史評價都保存在區(qū)塊鏈中,控制中心可以較為容易地獲得統(tǒng)計結(jié)果W,代入式(12)計算得到θ的狄利克雷分布,再結(jié)合表3的分類標(biāo)準(zhǔn),求得在該分布條件下各評價水平出現(xiàn)的概率和馬爾可夫轉(zhuǎn)移概率矩陣A。信任狀態(tài)保持該轉(zhuǎn)移規(guī)律,并在馬爾可夫鏈上游動,由于馬爾可夫鏈?zhǔn)遣豢杉s且非周期的,所以存在唯一平穩(wěn)狀態(tài)分布。根據(jù)馬爾可夫鏈平穩(wěn)分布公式
3 仿真分析
為了對本文方案的各方面性能進(jìn)行仿真,同時驗證其有效性,搭建了基于區(qū)塊鏈的任務(wù)協(xié)作信任管理架構(gòu),同時使設(shè)備在網(wǎng)絡(luò)中進(jìn)行任務(wù)協(xié)作并返回任務(wù)評價。網(wǎng)絡(luò)的一個周期被設(shè)置為5個區(qū)塊鏈出塊時間,所有設(shè)備的信任狀態(tài)和全局信任將每個周期更新,并在區(qū)塊鏈中實現(xiàn)安全管理。主要的參數(shù)設(shè)置如表4所示。
圖3展示了本文方案中正常設(shè)備和惡意設(shè)備信任狀態(tài)更新情況的對比。實線所示正常設(shè)備保持較好的表現(xiàn),積極評價的比例較高,其信任狀態(tài)始終保持在S1和S2兩個較好的狀態(tài);虛線所示設(shè)備表現(xiàn)惡意,獲得大量消極評價,導(dǎo)致信任狀態(tài)由S3轉(zhuǎn)移到S4并同時受到懲罰。該惡意設(shè)備被暫時排除網(wǎng)絡(luò),期間不能參與協(xié)作任務(wù),因此信任狀態(tài)一直處于S4。圖4中的正常設(shè)備在第115個周期左右不再參與網(wǎng)絡(luò)中的任務(wù)協(xié)作,區(qū)塊鏈中沒有繼續(xù)產(chǎn)生有關(guān)該設(shè)備的任務(wù)記錄。如圖中所示,其信任狀態(tài)會先在當(dāng)前狀態(tài)保持一段時間,數(shù)個周期后若還是無新增記錄,信任狀態(tài)再逐次向更低狀態(tài)轉(zhuǎn)移,直到轉(zhuǎn)移到與新進(jìn)入網(wǎng)絡(luò)的設(shè)備一樣的S3。這樣可以激勵設(shè)備參與協(xié)作任務(wù),更大限度地利用智能設(shè)備層中的冗余資源。即使設(shè)備表現(xiàn)良好,當(dāng)前信任較高,如果不參與任務(wù),信任狀態(tài)同樣會降低,因此設(shè)備如要保持較高的信任狀態(tài),就必須積極參與任務(wù)協(xié)作。
由于全局信任是以向量形式存在,為了可以直觀展示,使用全局信任Π的期望E作為指標(biāo):
其中:E越大代表設(shè)備評價越差,可信程度也越低。圖5展示了本文方案中兩個不同表現(xiàn)的設(shè)備全局信任的變化。全局信任在經(jīng)過網(wǎng)絡(luò)啟動后的近10個周期的迭代后趨于穩(wěn)定,雖然由于設(shè)備實時表現(xiàn)的變化導(dǎo)致存在波動,但依然可以看出全局信任保持的大致水平以及兩個設(shè)備表現(xiàn)水平不同導(dǎo)致的差異。實線所示設(shè)備的E始終保持在低位,反映其較好的表現(xiàn)水平,而虛線所示表現(xiàn)較差設(shè)備的E始終高于實線所示設(shè)備,說明其可信程度更低。由此可見,提出的信任管理方案可以根據(jù)區(qū)塊鏈中的歷史評價客觀地衡量設(shè)備的信任。
仿真中還將本文方案與基于二元評價的文獻(xiàn)[12,13]中信任管理方案在惡意設(shè)備檢測、任務(wù)成功率、避免誤判方面進(jìn)行了對比。基于二元評價的方案只考慮了積極和消極兩種評價,出現(xiàn)通信失敗等非主觀因素將會直接被給予消極評價。為了對比三種方案識別惡意設(shè)備的性能,仿真中考慮了兩種類型的惡意設(shè)備,即單純惡意設(shè)備(pure malicious device, PMD)與智能惡意設(shè)備(smart malicious device, SMD)。PMD不會隱藏自己的惡意行為,PMD作為協(xié)作方會故意破壞任務(wù)完成,而PMD作為請求方會給出與任務(wù)完成情況相反的評價。SMD在大部分時間中會偽裝為正常設(shè)備,以一定概率決定是否實施惡意行為。相比于PMD,SMD更難以被識別,容易對網(wǎng)絡(luò)造成持續(xù)性的威脅,因此更快地識別SMD可以更好地保護(hù)協(xié)作環(huán)境的安全。圖6展示了本文方案在不同pm條件下對惡意設(shè)備的檢測能力。由于PMD不會隱藏惡意行為,所以本文方案可以很快地識別PMD并將其排除。結(jié)果同時表明,相比于PMD,SMD需要花費更長的時間才能被識別。另外,在pm=0.25時,本文方案對SMD的檢測率明顯高于在pm=0.2條件下,說明SMD惡意概率pm越高,越難以隱藏自己的行為,方案對SMD的檢測也越快。由圖中進(jìn)一步可知,在pm=0.2的相同條件下,相比于其他兩種方案,本文方案對SMD具有更高的檢測率,能夠在更短時間內(nèi)識別網(wǎng)絡(luò)中的SMD,并對其實施懲罰,說明本文方案對SMD具有更強的識別能力,從而可以更高效地排除妨礙任務(wù)協(xié)作的威脅。
如果任務(wù)正常完成且獲得了正確的評價,則可被定義為一次成功的協(xié)作。本文方案為了保證任務(wù)的成功率,處于高信任狀態(tài)S1的設(shè)備會被賦予更高的權(quán)重,并被選為協(xié)作設(shè)備。圖7首先展示了在選擇權(quán)重Δ=1.0和Δ=2.0條件下,本文方案中任務(wù)成功率的變化。由于pc被設(shè)置為0.2,導(dǎo)致任務(wù)成功率的上限為0.8。在最初的5 000個協(xié)作任務(wù)中,由于網(wǎng)絡(luò)剛剛啟動,惡意設(shè)備還未被排除網(wǎng)絡(luò),且此時網(wǎng)絡(luò)中還沒有處于高信任狀態(tài)的設(shè)備,所以所有方案的任務(wù)成功率相差不大。隨著協(xié)作任務(wù)繼續(xù)進(jìn)行,任務(wù)成功率開始顯現(xiàn)出差異。在Δ=1.0,即沒有增加權(quán)重的相同條件下,本文方案的任務(wù)成功率始終高于其他兩種方案3~5個百分點,這表明本文方案可以更有效地維護(hù)網(wǎng)絡(luò)的協(xié)作環(huán)境,保證協(xié)作任務(wù)的成功進(jìn)行。同時Δ越大,方案越傾向于選擇高信任設(shè)備作為協(xié)作方,任務(wù)成功率也越高,且會更快地穩(wěn)定到上限。圖8對比了三種方案在前15個周期內(nèi)正常設(shè)備的數(shù)量變化。基于二元評價的兩種方案中正常設(shè)備數(shù)量不斷減少,這表明部分正常設(shè)備因非主觀因素導(dǎo)致任務(wù)失敗,被判定為惡意設(shè)備而遭到網(wǎng)絡(luò)暫時排除。而本文方案中正常設(shè)備數(shù)量幾乎沒有減少,說明在保持對惡意設(shè)備更高檢測率的同時,本文方案顯著減少了正常設(shè)備被誤判的可能。由此可見,本文方案可以在物聯(lián)網(wǎng)動態(tài)復(fù)雜的網(wǎng)絡(luò)環(huán)境中客觀地衡量設(shè)備的信任狀態(tài)和全局信任,并在識別惡意設(shè)備、保證任務(wù)成功率和避免誤判方面具有優(yōu)勢,因此可以更有效地維護(hù)任務(wù)協(xié)作環(huán)境的可信和安全。
4 結(jié)束語
在物聯(lián)網(wǎng)智能設(shè)備任務(wù)協(xié)作場景中,本文提出了一種基于區(qū)塊鏈的半分布式信任管理方案。在任務(wù)協(xié)作過程實現(xiàn)了任務(wù)雙方的信任互認(rèn),并通過區(qū)塊鏈實現(xiàn)了安全的記錄和管理。審查機制可以對評價進(jìn)行追溯,防止惡意設(shè)備的惡意評價對信任產(chǎn)生消極影響。在使用了狄利克雷分布模擬任務(wù)評價多樣性的基礎(chǔ)上,將信任構(gòu)建為四個狀態(tài),并利用馬爾可夫鏈客觀衡量了信任狀態(tài)和全局信任。仿真結(jié)果驗證了本文方案的有效性和優(yōu)越性。下一步將探索利用本文方案開發(fā)新的區(qū)塊鏈結(jié)構(gòu)和共識機制,降低在網(wǎng)絡(luò)中部署的存儲和驗證成本。
參考文獻(xiàn):
[1]Pu Lingjun, Chen Xu, Xu Jingdong, et al. D2D fogging: an energy-efficient and incentive-aware task offloading framework via network-assisted D2D collaboration[J]. IEEE Journal on Selected Areas in Communications, 2016,34(12): 3887-3901.
[2]Zheng Zibin, Xie Shao’an, Dai Hongning, et al. Blockchain challenges and opportunities: a survey[J]. International Journal of Web and Grid Services, 2018,14(4):352-375.
[3]Kang Jiawen, Yu Rong, Huang Xumin, et al. Enabling localized peer-to-peer electricity trading among plug-in hybrid electric vehicles using consortium blockchains[J]. IEEE Trans on Industrial Informatics, 2017,13(6): 3154-3164.
[4]Li Zhetao, Kang Jiawen, Yu Rong, et al. Consortium blockchain for secure energy trading in industrial Internet of Things[J]. IEEE Trans on Industrial Informatics, 2017,14(8): 3690-3700.
[5]Dai Yueyue, Xu Du, Maharjan S, et al. Blockchain and deep reinforcement learning empowered intelligent 5G beyond[J]. IEEE Network, 2019,33(3):10-17.
[6]Sharma P K, Kumar N, Park J H. Blockchain-based distributed framework for automotive industry in a smart city[J]. IEEE Trans on Industrial Informatics, 2018,15(7): 4197-4205.
[7]Zhao Ning, Wu Hao, Chen Yali. Coalition game-based computation resource allocation for wireless blockchain networks[J]. IEEE Internet of Things Journal, 2019,6(5): 8507-8518.
[8]Lu Yunlong,Huang Xiaohong,Dai Yueyue, et al. Blockchain and fe-derated learning for privacy-preserved data sharing in industrial IoT[J]. IEEE Trans on Industrial Informatics,2019,16(6):4177-4186.
[9]Li Meng, Yu F R, Si Pengbo, et al. Resource optimization for delay-tolerant data in blockchain-enabled IoT with edge computing: a deep reinforcement learning approach[J]. IEEE Internet of Things Journal, 2020,7(10): 9399-9412.
[10]Li Zhenni, Yang Zuyuan, Xie Shengli, et al. Credit-based payments for fast computing resource trading in edge-assisted Internet of Things[J]. IEEE Internet of Things Journal, 2019,6(4): 6606-6617.
[11]Yang Lei, Li Meng, Si Pengbo, et al. Energy-efficient resource allocation for blockchain-enabled industrial Internet of Things with deep reinforcement learning[J]. IEEE Internet of Things Journal, 2020,8(4): 2318-2329.
[12]Yang Zhe, Yang Kan, Lei Lei, et al. Blockchain-based decentralized trust management in vehicular networks[J]. IEEE Internet of Things Journal, 2018,6(2): 1495-1505.
[13]Putra G D, Dedeoglu V, Kanhere S S, et al. Trust-based blockchain authorization for IoT[J]. IEEE Trans on Network and Service Management, 2021,18(2): 1646-1658.
[14]Kouicem D E, Imine Y, Bouabdallah A, et al. Decentralized blockchain-based trust management protocol for the Internet of Things[J]. IEEE Trans on Dependable and Secure Computing, 2022,19(2):1292-1306.
[15]Wang Peng, Xu Ning, Zhang Haibin, et al. Dynamic access control and trust management for blockchain empowered IoT[J]. IEEE Internet of Things Journal, 2022,9(15): 12997-13009.
[16]Zhang Peiyun, Zhou Mengchu, Zhao Qixi, et al. A performance-optimized consensus mechanism for consortium blockchains consisting of trust-varying nodes[J]. IEEE Trans on Network Science and Engineering, 2021,8(3): 2147-2159.
[17]Guo Shaoyong, Qi Yuanyuan, Jin Yi, et al. Endogenous trusted DRL-based service function chain orchestration for IoT[J]. IEEE Trans on Computers, 2021,71(2): 397-406.
[18]武岳, 李軍祥. 區(qū)塊鏈共識算法演進(jìn)過程[J]. 計算機應(yīng)用研究, 2020,37(7): 2097-2103. (Wu Yue, Li Junxiang. Evolution process of blockchain consensus algorithm[J]. Application Research of Computers, 2020,37(7): 2097-2103.)
[19]佟興, 張召, 金澈清, 等. 面向端邊云協(xié)同架構(gòu)的區(qū)塊鏈技術(shù)綜述[J]. 計算機學(xué)報, 2021,44(12): 2345-2366. (Tong Xing, Zhang Zhao, Jin Cheqing, et al. Blockchain for end-edge-cloud architecture: a survey[J]. Chinese Journal of Computers, 2021,44(12): 2345-2366.)