王宏俊 王巖松 王進(jìn) 汪胡青



【摘要】身份認(rèn)證作為保護(hù)用戶合法權(quán)益的第一道關(guān)口,在網(wǎng)絡(luò)安全中有著重要的作用。本文首先調(diào)研了近年來(lái)身份認(rèn)證的熱門技術(shù)及應(yīng)用領(lǐng)域,然后,將常用于心理研究的Rasch模型應(yīng)用于身份認(rèn)證,根據(jù)節(jié)點(diǎn)過(guò)去的交往行為形成實(shí)體集認(rèn)證矩陣,并代入數(shù)據(jù)分析工具M(jìn)ini-step進(jìn)行分析,根據(jù)分析結(jié)果評(píng)估出各實(shí)體節(jié)點(diǎn)的身份可靠性概率。
【關(guān)鍵詞l身份認(rèn)證;Rasch模型;Mini-step
引言
隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展,社交網(wǎng)站和各類社交軟件的快速涌現(xiàn),傳統(tǒng)意義上人與人之間的社會(huì)關(guān)系已經(jīng)發(fā)生了重大的變化,網(wǎng)絡(luò)安全問(wèn)題日益突出,對(duì)網(wǎng)絡(luò)中的節(jié)點(diǎn)進(jìn)行身份評(píng)估成了一大需求。本文通過(guò)將拓?fù)渚W(wǎng)絡(luò)中通信實(shí)體抽象為節(jié)點(diǎn),由于每個(gè)節(jié)點(diǎn)均可發(fā)送和接收數(shù)據(jù),并可以與一個(gè)或多個(gè)對(duì)等節(jié)點(diǎn)直接通信,故極易受到內(nèi)部惡意節(jié)點(diǎn)攻擊。一旦網(wǎng)絡(luò)中的某個(gè)節(jié)點(diǎn)被控制,便可在網(wǎng)絡(luò)中發(fā)布虛假信息或進(jìn)行內(nèi)部攻擊(節(jié)點(diǎn)訪問(wèn)控制,惡意流量控制等)造成網(wǎng)絡(luò)癱瘓。因此對(duì)節(jié)點(diǎn)身份進(jìn)行認(rèn)證,識(shí)別網(wǎng)絡(luò)惡意節(jié)點(diǎn)具有重大意義。
國(guó)內(nèi)外學(xué)者對(duì)多個(gè)網(wǎng)絡(luò)應(yīng)用領(lǐng)域的身份認(rèn)證做了研究。為了防止學(xué)生在考試時(shí)作弊和平時(shí)成績(jī)抄襲等情況,針對(duì)Mooc中的身份認(rèn)證提出了基于雙因子模糊認(rèn)證與區(qū)塊鏈技術(shù),模糊認(rèn)證即身份認(rèn)證不再是簡(jiǎn)單的提取單個(gè)圖文數(shù)據(jù)信息,而是由若干個(gè)屬性的集合,信息比對(duì)的不再是準(zhǔn)確度,而是重疊程度。雙因子采樣分為兩個(gè)階段,首先由注冊(cè)階段由Mooc生成公鑰,然后公鑰與學(xué)生信息綁定,學(xué)生(身份證+指紋)生成私鑰。最后將信息加密存儲(chǔ)。然后驗(yàn)證階段采取模糊認(rèn)證,因?yàn)樯镄畔⒉豢杀苊獾貢?huì)產(chǎn)生誤差。作者還把應(yīng)用了區(qū)塊鏈技術(shù),即生成一個(gè)空開(kāi)的賬本,記錄學(xué)生的學(xué)習(xí)軌跡,區(qū)塊鏈技術(shù)確保了信息的不可篡改,只能添加。最后通過(guò)上述信息對(duì)學(xué)生頒布數(shù)字證書。
由于數(shù)據(jù)的暴漲,云計(jì)算孕育而生,然而如何在云計(jì)算中對(duì)動(dòng)態(tài)變化的數(shù)據(jù)用戶進(jìn)行身份認(rèn)證就顯得十分重要并且由于用戶量大,如果把身份認(rèn)證的重?fù)?dān)都放在云服務(wù)器上勢(shì)必會(huì)降低效率,故提出一種面向注冊(cè)用戶的身份認(rèn)證方法和一種面向本地代理服務(wù)器的身份認(rèn)證方法。在身份認(rèn)證策略中,將身份認(rèn)證放在本地服務(wù)器上執(zhí)行,將加密代理HE-RSA加密算法,由云服務(wù)器執(zhí)行,提高了云服務(wù)器的效率和用戶訪問(wèn)的可擴(kuò)展性。
傳統(tǒng)的身份認(rèn)證技術(shù)用的是賬號(hào)密碼策略,安全性強(qiáng)一點(diǎn)的使用OTP、手機(jī)短信認(rèn)證等方式。比較成體系的主要是4A和IAM,雖然也采用大數(shù)據(jù)分析來(lái)改進(jìn),但還是存在著許多安全問(wèn)題。而區(qū)塊鏈技術(shù)具有“單向加密、時(shí)間戳、去中心、不可篡改、全網(wǎng)保存、分布式共識(shí)”等特點(diǎn),把采集到的身份信息通過(guò)區(qū)塊鏈進(jìn)行信息存儲(chǔ),提高用戶信息的安全程度和身份認(rèn)證的準(zhǔn)確性。身份認(rèn)證的大致流程:首先拍照收集個(gè)人證件信息,將個(gè)人身份信息寫入?yún)^(qū)塊鏈中,將加密的圖像信息存放到身份服務(wù)器;其次將身份信息發(fā)送給第三方代理,代理根據(jù)個(gè)人信息完成認(rèn)證令牌的頒發(fā)并發(fā)送到區(qū)塊鏈中;再次通過(guò)區(qū)塊鏈的共享,新的代理應(yīng)用可以從區(qū)塊鏈獲取個(gè)人身份信封數(shù)據(jù)和加密圖像以及令牌;最后,新代理應(yīng)用再次采集用戶生物信息進(jìn)行驗(yàn)證,達(dá)到正確認(rèn)證個(gè)人的目的。
在優(yōu)化基于挑戰(zhàn)/應(yīng)答機(jī)制的一次性口令認(rèn)證方案的基礎(chǔ)上在認(rèn)證因子中加入硬件表示信息以及基于北斗衛(wèi)星導(dǎo)航系統(tǒng)的所獲得的位置信息和時(shí)間戳信息,同北斗指控中心的信息比對(duì)反饋,完成節(jié)點(diǎn)間的多因素雙向認(rèn)證。在初始階段,主要完成節(jié)點(diǎn)的密鑰生成、身份注冊(cè)、密鑰分發(fā)。在認(rèn)證階段,兩個(gè)節(jié)點(diǎn)A、B之間先進(jìn)行互相的加解密信息發(fā)送,匹對(duì)隨機(jī)數(shù)副本,一致后發(fā)送至北斗指控中心。中心解密后返還信息給A節(jié)點(diǎn),來(lái)認(rèn)證B節(jié)點(diǎn)的真實(shí)性。再通過(guò)B節(jié)點(diǎn)進(jìn)行類似操作驗(yàn)證A節(jié)點(diǎn)的真實(shí)性,至此雙向認(rèn)證結(jié)束。
基于用戶鼠標(biāo)行為的身份認(rèn)證方法主要是通過(guò)各個(gè)用戶使用鼠標(biāo)時(shí)的差異行為來(lái)進(jìn)行認(rèn)證的。在一定的時(shí)間內(nèi)記錄下用戶使用鼠標(biāo)的基本行為(移動(dòng)、點(diǎn)擊、拖拽、滾屏、靜置),記為一級(jí)特征;在一級(jí)特征基礎(chǔ)上進(jìn)行的組合操作行為為二級(jí)特征。其中二級(jí)特征能夠有效降低認(rèn)假率。最終通過(guò)極限學(xué)習(xí)機(jī)作為分類器來(lái)計(jì)算一級(jí)特征和二級(jí)特征的數(shù)據(jù)(隨機(jī)輸入權(quán)重與偏置來(lái)確定隱藏的輸出矩陣,從而求解線性系統(tǒng)。運(yùn)算中的隱藏節(jié)點(diǎn)數(shù)是一個(gè)很重要的參數(shù)影響認(rèn)證的準(zhǔn)確性),實(shí)現(xiàn)身份認(rèn)證。
上述身份認(rèn)證方案對(duì)各領(lǐng)域網(wǎng)絡(luò)安全研究作出了重要貢獻(xiàn),但方案本身由于大多采用密碼學(xué)方法,存在著計(jì)算量大、復(fù)雜度高、開(kāi)銷多的缺陷。本文研究了心理學(xué)中應(yīng)用廣泛的Rasch模型,將其應(yīng)用于身份認(rèn)證中,并用Mini-step工具進(jìn)行分析,借此評(píng)估各實(shí)體節(jié)點(diǎn)的身份可靠性。
一、Rasch模型
Rasch模型的客觀性以一組假定為前提:
a.實(shí)體集A與B都有其特定的可信值。
b.他們的可信值都以數(shù)值形式呈現(xiàn)在同一個(gè)尺度上。
c.通過(guò)實(shí)體A與B認(rèn)證的結(jié)果,即其得分值,我們可以推算出A與B集合的可信度。
Rasch模型擁有以下幾個(gè)特性:
(一)節(jié)點(diǎn)與測(cè)試的獨(dú)立性
由于大多數(shù)身份認(rèn)證模型過(guò)于依賴設(shè)備(如服務(wù)器),在實(shí)際應(yīng)用中往往存在諸多問(wèn)題,如服務(wù)器故障或無(wú)法識(shí)別惡意節(jié)點(diǎn)等,造成了服務(wù)器質(zhì)量與節(jié)點(diǎn)身份之間很強(qiáng)的依賴關(guān)系,缺乏客觀陛。在Rasch模型中,節(jié)點(diǎn)的身份是由節(jié)點(diǎn)通信中的“表現(xiàn)”所決定的,因此不具有依賴性。
(二)模型簡(jiǎn)單
從社會(huì)學(xué)角度看,信任關(guān)系是最復(fù)雜的社會(huì)關(guān)系之一,是一個(gè)很難度量的抽象的心理認(rèn)知,當(dāng)實(shí)體之間的信任關(guān)系不能明確定義的時(shí)候,它也是不穩(wěn)定的,給它的管理和評(píng)估帶來(lái)了困難,這一困難在復(fù)雜網(wǎng)絡(luò)中更加明顯,由于社區(qū)量龐大,節(jié)點(diǎn)數(shù)眾多,給數(shù)據(jù)分析與模型建立帶來(lái)了挑戰(zhàn)。而Rasch模型將多個(gè)受試個(gè)體在多次通信中的數(shù)據(jù)得出的二維0、1矩陣通過(guò)對(duì)數(shù)轉(zhuǎn)換,也就是Logit方法(D Andrich,1982)轉(zhuǎn)換,由于運(yùn)算量小,數(shù)據(jù)采集簡(jiǎn)單,很好地解決了在實(shí)際應(yīng)用中數(shù)據(jù)量龐大的問(wèn)題。
二、基于Rasch模型的身份認(rèn)證技術(shù)
在Rasch模型中我們假定有兩個(gè)實(shí)際集A1…A7與B1…B7,他們互相認(rèn)證情況如表l所示,l代表認(rèn)證成功,0代表認(rèn)證失敗。
三、Mini-step的數(shù)據(jù)分析與驗(yàn)證
Mini-step是一種常見(jiàn)的基于Rasch模型的數(shù)據(jù)分析軟件。本文使用該軟件對(duì)測(cè)試數(shù)據(jù)進(jìn)行分析處理,將其結(jié)果與上文的算法進(jìn)行對(duì)照匹配以進(jìn)行驗(yàn)證。
(一)能力值及難度值
通過(guò)MINISTEP軟件我們可以方便地得到實(shí)體A和B可信度的Logit圖,如圖1。
從上圖中我們不難看出,左側(cè)為A的可信度Logit值,越往圖的上方則可信度越強(qiáng)。A實(shí)體集可信度從高到低為:A3、A6、A2、A1、A7、A5、A4。而B(niǎo)實(shí)體集可信度從高到低為:B1、B10、B9、B4、B6、Bll、B2、B5、B8、B3、B7。
(二)異常樣本
由chi-square統(tǒng)計(jì)量除去自由度所得的商為均方Mean-Square,可知均方的值應(yīng)約等于1。如果均方值大于1,則為Underfit,表示數(shù)據(jù)中有外界因素影響了測(cè)量質(zhì)量。如果均方值小于1,則為Overfit,表示數(shù)據(jù)十分符合,若過(guò)分符合也會(huì)影響其可信度。可以通過(guò)Outfit的氣泡圖(圖2)來(lái)進(jìn)行觀察。
從圖2中的Measure維度看,A和B的廣度大致一致,稍有偏差,而從Outfit Mean-Square維度上看,大部分的A和B還是位于l的附近的,基本符合要求,只有B3節(jié)點(diǎn)明顯處于Underfit區(qū)即“不舒適區(qū)”。可以得出結(jié)論,大部分實(shí)體的結(jié)果都較為可信,從中發(fā)現(xiàn)了A3與B1、B10、B9最為可信的節(jié)點(diǎn),并對(duì)A1、A7、A5和B8、B5、B3實(shí)體表示懷疑。如果本次測(cè)試數(shù)據(jù)來(lái)源于真實(shí)實(shí)驗(yàn)觀察值則會(huì)更符合要求,論文中的測(cè)試數(shù)據(jù)僅供學(xué)習(xí)探討。
結(jié)語(yǔ)
本文通過(guò)對(duì)網(wǎng)絡(luò)節(jié)點(diǎn)的相互認(rèn)證結(jié)果進(jìn)行分析,從而得到最可靠節(jié)點(diǎn)與不可靠節(jié)點(diǎn)以及可疑節(jié)點(diǎn),評(píng)估出各自節(jié)點(diǎn)身份的可信度,完成身份認(rèn)證。理論上,數(shù)據(jù)量越龐大,節(jié)點(diǎn)越多,得到的值越精確。本文沒(méi)有對(duì)大規(guī)模節(jié)點(diǎn)通信數(shù)據(jù)進(jìn)行研究,還有進(jìn)一步研究的意義。