王宏俊 王巖松 王進 汪胡青



【摘要】身份認證作為保護用戶合法權益的第一道關口,在網絡安全中有著重要的作用。本文首先調研了近年來身份認證的熱門技術及應用領域,然后,將常用于心理研究的Rasch模型應用于身份認證,根據節點過去的交往行為形成實體集認證矩陣,并代入數據分析工具Mini-step進行分析,根據分析結果評估出各實體節點的身份可靠性概率。
【關鍵詞l身份認證;Rasch模型;Mini-step
引言
隨著互聯網技術的發展,社交網站和各類社交軟件的快速涌現,傳統意義上人與人之間的社會關系已經發生了重大的變化,網絡安全問題日益突出,對網絡中的節點進行身份評估成了一大需求。本文通過將拓撲網絡中通信實體抽象為節點,由于每個節點均可發送和接收數據,并可以與一個或多個對等節點直接通信,故極易受到內部惡意節點攻擊。一旦網絡中的某個節點被控制,便可在網絡中發布虛假信息或進行內部攻擊(節點訪問控制,惡意流量控制等)造成網絡癱瘓。因此對節點身份進行認證,識別網絡惡意節點具有重大意義。
國內外學者對多個網絡應用領域的身份認證做了研究。為了防止學生在考試時作弊和平時成績抄襲等情況,針對Mooc中的身份認證提出了基于雙因子模糊認證與區塊鏈技術,模糊認證即身份認證不再是簡單的提取單個圖文數據信息,而是由若干個屬性的集合,信息比對的不再是準確度,而是重疊程度。雙因子采樣分為兩個階段,首先由注冊階段由Mooc生成公鑰,然后公鑰與學生信息綁定,學生(身份證+指紋)生成私鑰。最后將信息加密存儲。然后驗證階段采取模糊認證,因為生物信息不可避免地會產生誤差。作者還把應用了區塊鏈技術,即生成一個空開的賬本,記錄學生的學習軌跡,區塊鏈技術確保了信息的不可篡改,只能添加。最后通過上述信息對學生頒布數字證書。
由于數據的暴漲,云計算孕育而生,然而如何在云計算中對動態變化的數據用戶進行身份認證就顯得十分重要并且由于用戶量大,如果把身份認證的重擔都放在云服務器上勢必會降低效率,故提出一種面向注冊用戶的身份認證方法和一種面向本地代理服務器的身份認證方法。在身份認證策略中,將身份認證放在本地服務器上執行,將加密代理HE-RSA加密算法,由云服務器執行,提高了云服務器的效率和用戶訪問的可擴展性。
傳統的身份認證技術用的是賬號密碼策略,安全性強一點的使用OTP、手機短信認證等方式。比較成體系的主要是4A和IAM,雖然也采用大數據分析來改進,但還是存在著許多安全問題。而區塊鏈技術具有“單向加密、時間戳、去中心、不可篡改、全網保存、分布式共識”等特點,把采集到的身份信息通過區塊鏈進行信息存儲,提高用戶信息的安全程度和身份認證的準確性。身份認證的大致流程:首先拍照收集個人證件信息,將個人身份信息寫入區塊鏈中,將加密的圖像信息存放到身份服務器;其次將身份信息發送給第三方代理,代理根據個人信息完成認證令牌的頒發并發送到區塊鏈中;再次通過區塊鏈的共享,新的代理應用可以從區塊鏈獲取個人身份信封數據和加密圖像以及令牌;最后,新代理應用再次采集用戶生物信息進行驗證,達到正確認證個人的目的。
在優化基于挑戰/應答機制的一次性口令認證方案的基礎上在認證因子中加入硬件表示信息以及基于北斗衛星導航系統的所獲得的位置信息和時間戳信息,同北斗指控中心的信息比對反饋,完成節點間的多因素雙向認證。在初始階段,主要完成節點的密鑰生成、身份注冊、密鑰分發。在認證階段,兩個節點A、B之間先進行互相的加解密信息發送,匹對隨機數副本,一致后發送至北斗指控中心。中心解密后返還信息給A節點,來認證B節點的真實性。再通過B節點進行類似操作驗證A節點的真實性,至此雙向認證結束。
基于用戶鼠標行為的身份認證方法主要是通過各個用戶使用鼠標時的差異行為來進行認證的。在一定的時間內記錄下用戶使用鼠標的基本行為(移動、點擊、拖拽、滾屏、靜置),記為一級特征;在一級特征基礎上進行的組合操作行為為二級特征。其中二級特征能夠有效降低認假率。最終通過極限學習機作為分類器來計算一級特征和二級特征的數據(隨機輸入權重與偏置來確定隱藏的輸出矩陣,從而求解線性系統。運算中的隱藏節點數是一個很重要的參數影響認證的準確性),實現身份認證。
上述身份認證方案對各領域網絡安全研究作出了重要貢獻,但方案本身由于大多采用密碼學方法,存在著計算量大、復雜度高、開銷多的缺陷。本文研究了心理學中應用廣泛的Rasch模型,將其應用于身份認證中,并用Mini-step工具進行分析,借此評估各實體節點的身份可靠性。
一、Rasch模型
Rasch模型的客觀性以一組假定為前提:
a.實體集A與B都有其特定的可信值。
b.他們的可信值都以數值形式呈現在同一個尺度上。
c.通過實體A與B認證的結果,即其得分值,我們可以推算出A與B集合的可信度。
Rasch模型擁有以下幾個特性:
(一)節點與測試的獨立性
由于大多數身份認證模型過于依賴設備(如服務器),在實際應用中往往存在諸多問題,如服務器故障或無法識別惡意節點等,造成了服務器質量與節點身份之間很強的依賴關系,缺乏客觀陛。在Rasch模型中,節點的身份是由節點通信中的“表現”所決定的,因此不具有依賴性。
(二)模型簡單
從社會學角度看,信任關系是最復雜的社會關系之一,是一個很難度量的抽象的心理認知,當實體之間的信任關系不能明確定義的時候,它也是不穩定的,給它的管理和評估帶來了困難,這一困難在復雜網絡中更加明顯,由于社區量龐大,節點數眾多,給數據分析與模型建立帶來了挑戰。而Rasch模型將多個受試個體在多次通信中的數據得出的二維0、1矩陣通過對數轉換,也就是Logit方法(D Andrich,1982)轉換,由于運算量小,數據采集簡單,很好地解決了在實際應用中數據量龐大的問題。
二、基于Rasch模型的身份認證技術
在Rasch模型中我們假定有兩個實際集A1…A7與B1…B7,他們互相認證情況如表l所示,l代表認證成功,0代表認證失敗。
三、Mini-step的數據分析與驗證
Mini-step是一種常見的基于Rasch模型的數據分析軟件。本文使用該軟件對測試數據進行分析處理,將其結果與上文的算法進行對照匹配以進行驗證。
(一)能力值及難度值
通過MINISTEP軟件我們可以方便地得到實體A和B可信度的Logit圖,如圖1。
從上圖中我們不難看出,左側為A的可信度Logit值,越往圖的上方則可信度越強。A實體集可信度從高到低為:A3、A6、A2、A1、A7、A5、A4。而B實體集可信度從高到低為:B1、B10、B9、B4、B6、Bll、B2、B5、B8、B3、B7。
(二)異常樣本
由chi-square統計量除去自由度所得的商為均方Mean-Square,可知均方的值應約等于1。如果均方值大于1,則為Underfit,表示數據中有外界因素影響了測量質量。如果均方值小于1,則為Overfit,表示數據十分符合,若過分符合也會影響其可信度。可以通過Outfit的氣泡圖(圖2)來進行觀察。
從圖2中的Measure維度看,A和B的廣度大致一致,稍有偏差,而從Outfit Mean-Square維度上看,大部分的A和B還是位于l的附近的,基本符合要求,只有B3節點明顯處于Underfit區即“不舒適區”。可以得出結論,大部分實體的結果都較為可信,從中發現了A3與B1、B10、B9最為可信的節點,并對A1、A7、A5和B8、B5、B3實體表示懷疑。如果本次測試數據來源于真實實驗觀察值則會更符合要求,論文中的測試數據僅供學習探討。
結語
本文通過對網絡節點的相互認證結果進行分析,從而得到最可靠節點與不可靠節點以及可疑節點,評估出各自節點身份的可信度,完成身份認證。理論上,數據量越龐大,節點越多,得到的值越精確。本文沒有對大規模節點通信數據進行研究,還有進一步研究的意義。