999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于神經網絡的口令屬性分析方法

2015-08-07 12:14:27陳銳浩邱衛東
微型電腦應用 2015年4期
關鍵詞:模型

陳銳浩,邱衛東

基于神經網絡的口令屬性分析方法

陳銳浩,邱衛東

提出了一種適用于大量口令的分析方法,通過神經網絡建模分析,挖掘口令的各項屬性間可能存在的關系。通過對大量不同應用類型的口令進行屬性賦值,進而利用MATLAB的神經網絡工具完成建模、訓練學習和仿真測試,從中找出潛在的有價值的屬性間關系或規則,并根據這些關系由已知的屬性值推斷出未知屬性值,或根據這些屬性規則生成反映用戶口令設置習慣的暴力破解字典,為口令破解和口令恢復提供一定的指向性和幫助。

神經網絡;口令;屬性賦值;分析

0 引言

人工神經網絡,簡稱神經網絡,是一種模仿生物神經網絡的結構和功能的數學模型或計算模型,由稱為神經元的基本處理單元互連而成的非線性復雜網絡系統。

用人工神經網絡解決計算機密碼學中的問題,即神經密碼學。經過對現有技術的檢索發現,目前對于神經密碼學的研究主要集中在加密機制、加密系統的改進上,如文獻[1]中,針對S/KEY一次性口令方案中存在的缺陷,作者提出的基于RBF神經網絡的一次性口令認證方案;再如文獻[2]提出的Web動態口令登錄新方法,利用神經網絡權值同步模型的良好密碼學特性,將其應用到密鑰協商中[3~4],獲得更高的安全性。然而,利用神經網絡對口令本身的研究卻幾乎沒有,而事實上,通過分析口令特點挖掘用戶設置口令的習慣,具有重要現實意義。因為,在生活中,為了方便記憶,用戶在設置口令時,通常會采用手機號、生日、姓氏、英文單詞等作為口令或口令的一部分,對于不同類型的應用場景或用戶群體,也存在各種各樣的口令設置習慣,有些甚至用戶自己都沒有意識到,而這些習慣,都直接體現在口令上。有效地挖掘出這些潛在的規則,對于生成暴力破解字典、口令破解和口令恢復都有著重要意義和研究價值。

由于口令的不同屬性(長度,是否包含大小寫、特殊字符、手機號、生日、姓氏等)之間通常不存在明顯的關系,難以通過人工進行高效的分析判斷,而神經網絡作為一種非線性統計性數據建模工具,常用來對輸入和輸出間復雜的關系進行建模,對于口令屬性這種未知關系的探索,無疑是非常適用的。采用神經網絡探索口令屬性間關系,我們能夠通過對不同的口令屬性關系建立對應的神經網絡模型,在有限時間內,利用大量口令數據的迭代測試不斷逼近產生最接近真實的關系模型,從中篩選出有意義、有價值的屬性關系。

1 方法的介紹

本文提出的基于神經網絡的口令屬性分析方法,主要包括獲取口令屬性數據源、確定神經網絡模型、訓練學習、仿真測試等幾個主要環節。其中,神經網絡分析采用MATLAB軟件,口令數據經屬性賦值后作為神經網絡的數據來源讀入MATLAB,確定好網絡模型和相關參數后,依次進行模型訓練學習、仿真測試并輸出結果。

1.1 口令屬性賦值

所謂口令屬性賦值,是指對于每一個真實口令,賦予其一些屬性特征,通過分析其組成成分和組成特征,來對這些屬性特征進行賦值。通過口令屬性賦值,每一個口令都有自己對應的一組屬性值,用來表現該口令的組成特點,其意義在于將口令特征數字化,將抽象問題具體化,從而能夠通過這些屬性值進行分析處理以獲得屬性間有價值的關系,即獲得口令組成的潛在規則或用戶設置口令的潛在習慣。

屬性賦值的結果就是神經網絡分析的數據源,從而可以進一步利用MATLAB下的神經網絡工具對這些數值進行有效的分析計算。

1.2 神經網絡工作原理

神經網絡的基本工作原理可簡述如下:每個神經元是由一個計算單元構成,該單元具有多個輸入和單個輸出。其功能是對各個輸入信號作非線性權值運算,并通過輸出端輸出至其他神經元。整個網絡工作過程分為訓練和求解兩個階段。當已知訓練樣本的數據加到網絡輸入端時,網絡的學習機制一遍又一遍地調整各神經元的權值,使其輸出端達到預定的目標。這就是訓練(學習、記憶)過程。當經過訓練的網絡進行問題求解時,輸入的求解信號在網絡內迅速地傳遞、處理。當網絡達到穩定狀態時,從輸出端即可得到問題的解。

1.3 確定神經網絡模型

確定神經網絡模型,就是根據實際需求在MATLAB下確定一個神經網絡的網絡類型(如BP網絡、RBF網絡、Hopfield網絡等)、輸入輸出、網絡層數與各層神經元個數、訓練樣本和仿真樣本容量,傳遞函數和訓練函數等相關函數及參數設置。

1.4 訓練學習

訓練學習,是指在MATLAB下,通過采用一定容量的輸入輸出樣本,對初步設定的神經網絡模型中各神經元權重進行不斷調整,從而建立最逼近真實關系的網絡模型的過程,也稱為自動學習過程。

1.5 仿真測試

仿真測試,是指在MATLAB下,對已經確定好的并且經過訓練學習所得的神經網絡模型,采用一定容量的輸入樣本對該網絡進行運算測試,目的在于通過對比網絡輸出結果與實際樣本結果的差異來驗證網絡的準確性和有效性。

2 實驗與分析

如圖1所示:

圖1 基于神經網絡的口令屬性分析流程

基于神經網絡的口令屬性分析流程包括:獲取原始口令庫樣本、對口令樣本進行屬性賦值、MATLAB讀取并存儲口令屬性樣本、確定輸入輸出屬性、確定神經網絡模型、訓練神經網絡、仿真測試,最終導出有用規則。具體實施步驟如下。

2.1 獲取原始口令樣本

即選擇需要分析的真實口令庫文件,實驗中采用的是CSDN論壇泄露的640萬口令庫文件。

2.2 口令屬性賦值

即獲取口令屬性數據源,為了更完整地表現口令特點,該步驟的關鍵在于屬性的定義,屬性必須具備實際意義,能夠充分表現用戶設置口令的習慣,具有較好的靈活性,并有利于分析出有效的結果,具體可通過社會工程學等手段來進行制定。本方法確定采用的20個屬性如表1所示:

表1 口令屬性表

其中,所有屬性值均為布爾值,1為真,0為假。

實驗中,采用java程序按照以下流程,對原始口令樣本進行屬性賦值:

1)載入百家姓、常見英文名字、簡單英文單詞等各類字典文件;

2)載入口令文件,讀取待分析的每個口令;3)判斷口令長度(對應屬性1~4);

4)判斷口令字符成分(對應屬性5~13);

5)判斷口令組成(對應屬性14~20);

6)將口令屬性拆分結果寫入csv文件中。

原始口令庫經過自動化分析處理后,得到每個口令對應的20個屬性值,結果如下(每一行對應一個口令):

0,1,0,0,1,0,0,1,1,0,0,0,0,1,0,0,0,0,0,0,

1,0,0,0,1,0,0,0,1,0,0,1,0,1,0,0,0,0,0,0,

……

例如“0,1,0,0,1,0,0,1,1,0,0,0,0,1,0,0,0,0,0,0,”表示該口令的長度為7-8位,包含字母,包含大寫字母,包含小寫字母,包含百家姓,其他屬性皆為假。

2.3 MATLAB讀取口令屬性樣本

即運行MATLAB軟件,讀取csv文件并將口令屬性值保存在MATLAB下的矩陣變量中,作為口令屬性樣本,并為下面的訓練學習和仿真測試提供數據樣本。

2.4 確定輸入輸出屬性

本方法旨在分析口令屬性間關系,輸入輸出屬性即為所要分析的兩個或多個屬性,以其中的一個屬性為輸出,另一個或多個屬性為輸入,建立對應的網絡模型,探索它們之間可能存在的關系。例如,欲分析表1中第1到19個與第20個屬性之間的關系,則輸入為1~19個屬性值,輸出為第20個屬性值。值得注意的是,輸入可為一個或多個屬性,而輸出只能是某一個屬性。

2.5 確定神經網絡模型

1)確定網絡類型

為獲得最佳實驗效果,在初步確定RBF網絡(即Radial Basis Function Network,徑向基函數網絡,一種使用徑向基函數作為激勵函數的人工神經網絡)和BP網絡(即Back-Propagation Network,反向傳播網絡,一種按誤差逆傳播算法訓練的多層前饋網絡)這兩種適用的網絡類型后,經多次實驗發現,同等條件下(包括樣本數量、網絡層數、神經元個數等)BP網絡的訓練時間開銷遠小于RBF網絡,所得網絡的仿真效果也優于RBF網絡,故而本方法全部采用BP網絡。

2)確定網絡層數

BP網絡由輸入層、中間層和輸出層構成。其中,中間層可為單層或多層,由于它們和外界沒有直接的聯系,故也稱隱層(或隱含層)。實驗過程對比測試了單隱層和多隱層的網絡結構,結果表明,多隱層網絡仿真準確率小于或等于單隱層,而網絡訓練時間開銷卻大于單隱層。在多次實驗后,確定采用單隱層結構的BP網,即2層結構的BP網絡(注:網絡層數指隱層和輸出層,一般不計算輸入層)。

3)確定各層神經元個數

對應網絡層數的概念,神經元的個數是指隱層和輸出層的神經元個數,而與輸入層無關。

a. 單隱層神經元個數:一般依據如下經驗公式取值

I. (輸入維數+輸出維數) / 2

II. (輸入維數*輸出維數)1/2 + a,a為1~10之間的常數

b. 輸出層神經元個數:與輸出屬性維數一致,此處取1。

MATLAB神經網絡中2層BP網絡的結構示意圖,如圖2所示:

圖2 兩層BP網絡結構

其中,輸入維數為19(即19個輸入屬性),輸出維數為1(即1個輸出屬性),對應分析輸入的19個屬性與輸出的1個屬性間的關系;隱層數為1,包含10個神經元;輸出層數為1,包含1個神經元。

4)確定訓練樣本容量

訓練樣本,是指神經網絡學習過程用于校正逼近網絡各層權重的數據樣本。

經多次實驗發現,在網絡類型確定(BP網絡)的情況下,隨著網絡訓練樣本容量的增大,訓練時間不斷增大,而所得網絡的仿真準確率先增大后趨近于同一個數值。當訓練樣本容量為1萬時,所得網絡仿真測試準確率較高;樣本容量大于1萬(如10萬、100萬、640萬)時,訓練時間急劇增大,而對應的仿真準確率卻無明顯變化甚至有所降低。實驗統計數據如表2所示:

表2 訓練樣本容量與訓練時間統計表

1) 確定仿真樣本容量

仿真樣本(或稱測試樣本),是指在神經網絡中經過學習訓練所得的網絡為進行仿真測試以獲得輸出結果的輸入樣本。

仿真樣本容量越大,仿真計算時間開銷越大,對計算機系統內存要求越高。為了更準確全面地反映訓練所得網絡的仿真準確率,實驗采用CSDN全體口令屬性樣本(640萬)作為仿真測試樣本。因仿真測試時間遠小于網絡學習訓練時間,此處不列舉相應時間開銷。

2) 確定相關函數和參數設置

神經網絡(BP網絡)第1層單隱層采用正切Sigmoid傳遞函數“tansig”,第2層輸出層采用線性傳遞函數“purelin”,訓練函數則采用動量梯度下降反向傳播算法“traingdm”。

2.6 訓練神經網絡

確定網絡類型、結構、輸入輸出和相關參數設置后,便可運行MATLAB編程文件開始網絡訓練,以獲得最能表現真實輸入輸出樣本關系的網絡模型,此處不展開。

2.7 仿真測試

完成網絡訓練后,為了檢驗所得網絡模型的有效性和準確性,必須利用該網絡對仿真樣本進行測試。采用仿真樣本作為輸入,通過當前網絡仿真計算出輸出,對輸出結果進行適當處理后,與實際樣本結果進行對比,計算出仿真準確率,以此評估當前網絡的有效性和準確性,分析當前輸入輸出對應的口令屬性間是否存在有價值的關系。

2.8 輸出結果

即完成仿真測試后,導出其中有價值的屬性規則。本方法旨在利用神經網絡分析挖掘口令屬性間的關系,一種有意義有價值的屬性關系,可以看作一條有用的規則,對應于MATLAB下一個有效的神經網絡模型。如何判斷一種關系是否有意義有價值?實驗中以該關系對應的神經網絡模型仿真準確率高低進行衡量。當仿真準確率大于某個數值(如80%),可以認為這個模型是有意義的,即對應的輸入輸出屬性之間的關系是有價值的。CSDN的640萬口令分析所得的部分有意義的屬性關系如表3所示:

表3 CSDN口令屬性關系表

因版面所限,網絡模型信息未完全列入表中,補充說明如下:訓練樣本容量均為1萬,仿真樣本容量均為640萬,網絡結構均為2層BP網絡,輸出層神經元個數均為1 。(注:表中屬性1~20所代表的含義詳見表1)

在上表中,每一條記錄代表一條規則,一個有意義的神經網絡,也是一種有價值的屬性關系。例如前4條記錄,表示根據屬性1~9,能夠推斷出屬性10、11、12、13。

3 總結

本文針對口令本身的研究提出了基于MATLAB的神經網絡口令屬性分析方法,根據該方法,可以對不同類型的口令庫(如論壇口令、郵箱口令、人人網等社交網站口令)進行屬性分析,獲得相應的有意義的規則(屬性關系),進而生成反映用戶口令設置習慣的破解字典,為口令破解和恢復提供指向性幫助。以CSDN口令庫為例,分析可得如下規則:

①規則1——輸入屬性:5.包含字母,14.包含中文姓氏;輸出屬性:9.包含小寫字母

②規則2——輸入屬性:3.長度9~11位,5.包含字母;輸出屬性:6.包含數字

那么,我們可以根據這兩個規則生成包含小寫字母的百家姓字典,以及長度為9~11位包含數字和字母的字典。當然,若要挖掘出更能表現用戶口令設置習慣、更有價值的規則,那么,對于屬性的定義和有價值屬性規則的判定方法這兩個環節,還需要做進一步研究。

此外,實驗發現,同樣的規則(屬性關系),在CSDN口令庫下是有意義的,然而當口令類型發生改變,比如將CSDN論壇口令庫換成126郵箱口令庫,則這些規則不一定都適用,仿真準確率也會發生變化(或提高或降低)。這也反映出不同類型(論壇、郵箱、社交網站等)口令,屬性間關系不盡相同、用戶口令設置習慣有所差異。

[1]方俊,趙英良. 基于RBF神經網絡的一次性口令認證方案[J]. 計算機工程, 2011, 37(9):157-159.

[2]陳鐵明,陳會兵,潘小明,蔡家楣. Web動態口令登錄新方法設計與實現[J]. 計算機應用于軟件, 2011, 28(7):31-34.

[3]蔡家楣,嚴杜鵑,陳鐵明. 一種基于神經網絡權值同步的TinySec協議密鑰更新方案[J]. 計算機科學, 2009, 36(4):84-86.

[4]田勇,向濤. 神經網絡同步的判定及在神經密碼中的應用[J]. 計算機工程與應用, 2011, 47(36):109-111.

Analysis Method of Password Attributes Based on Neural Network

Chen Ruihao, Qiu Weidong
(College of Information Security Engineering, Shanghai Jiaotong University, Shanghai 200240, China)

This paper proposes an analyzing method which is fit for a large number of passwords. By building up a neural network model, it can analyze and dig for potential relationships between password attributes. After attribute assignment for passwords of different application types, it can utilize neural network tool in MATLAB to finish model building, training and simulation testing, in order to find out potential and valuable relationships or rules between attributes. With such relationships, it can help to deduce unknown attribute values from the already known ones, or provide some directivity help for password cracking and recovery work by generating brute force cracking dictionary, which reflects the users’ habits of password setting.

Neural Network, Password, Attribute Assignment, Analysis

TP183

A

2014.12.11)

1007-757X(2015)04-0045-03

陳銳浩(1989-),男,廣東潮州,上海交通大學信息安全工程學院,碩士研究生,研究方向:密碼學與計算機取證,上海,200240

邱衛東(1973-),男,江西九江,上海交通大學信息安全工程學院,教授,研究方向:密碼學與計算機取證,上海,200240

猜你喜歡
模型
一半模型
一種去中心化的域名服務本地化模型
適用于BDS-3 PPP的隨機模型
提煉模型 突破難點
函數模型及應用
p150Glued在帕金森病模型中的表達及分布
函數模型及應用
重要模型『一線三等角』
重尾非線性自回歸模型自加權M-估計的漸近分布
3D打印中的模型分割與打包
主站蜘蛛池模板: 中文字幕资源站| 美女高潮全身流白浆福利区| 亚洲男人天堂网址| 久久久精品国产SM调教网站| 亚洲AV无码不卡无码| 色噜噜中文网| 伊人网址在线| 欧美日韩中文国产| 不卡无码h在线观看| 亚洲 欧美 中文 AⅤ在线视频| 国产成人精品一区二区免费看京| 亚洲日韩AV无码精品| 国产高清国内精品福利| 热九九精品| 欧美三级自拍| 欧美精品亚洲精品日韩专| 欧美另类视频一区二区三区| 538国产视频| 国产丝袜91| 精品小视频在线观看| 欧美成人午夜在线全部免费| 小说 亚洲 无码 精品| 波多野结衣在线se| 亚洲av片在线免费观看| 国产三级国产精品国产普男人| 亚洲欧美综合另类图片小说区| 欧美日韩国产系列在线观看| 久久无码高潮喷水| 欧美激情,国产精品| 99草精品视频| 一本大道视频精品人妻| 天堂成人在线| 国产成人精品高清在线| 亚洲无码视频图片| 免费国产无遮挡又黄又爽| 免费看一级毛片波多结衣| 欧美高清国产| 99爱在线| 国产成人调教在线视频| 亚洲中文字幕av无码区| 超碰91免费人妻| 欧美日韩va| 国产高清色视频免费看的网址| 98精品全国免费观看视频| 最近最新中文字幕在线第一页| 一级爆乳无码av| 久草视频福利在线观看| 午夜色综合| 国产午夜看片| 国产在线一区视频| 成人91在线| 伊人蕉久影院| 亚洲无码久久久久| 狠狠色噜噜狠狠狠狠色综合久| 亚洲无码高清视频在线观看 | 欧美一级大片在线观看| 国产激情第一页| 欧美日韩一区二区三区在线视频| 97影院午夜在线观看视频| 毛片国产精品完整版| 91九色国产porny| 99这里只有精品免费视频| 免费一级毛片不卡在线播放| 欧类av怡春院| 欧美成人精品在线| 黄色一及毛片| 国产91视频免费| 无码区日韩专区免费系列| 在线国产三级| 国产不卡一级毛片视频| 伊人久综合| 国产高清在线丝袜精品一区| 免费一级α片在线观看| 大陆精大陆国产国语精品1024| 日韩欧美91| 91免费国产在线观看尤物| a国产精品| 日本欧美在线观看| 在线a网站| 国产麻豆永久视频| 亚洲第一极品精品无码| 色噜噜在线观看|