文/金振乾
基于擊鍵特征的身份識別技術在考試系統(tǒng)中的應用
文/金振乾
在線考試使用簡便,功能強大效率高,受到師生歡迎。但在線考試過程中容易出現(xiàn)替考行為。為減少此類情況發(fā)生,本文提出通過擊鍵特征進行考生身份識別,通過記錄和分析學生使用鍵盤的參數,進行身份識別,從而有效幫助教師發(fā)現(xiàn)替考行為。
行為特征 擊鍵特征 身份識別
在線考試因收發(fā)卷方便,批改和統(tǒng)計結果準確率高、速度快,正在被越來越多的教師采用。但在考試過程中,學生不是直接將試卷提交給教師,而是利用終端提交給服務器,導致更容易出現(xiàn)替考行為。因此必須使用其他身份驗證措施,減少乃至杜絕替考行為。其中,行為特征識別能夠兼顧識別效果、成本和復雜度,適用于考試環(huán)境。
早在20世紀80年代,Gaines等人研究發(fā)現(xiàn),每個人敲擊鍵盤的特點是不同的,并由此產生了擊鍵動力學。相關研究成果表明,綜合分析每個人敲擊鍵盤時的按鍵力度、按鍵位置、按鍵行程、按鍵持續(xù)時間、按鍵間隔時間等參數,可以有效分辨用戶的真實身份。
通過擊鍵特征進行身份識別的過程中,特征數據覆蓋面越廣,數據量越大,算法越先進,越容易得到準確的判斷結果。
在現(xiàn)實環(huán)境中,很難收集到高覆蓋面的大量特征數據,從而降低了識別效果。
特征識別的目的在于減少和杜絕替考行為,因此在學生登錄系統(tǒng)環(huán)節(jié)采集特征樣本,識別目的為用戶身份是否與賬戶名相對應。這是因為:大多數學校使用的在線學習系統(tǒng)兼顧作業(yè)和考試功能,學生在平時會多次登錄系統(tǒng)并輸入學號、賬號和密碼等信息。這些信息均為固定擊鍵序列,學生輸入熟練,模式性更強,受硬件因素影響小,更容易識別;擊鍵特征識別的目的是輔助教師發(fā)現(xiàn)替考行為,只需要提出警告即可,具體處理仍由教師進行。
擊鍵特征主要通過四種時間參數來表現(xiàn):
P-R時間:按下一個按鍵到釋放該按鍵的時間間隔,也叫持續(xù)時間;
P-P時間:相鄰兩次按下按鍵的時間間隔;
R-P時間:釋放一個按鍵到按下下一個按鍵的時間間隔,也叫間隔時間;

圖1:12431023號學生擊鍵特征分布圖

圖2:12421005號學生擊鍵特征分布圖
R-R時間:相鄰兩次釋放按鍵的時間間隔。
系統(tǒng)只需監(jiān)測P-R時間和R-P時間,即持續(xù)時間和間隔時間,另兩個參數可用P-R時間和R-P時間推算。系統(tǒng)需要采集的數據包括:
輸入學號時P-R時間:

輸入學號時R-P時間:

輸入姓名拼音時P-R時間:

輸入姓名拼音時R-P時間:

輸入密碼時P-R時間:

輸入密碼時R-P時間:

其中:
x表示學號長度;
y表示姓名拼音長度;
z表示密碼長度;
m表示采集數據的次數。
圖1和圖2分別為學號為12431023和12421005的兩名學生輸入自己學號時的R-P數據分布。
每個學生的擊鍵數據是有規(guī)律的,每次擊鍵的特征數據符合正態(tài)分布規(guī)律,即大量數據會集中于某個區(qū)間之內。但也有大于這個區(qū)間或小于這個區(qū)間的數據,即噪聲數據。為簡化計算,本文將噪聲數據舍棄,不進行計算,并采用數據標準差進行識別運算。
計算正常數據的標準差:

Si是數據集中第i個數據的標準差;
k是數據集中第i個數據的采集次數。
當學生登錄考試系統(tǒng)時,采集輸入學號、輸入姓名拼音、輸入密碼時產生的R-P值和P-R值,共六組數據。計算每一組數據和對應數據集的平均值的差值。假設每組數據中有N項數值,將會產生N個實際數據和平均值的差值,如果有一定范圍數據的差值小于標準差,就認為該組數據是由正確的學生輸入的,可認為登錄學生的身份沒有被仿冒,否則向監(jiān)考老師發(fā)出警報,以便教師進行進一步核查。
在測試過程中,筆者共提取了22名學生的擊鍵數據,其中17人的數據有效。經過驗證,如果范圍閾值設定為70%,該算法可以實現(xiàn)11.8%的FAR(False alarm rate,合法用戶的拒絕比例)。如果將閾值降低到65%,那么FAR可以降低到0%。
較高的閾值可能產生較高的誤報率,但會減少替考的可能性;而較低的閾值誤報率較低,但也會降低替考者的識別比例。綜合監(jiān)考教師工作量、服務器運算量、誤報率和替考識別率等多方面因素,閾值設定為65%到70%之間可以取得較好的平衡。
在后續(xù)研究中,將進一步研究噪聲數據對識別率的影響,同時使用計算機深度學習等算法,在不過多增加運算壓力的前提下提高識別率,降低誤報率,使之發(fā)揮更大的作用。
[1]程葉霞,薛質.基于擊鍵特征匹配的單點登錄系統(tǒng)[J].通信技術,2012,45(01):99-101.
[2]傅博.基于擊鍵序列特征提取的用戶身份認證[D].陜西師范大學,2008.
[3]張治元,田國忠.基于擊鍵韻律的身份認證模型設計與實現(xiàn)[J].計算機應用,2009,29(10):2799-2801.
[4]朱明,周津,王繼康.基于擊鍵特征的用戶身份認證新方法[J].計算機工程,2002,28(10):138-139.
作者單位 河南司法警官職業(yè)學院 河南省鄭州市450000
金振乾(1981-),男,河南省封丘縣人。碩士學位。講師。研究方向為程序設計和信息化教學方向的研究。