馬馨雅
摘 要:在不少情境下都存在著考勤制度,例如公司針對外勤員工的考勤,老師針對學生的考勤等。目前現存的一些考勤方式往往存在一定程度上的漏洞,使得被考勤的人員總是有機可乘。基于此,文章提出了一種將GPS定位和人聲識別結合于一體的考勤方式,以防止員工或學生在考勤時鉆空子。
關鍵詞:GPS定位;聲紋識別;考勤
考勤制度存在于人們生活中的許多方面,涉及的人除了常見的公司員工,還有廣大大學生等。早些時候,常見的考勤的制度是紙質簽到,后期又延伸出了掃碼簽到等,但是顯而易見地,這種考勤方式是最容易被代簽的。后來,又有了指紋簽到等較為高科技的簽到方式,但是該方式的速度較慢,成本較高,且不利于外勤人員進行簽到。目前最常使用的還有使用軟件,根據判斷簽到時的GPS定位進行簽到,這種方式雖然成本較低,便于管理外勤人員,但是一旦“人機分離”,依舊很容易作弊[1]。
因此,本文提出了一種將GPS定位和人聲識別結合于一體的考勤方式。目前,GPS定位技術已經較為成熟,許多考勤軟件中都在使用這項技術。但是光靠GPS定位來簽到也容易作弊。聲紋識別技術,是生物識別技術中較為成熟的一種,它能夠有效地辨別人聲。結合了GPS定位和人聲識別的系統,能夠在定位的同時,識別使用者是否用戶本人,這就可以有效地避免作弊現象的發生。
1 概述
1.1 聲紋識別技術
聲紋識別的基本原理可以理解為:將要判斷的說話人的模型特征與訓練模型進行匹配,之后再根據得到的匹配率或概率值進行辨認或確認操作[2]。
本文中,本人選擇的是梅爾倒譜系數(Mel-scale Frequency Cepstral Coefficients,MFCC)。MFCC和基于線性預測的倒譜一比較,MFCC的顯著優點是:它不依賴全極點語音產生模型的假定。并且,通常在與文本無關的說話人識別系統中,MFCC可以非常好地提高系統的性能[3]。在文本相關的聲紋識別系統中,MFCC的表現也十分優異。因此,可以選用MFCC。本文中,把MFCC用于隱馬爾可夫模型(Hidden Markov Model,HMM)的訓練過程與識別過程中。HMM模型在聲紋識別系統中應用得較為廣泛[4],HMM中針對每一幀語音,每一個音素都有特征向量,而此處,采用何種特征向量,則可以按照具體情況而定。
1.2 GPS定位
該系統是基于安卓系統開發的。安卓是一款開源的系統,其開發成本較低,可用的API較多。在這個系統中,擬基于百度地圖LBS定位,進行SDK二次開發。同時還利用了百度地圖LBS云來作為該系統的服務端。之所以采用這種開發方式,是為了減輕該系統的服務器端的壓力。圖1為云存儲字段定義方式的部分摘錄。
2 系統設計
圖2是聲紋識別模塊的結構。從圖中我們可以清楚地看到,圖上一共有兩個錄音設備。第一個錄音設備是用于訓練模型,用戶在第一次使用該系統時需要根據系統提示的文本進行語音輸入,系統會對用戶的聲紋進行采集并提取特征,進行模型的訓練,并將該模型上傳到服務器上;之后,在正式使用該系統時,用戶需要語音輸入系統給出的文本,由系統對聲紋再次進行采集并提取特征,將得到的模型與服務器上的模型進行匹配。如果匹配成功,則認定為用戶本人。此時,如果GPS定位也在預設地點的某個范圍內,則認為是一次成功的打卡行為。
在第一次進行聲紋模型采集時,使用的文本是固定的。但是在隨后的使用中,為了防止預錄音的情況發生,系統所給出的文本將會是隨機的。
外勤人員的考勤地點并不固定,且室外環境較為嘈雜。因此,本文中為了提高這個考勤系統在嘈雜環境下的性能,聲音要進行過濾。同時,用戶的語音特征不是保持不變的,而是會發生改變的。在研究本系統的過程中會進行許多次實驗測試以及計算來確定一個最優閾值。
3 結語
本文中研究的是一款Android平臺上的結合了聲紋識別和GPS定位的雙重認證考勤系統。用戶在使用該系統時需要先上傳自己的聲紋模型,考勤時需要通過語音輸入來匹配聲紋模型,若匹配成功還需結合GPS定位的情況,只有在工作地點的某個范圍內,才能算作是一次合格的考勤。同時,管理員還可以在后臺查看員工的打卡情況,包括打卡時間、定位情況和聲紋匹配結果。而且管理員還可以發布打卡任務。該系統簡單易用,成本較低,適宜廣泛推廣,并且能夠有效地減少考勤的作弊情況,提升用人單位的監管效率。
[參考文獻]
[1]季敏飛,彭媛媛,萬可鑫.基于GPS與聲紋的手機考勤識別研究[J].電腦迷,2017(7):174.
[2]沈陽麗,趙啟升.GMM-UBM聲紋識別技術研究與應用[J].電腦編程技巧與維護,2017(16):84-86.
[3]曹輝,徐晨,趙曉,等.說話人識別中的Mel特征頻率倒譜系數[J].西北大學學報(自然科學版),2013(2):203-208.
[4]姚敏鋒.基于HMM的聲紋考勤算法改進[J].電腦與信息技術,2016(5):22-25.