賴尊文
摘 要:本文分析了一種新型語音識別智能鎖的系統設計架構,同時闡述了一種新型語言識別智能鎖的關鍵算法與處理流程,最后結合已有經驗,分析與闡述了一種新型語言識別智能鎖的性能優化設計。旨在全面了解一種新型語言識別智能鎖的優化設計方法,確保其應用的高效和穩定。
關鍵詞:語音識別;新型智能鎖;設計架構;優化設計
中圖分類號:TN912 文獻標志碼:A
1 一種新型語音識別智能鎖的系統設計架構
在語音識別技術的應用下,成功地把聲控功能應用到了鎖具之中,進而有新的一種帶有語音識別功能的智能鎖出現。眾所周知,語音信號實際上是屬于是一個慢時間變化的信號。在具體應用環節,能夠把語音信號劃分成若干幀用于提取短時語音特征,且在幀內按照規定信號進行分析與處理。針對“特征提取”這一環節內容需要把數字語音信號按照8ms~20ms短時段的形式對數據進行分組處理,且鄰段之間可相互重疊。通過一系列提前擬定好的特征提取程序能夠將每一短時段內的特征向量計算出來,而后再把計算出的特征向量組成序列形式,便于存儲,而這樣一個過程便稱為模板。需注意的是在實際計算環節,所有涉及到該系統識別的模板均需要存儲起來。
語音識別又可分成語音識別、語音樣板訓練等兩部分,而涉及于其中的標準化模式存儲空間則被稱作“詞庫”,且單一的標準模式則被稱作“樣板”。這里提及的語音樣板訓練,第一步要做的便是頻譜分析待識別命令,第二步則是將提取出的特征參數當作標準化識別模式,第三步便是將其存放到由flash存儲器所構成的模板庫之中。值得一提的是,語音識別過程實質上可看成是提取語音命令特征參數的過程,相較于詞庫中的樣板而言,前者需要提取樣板中相似度最好的命令序號當作識別結果,如此才能有效判定信號屬性,便于實施后續操作。
2 一種新型語音識別智能鎖的關鍵算法與處理流程
2.1 基本過程
按照實際應用環境的不用,可將語音識別系統劃分成4種類型,即小詞匯量和大詞匯量識別、特定人和非特定人識別、無限詞匯量識別、獨立詞和連續詞識別。具體的語音識別過程包含了語音信號預處理—特征提取—模式匹配等環節。其中預處理又包含了預濾波—采樣與量化—加窗—端點檢測—預加重等環節。整個語音信號識別中最為關鍵的部分為提取特征參數。實際提取過程中應滿足以下3個條件:第一個條件所提取的特征參數應具有代表性,即能代表語音特征,且在區分性能方面表現良好;第二個條件各個階段的參數間應表現出良好的獨立性;第三個條件則是所選特征參數應便于計算,能夠采用最高效算法進行計算,并以此確保語音識別實時實現。
正式進入訓練階段后,務必對特征參數進行一系列有效處理,即涉及于其中的每一個詞條都需要建立與之相對應的模型,并將這一模型保存到模板庫中。進入識別階段后,語音信號從同一個通道處通過便獲得語音特征參數,緊接著便生成了測試模板,隨后匹配參考模板,并以此把匹配分數最高的那一個參考模板當作識別結果應用到運算環節。除此之外,還能夠通過很多先驗知識的利用,來提升識別準確率。
2.2 DSP實現技術
DSP實現技術為Digital Signal Processing英文縮寫,中文翻譯成數字信號處理技術,作為一門多學科交融的新技術,應用DSP實現技術首先要實現浮點運算定點,而這需要應用到數字信號處理算法,即在ASIC、DSP等專用處理設備的應用下展開運算操作。諸如:語音識別算法中,涉及到很多浮點運算,而在語音識別程序編寫過程中,首先需要解決的問題是使用定點DSP將實現浮點運算。針對這一問題,按照相關經驗,可通過數定標的方式來實現。
其次處理數據精度。使用16b定點DSP實現語音識別算法之時,雖在一定程度上提高了程序運行速度,但數據精度依然不高,分析其原因,極大可能是因為中間運算環節累計額誤差較大而影響到運算結果的準確性。要想提升數據運算精度,除了適時擴展精度外,還應采用偽浮點法用以表示浮點數。
3 一種新型語音識別智能鎖的性能優化設計
3.1 硬件性能優化設計
首先針對基本的硬件模塊設計。利用聲音校對模塊再通過語音識別模塊來采集外界信息,而后把采集到的模塊信息傳送到SPCE061A型單片機中,再通過圖像識別模塊來辨識與處理接收到的信息,把最終判別結果輸送到開關控制模塊中,最后便達到語音識別智能鎖中。
其次針對圖像識別模塊設計。門禁系統若僅是依靠著語音識別功能進行控制,那么便無法確保足夠的安全性,甚至有可能發生盜取合法用戶的聲音信息或非法入侵等情況,要想保證語音識別智能鎖使用的安全與穩定,那么在設計環節便需要添加圖像識別模塊,其根本目的在于保證使用著合法身份。這一模塊主要是通過鎖內安裝的攝像頭來獲取各種圖像信息,并將其傳輸到圖像處理芯片中,再在隱馬爾可夫人臉識別系統的應用下,分析圖像信息,準確對用戶身份進行檢測和識別,以此保障用戶身份合法性。
3.2 軟件性能優化設計
軟件程序流程需通過程序主模塊才能實現,主模塊任務主要包括了調用子模塊對用戶進行線性的輸入處理、硬件資源初始化和響應用戶輸入等程序。
3.3 系統測試
本次設計主要針對同一功能反復進行一百次左右的測試操作,其結果如下:
首先針對語音識別模塊的測試數據,當測試環境為低噪聲環境(<50dB)時,成功次數達99次,失敗次數僅為1次,即成功率為99%;當噪聲環境為噪聲環境(60dB~70dB) 時,成功次數為97次,失敗次數為3次,即成功率為97%。其次針對報警模塊的測試數據,測試方法選擇的是語音控制法,成功次數為100,失敗次數為0,即成功率為100%。最后針對圖像識別模塊的測試數據,當測試距離為1cm時,成功次數為100次,失敗次數為0次,即成功率為100%;當測試距離為10cm時,成功次數為99次,失敗次數為1次,即成功率為99%;當測試距離為25cm時,成功次數為95次,失敗次數為5次,即成功率為95%。
從上述測試結果中反映出的情況可知,當噪聲在70dB以下,且和使用者的距離在25cm以下時,該種新型語音識別智能鎖可以準確的識別出用戶語音內容,并在圖像識別技術的結合應用下驗證用戶身份,確保其是在合法情況下使用該功能。
結論
綜上所述,基于日常防盜安全標準,結合現代科學技術,通過語音互動加載模塊的應用可鎖定用戶聲音,并在語音識別功能的利用下,實現聲控功能,準確分析與處理用戶信息,確保其在安全環境下使用該功能。且本文通過一系列系統測試,進一步驗證了這一功能安全應用效果,如此便為人們安全、快捷的應用這一功能提供了條件。
參考文獻
[1]曾輝,謝森林,董曉慶,等.一種新型語音識別智能鎖的設計與實現[J].韓山師范學院學報,2013(3):38-40,49.
[2]鐘召輝.基于ZigBee的無線智能鎖系統設計[D].杭州電子科技大學,2013.
[3]張萍,崔旺,劉曉冬,等.“芝麻開門”智能鎖設計[J].河北工業大學學報,2015,44(2):20-23,27.
[4]金哲誠,聞新.基于RSC-300的一種智能語音密碼鎖的設計與實現[J].工業控制計算機,2013,26(3):103,105.