趙人熳,崔 巍,王奕璇
(1.延安大學 物理與電子信息學院;2.延安大學 化學與化工學院,陜西 延安 716000)
公共事務辦公室的工作人員任務繁雜,必要的外出又造成了來訪辦事人員的等待,所以,常用的語音門鈴已經不能滿足辦公場所的需求。因此,針對業務繁忙的個人辦公室設計一種智能化電子門貼秘書是實際應用的需要。本設計不僅能夠以語音控制指令設置模式以告知客人:主人的去向以及聯系方式,而且可以在有急事的情況下給主人留言,主人回來后根據LED錄音指示燈狀態來判斷是否有客人留言,如有留言則LED錄音指示燈處于點亮狀態,利用語音控制指令來聽取留言。本裝置可裝貼在室門上以改變普遍門鈴的單一提醒功能,為辦公場所來訪人員減少等待時間、提高工作和辦事效率提供便利條件。
本設計可由主人外出前通過語音控制設置模式,即人在(門鈴)模式、暫時離開(提請等待)模式、短時離開(急事留言)模式、長時外出(聯系方式告知)模式。通過這四種模式設置方便了客人與主人的對接與聯系,使該裝置起到辦公秘書的簡單作用,其有益效果是,可以在主人不在的情況下第一時間以語音和LCD文字顯示的方式告訴客人:主人的去向或聯系方式,避免了客人不必要的耗時等待,提高了辦事效率。
本設計解決其技術問題所采用的技術方案是:以低功耗單片機MSP430F6638為控制芯片,結合LD3320語音控制芯片以及ISD1760語音存儲芯片,以模塊化原則設計一種語音門鈴系統。為了解決錄音和放音相互沖突的情況,使用兩塊ISD1760語音芯片,一塊負責存儲提示語音信息,另一塊負責存儲客人錄音語音信息。系統主要構成有:單片機控制電路、語音控制電路、語音存儲電路以及按鍵和一些外圍電路組成的門貼式智能化電子秘書[1]。系統總體框圖如下圖1所示。

圖1 系統總體框圖
系統使用MSP430F6638單片機來作為核心控制器,連接兩塊ISD1760語音存儲芯片和LCD液晶顯示器。第1塊ISD1760通過FT直通操作模式使用上位機串口通信方式為ISD1760錄制語音信息,然后利用ISD1760的SPI模式接口和F6638單片機的同步串行端口連接通信,實現語音芯片按照主控芯片發送的指令,讓語音芯片有一定的邏輯播放語音提示信息。第2塊ISD1760主要負責留言錄音,同樣使用SPI模式接口與F6638相連,可以錄音60秒。經實驗測試,如使用一塊芯片,即存儲提示音信息又存儲客人留言信息,經客人錄音次數、主人擦除次數過多以后,會導致芯片內部存儲的全部語音信息地址混亂,系統將無法工作。
由ICRoute公司生產的非特定人語音識別芯片LD3320提供單芯片語音識別技術方案,是基于“關鍵詞語列表”的識別技術:ASR(Auto speech recognition)技術,芯片內部包含16-bitAD以及DA、麥克風(MIC)接口以及支持SPI通信模式[2]。本設計采用主人使用語音控制方式來設定門鈴工作在哪一種模式并語音控制聽取及擦除留言,通過單片機F6638設置“關鍵詞語列表”,按照本設計要求,設置關鍵詞語六個即可:“人在”、“暫時離開”、“短時離開”、“長時外出”、“聽取留言”、“擦除留言”。為了使系統待機時處于低功耗狀態,防止意外語音信息誤被LD3320所識別,特設置一個語音指令按鍵,當主人需設置門鈴工作模式及聽取擦除留言的時候按下按鍵,LD3320才開始工作,原理圖如圖2所示。

圖2 語音識別原理圖
語音識別芯片完成的工作就是:主人通過MIC輸入的聲音進行頻譜分析,提取語音特征并和關鍵詞語列表中的關鍵詞語進行對比匹配,進一步找出得分最高的關鍵詞語作為識別結果輸出[3]。通過外部MIC送入語音數據流,LD3320芯片內部的語音識別芯片通過端點檢測VAD(voice activity detection)檢測出用戶停止說話,把用戶開始說話到停止說話之間的語音數據進行運算分析后,給出識別結果[4]。將結果通過SPI傳遞給控制芯片單片機F6638,從而設定系統工作于哪一種模式。系統總體電路圖如下圖3所示。

圖3 系統總體電路圖
通過PC機錄音軟件ISD1700Ver2.02.exe對第一塊ISD1760(U1)進行錄制語音提示信息,除了加入單片機與PC機串口通信的程序外,還加入ISD1760中的一些基本操作指令函數,來實現放音、錄音、擦除、讀取語音地址等功能,最終獲取所得各段語音信息的起始地址(表1)。

表1 語音提示音地址表
使用B-LD3320開發板以及ICR_DT1.exe軟件進行關鍵詞語列表寫入到LD3320芯片內。在如圖4所示拼音文字框中敲入正確的拼音,LD3320芯片對于每條命令的拼音字符串的長度限制為79字節,但是由于ICR_DT1.exe軟件限制最多可以輸入50組[5]。根據本設計需要,特輸入六組即可:“ren zai”、“zan shi li kai”、“duan shi li kai”、“chang shi wai chu”、“ting qu liu yan”、“ca chu liu yan”,然后點擊“生成數據并下載”,下載完畢后,點擊“讀出比較”,這個功能可以對芯片內已寫入的關鍵詞語列表進行核對。

圖4 關鍵詞語列表
經過以上兩步程序設計,可以得到一塊存儲語音提示音的ISD1760(U1),以及LD3320內部帶有關鍵詞列表的語音控制芯片,將為本系統的搭建做出鋪墊。
系統默認處于“人在”模式,單片機F6638循環檢測“門鈴按鍵”及“語音指令按鍵”。
當主人按下語音指令按鍵以啟動LD3320來識別語音信息,LD3320識別語音指令以后,將結果反饋給單片機F6638執行相應控制命令[6]。當客人按下“門鈴按鍵”后,單片機F6638可以向語音芯片ISD1760(U1)發送7字節帶有地址的指令,就可以實現提示音的播放。如:spi_set_opt(0x90,0x0010,0x0035),它會播放第一段語音信息即“您好,請開門”。當主人設置系統工作模式為“短時離開”時,客人如需留言,則客人需長按錄音按鍵,F6638檢測按鍵按下以后啟動ISD1760(U2)進行錄音。主人回來后,系統如有錄音則指示燈常亮,主人按下語音指令按鍵后,啟動LD3320開始輸入語音指令,通過語音識別來控制ISD1760(U2)播放及擦除留言[7]。系統軟件流程圖如圖5所示。

圖5 系統軟件流程圖
本設計采用了MSP430F6638作為核心控制器,通過I/O口與語音控制芯片LD3320以及兩塊語音儲存芯片ISD1760使用SPI通信模式進行控制連接。實現了通過語音控制靈活設置外出模式,從而根據設置的模式為客人提供最實用的處理辦法,極大地方便了辦公,提高了辦事效率。實驗樣機測試結果表明,系統的性能與功能性相對穩定,但在嘈雜環境中使用,語音識別會出現無法識別的現象,在后續的工作中,需優化語音識別算法以及硬件電路中加入語音信號去噪等措施。