沈陽理工大學自動化與電氣工程學院 阮小烔 野瑩瑩 李 帥 任璐珩
目前市場上大多數電子記事本都以文字輸入形式呈現,且只能通過文字或語音記錄、進行定時提醒,操作繁瑣,對于不擅長使用手機、記憶力不好的老人并不友好。通過采用以STM32F103C8T6作為主控芯片LD3320語音智能識別芯片設計一款語音控制記事提示系統,做到語音記錄備忘大大提高記事的便利性,且芯片小,功能單純,輕便簡單。
該語音智能記事提示系統主要由圖1的語音識別模塊、語音錄放模塊、數字分析處理模塊、顯示輸入模塊組成。顯示輸入模塊啟動本系統,語音識別模塊檢測負責接收周圍聲音信號,提取、分析有效的語音指令。收到指令后傳輸到數字分析模塊,并由數字分析模塊傳輸相應的指令到顯示輸入模塊和語音錄放模塊。

圖1 系統結構圖
以上五大模塊主要由以下部件構成STM32F103單片機核心電路、LD3320語音識別模塊、OLED12864、ISD4003。STM32F103為數字分析處理模塊,LD3320芯片作為負責語音識別模塊主控芯片,OLED12864作為顯示輸入模塊主要器件,而ISD4003芯片主要作為語音錄放模塊。
本系統設計使用STM32F103C8T6作為主控芯片。STM32F103C8T6是一款增強型系列微控制器,使用高性能的ARMRCortexTM-M3 32位的RISC內核。它的指令代碼完美兼容了51單片機,具有高性能、低電壓、低功耗、低風險。
本設計中,語音識別模塊的核心是LD3320芯片。該模塊使用ASR(Auto speech recognition)技術。該技術識別率高達95%,快速且穩定。該模塊工作時,先經過MIC輸入聲音施行頻譜分析,再將語音特征提取并匹配重點字詞的語音信息。后將匹配程度最高分作為識別輸出結果。圖2為LD3320與主控芯片接線圖。

圖2 LD3320與主控芯片接線圖
OLED12864作為本系統主要顯示模塊,通過IIC接線與主控芯片接連通訊,顯示密碼輸入情況,提示系統處于語音識別或者錄入狀態。如圖3為OLED12864與主控芯片接線圖。

圖3 OLED12864與主控芯片接線圖
本系統利用REC-1000語音模塊集成了ISD4004語音芯片的單片機控制芯片及其外圍電路,并提供了常用端口的接口插口形式,使語音芯片的使用簡單化。可用I/O口仿真SPI通信協議,工作電壓3V,錄放時間為8到16min,高保真錄音。如圖4為ISD4004與主控芯片的接線圖。

圖4 ISD4004與主控芯片的接線圖
對所有變量進行初始化后進入循環判斷。先輸入密碼,密碼信號正確,則檢測語音信號輸入。解析信號,根據語音信號執行相應的語音命令,再按照各個命令執行相應的程序。主程序流程圖如圖5所示。

圖5 主程序流程圖

圖6 語音識別原理框圖
本系統語音識別模塊由LD3320組成,利用ASR技術識別。圖6是語音識別原理框圖。語音識別流程采用中斷方式工作。設計程序時,首先要通用初始化和語音初始化。再寫入識別列表添加關鍵詞和定義識別碼。當麥克風采集到的聲音時,將產生一個中斷信號,再由中斷程序根據分析結果選取最高分的結果。

圖7 系統電路圖
通過調試,本系統主要通過LD3320芯片的語音識別模塊和ISD4004芯片的語音錄入輸出模塊實現語音控制的智能記事提示。以STM32作為主控芯片來協調控制各個模塊的啟動。圖7為整個系統的硬件電路圖。
啟動電源,兩盞指示燈將會亮起,OLED屏初始化。以按鍵輸入密碼,輸入錯誤則OLED屏提示密碼輸入錯誤。密碼輸入正確則啟動語音識別模塊,若系統檢測到語音指令,如“記錄書包位置”,語音識別模塊將識別到反饋給主控芯片,主控芯片將發出信號控制語音錄入輸出模塊啟動錄音功能記錄位置。當說出語音指令“查詢書包位置”,語音識別模塊識別到指令之后,將會反饋到主控芯片,主控芯片將發出信號使語音錄入輸出模塊輸出之前記錄到的物品位置。系統實物接線圖如圖8所示。

圖8 系統實物圖
結論:本設計提出了語音記事提示功能,對比于其它形式的記事本更簡單易上手,更大程度上解放了雙手,方便了弱勢群體生活。但同時系統簡便的同時指令也比較單一,但出于成本控制采用了按鍵式密碼,按鍵式密碼雖然提高了安全性但也不夠便捷。因此對于該系統,還有很大的研發空間。