楊茶喜 陳麗 蘆敏琪 莫小靈
(新余學院 中興通訊信息學院,江西 新余 338000)
該語音識別器的總體主要分為四個模塊,即電源模塊,語音識別模塊,語音播放模塊,OLED 屏幕顯示模塊。電源模塊為整個系統提供電源,支撐語音識別器的整體運作;語言識別模塊識別用戶說出的垃圾名稱;STM32 系統將接收到的數字語音信號進行分析處理,得出垃圾分類結果;語音播放模塊將垃圾分類結果告知給用戶;OLED 屏幕顯示模塊用于顯示工作狀態開啟或者關閉。具體的系統總體布局如圖所示:
電源模塊主要用于為整個系統提供一個穩定的電源,讓系統能夠穩定的運行。該模塊由一個大容量的3.7V 鋰電池、鋰電池充電模塊與DC-DC 升壓模塊3 個部分組成。
這里DC-DC 升壓模塊使用的是MT3608 模塊,MT3608 是一款固定頻率的同步升壓IC,其開關頻率為1.2MHz,允許使用微型低成本電容器。可延長電池壽命。MT3608 的特點是在輕負載時,自動切換到脈沖頻率調制模式。其包括限流、低壓閉鎖和過載保護,以防止損壞。該模塊的最大輸出電流可達2A,足夠供給整個系統使用。將鋰電池3.7V 的電壓升壓至5V,分別給STM32 最小系統板、LD3320 語音識別模塊和DY-SV17 語音播放模塊供電,OLED 屏幕則使用STM32 最小系統上的LDO 降壓至3.3V的電壓供電。
鋰電池充電模塊采用的是TC4056A 模塊,TC4056A 是一款完整的單節鋰電池采用恒定電壓/恒定電流的線性充電器。當輸入電壓(USB 電源)移開時,TC4056A 將自動進入一個低電流狀態,將漏電流將至2uA 以下。TC4056A 在有電源時也可置于停機模式,因而將供電電流降至55uA。TC4056A 還有其他特點,包括欠壓閉鎖、電池溫度檢測、兩個用于指示充電、結束的LED 燈狀態引腳和自動再充電。此模塊帶有充電保護,適合本系統使用的單節鋰電池充電使用。
該模塊上主要的芯片有LD3320 與STC11L08XE。LD3320 芯片是一款“語音識別”專用芯片,LD3320 是一顆基于非特定人語音識別(SI-ASR)技術的語音識別芯片,用戶不需要進行錄音與訓練。不需要外接AD 轉換芯片,內置了高精度A/D 轉換器,只需要把麥克風接在芯片的AD 引腳上就能夠采集到高精度的聲音信號。模塊的識別結果采用串口通信的方式傳入STM32 系統,將識別結果加入數據幀頭與數據幀尾進行封裝,保證發送的數據準確,再發送數據幀到STM32 系統中,STM32 系統接收到完整是數據幀后,對封裝的數據進行解析,最后再進行相應的處理。
DY-SV17F 模塊板載32Mbit 的Flash 存儲,對于音頻文件的讀取非常方便,可以采用USB 數據線連接到電腦上進行音頻文件的讀寫。對該模塊的控制有多種模式,可IO 分段觸發、標準MP3、ONE_line 單總線串口控制以及UART 串口控制等七種工作模式,通過3 個配置引腳進行設置。其自帶5W D 類功放,能夠直接驅動4Ω,3W~5W 的喇叭。含有24 位的DAC 輸出,動態范圍支持90dB,信噪比支持85dB。IO 觸發播放模式,通過8 個IO 口單獨觸發8 首曲目或8 個IO 口組合觸發 255 首曲目,且每個IO 口需要濾波電容提高抗干擾能力。
ONE_line 單總線串口控制,通過協議時序與協議數據發送數據信息。UART 串口工作模式下,可以控制播放、暫停、停止、音量加減、選曲、查詢當前曲目等功能,最大選曲數為65535 首,其支持的波特率為9600bps。UART 串口模式相比其他模式功能更全,相比于IO 觸發模式而言,所需要的引腳少,且不需要濾波電容也能夠正常使用。將該模塊的CON1 與CON2 引腳的電平置為低電平,CON3 引腳的電平置為高電平,設置為UART 串口控制模式,STM32 系統根據模塊所規定的協議,發送對應的數據幀,控制該模塊播放對應的音頻。
使用的為0.96 寸分辨率為128*64 的OLED 顯示屏。有以下特點:有黃藍,白,藍三種顏色可選;其中黃藍是屏上 1/4 部分為黃光,下3/4為藍;而且是固定區域顯示固定顏色,顏色和顯示區域均不能修改;白光則為純白,也就是黑底白字;藍色則為純藍,也就是黑底藍字。接口方式,OLED 裸屏總共種接口包括:6800、8080 兩種并行接口方式、3 線或4 線的串行 SPI 接口方式、IIC 接口方式。
在系統上電時,將STM32 系統的初始化運行情況顯示在OLED 屏幕上。當STM32 系統接收到語音識別信息時,將說出的垃圾與判斷的垃圾類別,通過OLED 屏幕展示給用戶。在沒有識別到周圍語音的情況下,OLED 屏幕保持息屏狀態。