嚴(yán)涵婷 杜選 孫添程 孫宇平 周瑜萱 金裕筠



摘要:利用人工智能技術(shù)和深度學(xué)習(xí)算法,設(shè)計(jì)開發(fā)了基于AI+IOT的智慧家居系統(tǒng)。基于百度提供的免費(fèi)的語(yǔ)音識(shí)別云平臺(tái),該系統(tǒng)使用ZigBee網(wǎng)絡(luò),對(duì)家居環(huán)境數(shù)據(jù)進(jìn)行采集、分析,并通過(guò)物聯(lián)網(wǎng)技術(shù)和人工智能技術(shù)實(shí)現(xiàn)遠(yuǎn)程語(yǔ)音控制各種家電的功能。基于深度學(xué)習(xí),系統(tǒng)通過(guò)百度語(yǔ)音識(shí)別技術(shù)對(duì)自然語(yǔ)言進(jìn)行語(yǔ)音識(shí)別,通過(guò)搭建系統(tǒng)編譯環(huán)境成功融合了AI技術(shù)和IOT技術(shù)實(shí)現(xiàn)了具有語(yǔ)音控制功能的智能家居系統(tǒng),致力于為人們提供更加便捷智能的生活。
關(guān)鍵詞:語(yǔ)音識(shí)別;智慧家居;機(jī)器學(xué)習(xí);人工智能;深度學(xué)習(xí)
中圖分類號(hào): TP18? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2021)09-0185-03
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
Smart Home System Based on AI and IOT
YAN Han-ting,DU Xuan,SUN Tian-cheng,SUN Yu-ping,ZHOU Yu-xuan,JIN Yu-yun
(Jiaxing University, Jiaxing 314001, China)
Abstract:Using artificial intelligence technology and deep learning algorithm, a smart home system based on AI and IOT is designed and developed.Based on the free speech recognition cloud platform provided by Baidu, the system uses ZigBee network to collect and analyze the data of home environment, and realizes the function of remote voice control of various household appliances through Internet of things technology and artificial intelligence technology. Based on deep learning, the system uses Baidu speech recognition technology to recognize natural language. By building a system compilation environment, it successfully integrates AI technology and IOT technology to realize a smart home system with voice control function, which is committed to providing more convenient and intelligent life for people.
Key words: speech recognition; smart home; machine learning; artificial intelligence;deep learning
1 概述
目前,深度學(xué)習(xí)算法在人工智能快速發(fā)展成長(zhǎng)的社會(huì)浪潮中脫穎而出,需求的催生和硬件的更新讓它愈加完善,被廣大開發(fā)者應(yīng)用在社會(huì)中更多的領(lǐng)域[1]。深度學(xué)習(xí)算法雖然是在機(jī)器學(xué)習(xí)的基礎(chǔ)上衍生改進(jìn)的一個(gè)新技術(shù),但是它不同于機(jī)器學(xué)習(xí)的手工選取特征,深度學(xué)習(xí)通過(guò)設(shè)計(jì)建立適量的神經(jīng)元計(jì)算節(jié)點(diǎn)和多層運(yùn)算層次結(jié)構(gòu),選擇合適的輸入層和輸出層,建立起從輸入到輸出的函數(shù)關(guān)系[2]。它的出現(xiàn)讓圖靈測(cè)試不再遙不可及,它被引入機(jī)器學(xué)習(xí)使其更接近于最初人工智能的目標(biāo),即讓計(jì)算機(jī)擁有“自我”意識(shí)[3]。利用深度學(xué)習(xí)這種強(qiáng)大的從少數(shù)樣本集中學(xué)習(xí)數(shù)據(jù)集本質(zhì)特征的能力,語(yǔ)音識(shí)別技術(shù)的發(fā)展也有了跨越式的成長(zhǎng)。為了使人們真正做到智能生活,本系統(tǒng)將人工智能和物聯(lián)網(wǎng)結(jié)合起來(lái),采用了目前流行的AIoT模式[3],即智能物聯(lián)網(wǎng)系統(tǒng),使用無(wú)線傳感器采集數(shù)據(jù),檢測(cè)家居環(huán)境數(shù)據(jù)和異常報(bào)警,來(lái)為人們服務(wù)。系統(tǒng)的實(shí)現(xiàn)主要依靠各類傳感器感知數(shù)據(jù)的實(shí)時(shí)獲取以及百度云識(shí)別語(yǔ)音技術(shù)。開發(fā)基于AIoT的新型智慧家居系統(tǒng)具有廣大的市場(chǎng)發(fā)展前景,對(duì)人工智能結(jié)合物聯(lián)網(wǎng)的發(fā)展也具有深刻的意義,更能滿足人們的生活需求。
2需求分析
為了讓人們享受到真正智能和便利的日常生活,本文設(shè)計(jì)開發(fā)了一個(gè)結(jié)合物聯(lián)網(wǎng)和人工智能這兩大主流技術(shù)的智慧家居系統(tǒng)。系統(tǒng)的功能主要分成三類,分別是利用硬件為用戶提供可參考的室內(nèi)環(huán)境數(shù)據(jù)、提供手動(dòng)、語(yǔ)音兩種方式開關(guān)日用電器、提供智能安保功能。系統(tǒng)的用例示意圖如圖1所示。
現(xiàn)將本文設(shè)計(jì)的智慧家居系統(tǒng)的功能總結(jié)如下:
(1) 獲取任何時(shí)刻的室內(nèi)環(huán)境數(shù)據(jù),如PM2.5數(shù)值、氧氣濃度、光強(qiáng)、體感溫度等,并將其顯示在終端上。
(2) 用戶可以在手機(jī)上對(duì)各類家電進(jìn)行手動(dòng)控制:點(diǎn)擊開關(guān)按鈕操控空調(diào)、燈具、窗簾等。
(3) 通過(guò)語(yǔ)音指令“關(guān)閉空調(diào)”“打開風(fēng)扇”等控制家電的開關(guān)。
(4) 通過(guò)下達(dá)語(yǔ)音指令“今天天氣如何?”、“現(xiàn)在光照強(qiáng)度多少?”等獲取家庭環(huán)境數(shù)據(jù)。
(5) 自動(dòng)檢測(cè)有害氣體和煙霧,識(shí)別外來(lái)入侵者并自動(dòng)報(bào)警,確保家居生活的安全性。
經(jīng)由用戶的語(yǔ)音指令來(lái)操控家用電器和檢測(cè)家庭環(huán)境是否安全,可以使人們的日常生活更加便利和智能,滿足人們提高生活品質(zhì)的需求。
3總體設(shè)計(jì)
3.1系統(tǒng)總體架構(gòu)
本項(xiàng)目有硬件、軟件和百度語(yǔ)音識(shí)別云平臺(tái)三個(gè)組成部分。其中,硬件主要有三種類別的傳感器,分別是收集數(shù)據(jù)類傳感器、控制電器類傳感器和檢測(cè)氣體、人體類傳感器,如圖3所示;軟件的開發(fā)基于android studio軟件;語(yǔ)音識(shí)別采用百度語(yǔ)音識(shí)別云平臺(tái)提供的語(yǔ)音識(shí)別API。
(1)三大類傳感器通過(guò)Zigbee無(wú)線模塊組合在一起,數(shù)據(jù)統(tǒng)一由無(wú)線網(wǎng)絡(luò)和協(xié)調(diào)器進(jìn)行相互傳遞。
(2)協(xié)調(diào)器和網(wǎng)關(guān)通過(guò)串口組合在一起,然后再由網(wǎng)關(guān)連接互聯(lián)網(wǎng),將Zigbee網(wǎng)絡(luò)中的各類硬件獲取到的數(shù)據(jù)保存在云數(shù)據(jù)服務(wù)器。
(3)用戶端通過(guò)手機(jī)向位于互聯(lián)網(wǎng)上的數(shù)據(jù)服務(wù)器發(fā)送請(qǐng)求獲取信息,然后將應(yīng)答請(qǐng)求的結(jié)果信息返回給用戶。
(4)利用百度語(yǔ)音識(shí)別技術(shù)實(shí)現(xiàn)系統(tǒng)的語(yǔ)音控制功能,由互聯(lián)網(wǎng)將用戶的語(yǔ)音指令傳送給網(wǎng)關(guān),網(wǎng)關(guān)再通過(guò)協(xié)調(diào)器將指令傳送給控制類傳感器來(lái)操控家電。系統(tǒng)流程圖如圖2所示。
3.2語(yǔ)音識(shí)別的流程
語(yǔ)音識(shí)別也被稱為自動(dòng)語(yǔ)音識(shí)別ASR,它用于將人類的語(yǔ)音轉(zhuǎn)換為計(jì)算機(jī)可讀的輸入,例如按鍵、二進(jìn)制編碼或者字符序列[6]。語(yǔ)音識(shí)別的目的是讓用戶使用app更加智能,不需要手動(dòng)點(diǎn)擊。實(shí)現(xiàn)用戶語(yǔ)音指令的識(shí)別、系統(tǒng)通過(guò)語(yǔ)音反饋環(huán)境數(shù)據(jù),并且保證一定的識(shí)別準(zhǔn)確度,可以使系統(tǒng)更加智能化。具體的語(yǔ)音識(shí)別過(guò)程如圖4所示。
通過(guò)以上流程圖可以知道信號(hào)處理和特征提取是音頻數(shù)據(jù)必備的預(yù)處理部分。因?yàn)樵嫉穆暡ㄍǔ?huì)伴隨著各種各樣的噪聲或是失真,這在一定程度上會(huì)對(duì)語(yǔ)音信號(hào)的質(zhì)量產(chǎn)生影響,所以需要通過(guò)消除噪聲和信道增強(qiáng)等技術(shù),將信號(hào)從時(shí)域轉(zhuǎn)化到頻域,為后續(xù)的聲學(xué)模型得分打下基礎(chǔ)。最后,在解碼搜索階段要做的事就是結(jié)合語(yǔ)言模型得分和聲學(xué)模型得分,將得分最高的詞序列作為識(shí)別結(jié)果。這便是語(yǔ)音識(shí)別的一般原理。
4 詳細(xì)設(shè)計(jì)與實(shí)現(xiàn)
4.1硬件設(shè)計(jì)
基于AIOT的智慧家居系統(tǒng)[4,5]采用了一個(gè)電控制器件和5種傳感器,分別用于檢測(cè)可燃的危險(xiǎn)性氣體、采集數(shù)據(jù)和產(chǎn)生報(bào)警鳴聲。在設(shè)計(jì)系統(tǒng)時(shí),我們利用上述這些硬件設(shè)施為用戶提供了和家庭環(huán)境相關(guān)的數(shù)據(jù)作為參考,便于用戶精準(zhǔn)地控制家電,使家居生活的舒適度最大化[8]。鑒于系統(tǒng)中各類傳感器硬件的工作原理是類似的,下文我將以檢測(cè)、獲取空氣質(zhì)量數(shù)據(jù)的傳感器為例講解一下它的實(shí)現(xiàn)原理和應(yīng)用過(guò)程。
氣體檢測(cè)類傳感器在物聯(lián)網(wǎng)中的應(yīng)用其實(shí)非常典型,它能夠精確地監(jiān)測(cè)環(huán)境中PM2.5、PM10、TVOC等數(shù)值的變化以及氧氣(O2)、二氧化碳(CO2)、一氧化碳(CO)、甲醛(CH2O)等氣體的濃度,然后實(shí)時(shí)地反饋。通過(guò)獲取空氣質(zhì)量傳感器返回的數(shù)據(jù)集,分析環(huán)境的空氣質(zhì)量,最后能夠?qū)⒔Y(jié)果推送到 Android 移動(dòng)客戶端供用戶查看。
4.2 基于baidu語(yǔ)音云識(shí)別平臺(tái)的功能設(shè)計(jì)
在設(shè)計(jì)實(shí)現(xiàn)系統(tǒng)的語(yǔ)音控制功能時(shí),我們采用了百度公司提供的免費(fèi)的語(yǔ)音識(shí)別服務(wù)也就是百度語(yǔ)音識(shí)別技術(shù),它采用深度卷積神經(jīng)網(wǎng)絡(luò)+長(zhǎng)短時(shí)記憶模型+聯(lián)結(jié)主義時(shí)間分類器(Deep CNN+ LSTM+CTC)的語(yǔ)音識(shí)別架構(gòu)。利用和神經(jīng)網(wǎng)絡(luò)相似的深度學(xué)習(xí)算法,該技術(shù)改進(jìn)了從前停留在淺層次的機(jī)器學(xué)習(xí)技術(shù),在大幅度提高語(yǔ)音識(shí)別速率的同時(shí)還降低了錯(cuò)誤率。系統(tǒng)在物聯(lián)網(wǎng)的基礎(chǔ)上搭建編譯環(huán)境,由傳感器提供環(huán)境數(shù)據(jù),利用百度語(yǔ)音識(shí)別云服務(wù)提供的HTTP接口上傳語(yǔ)音數(shù)據(jù)獲取識(shí)別結(jié)果。百度云語(yǔ)音識(shí)別的流程圖如圖5所示。
系統(tǒng)語(yǔ)音識(shí)別功能的實(shí)現(xiàn)原理是編寫程序POST一段語(yǔ)音數(shù)據(jù)上傳到百度云服務(wù)器。首先,系統(tǒng)會(huì)讀取語(yǔ)音內(nèi)容,獲取訪問令牌后對(duì)其進(jìn)行Base64編碼并格式化為JSON數(shù)據(jù)再進(jìn)行上傳。然后接收服務(wù)器返回的JSON數(shù)據(jù),解析后可以得到語(yǔ)音識(shí)別的結(jié)果。 語(yǔ)音識(shí)別的程序流程圖如圖6所示。
5結(jié)語(yǔ)
本文主要是講解基于AI+IoT的智慧家居系統(tǒng)的設(shè)計(jì)思路和實(shí)現(xiàn)方法,包括系統(tǒng)用到的硬件、開發(fā)所需的各種技術(shù)和算法。系統(tǒng)主要有收集并反饋家庭環(huán)境的實(shí)時(shí)數(shù)據(jù)、語(yǔ)音指令操控家電、自動(dòng)檢測(cè)人體和有害氣體并報(bào)警這三個(gè)功能。其中,人工智能技術(shù)方面,系統(tǒng)基于深度學(xué)習(xí)算法,利用百度云平臺(tái)提供的語(yǔ)音識(shí)別服務(wù)實(shí)現(xiàn)了語(yǔ)音控制家電功能;物聯(lián)網(wǎng)技術(shù)方面,系統(tǒng)采用Zigbee網(wǎng)絡(luò)和傳感器為系統(tǒng)提供硬件基礎(chǔ)。使用該系統(tǒng)可以滿足人們智能化生活的需求,提高生活品質(zhì)。
參考文獻(xiàn):
[1] 楊煥崢.基于深度學(xué)習(xí)的中文語(yǔ)音識(shí)別模型設(shè)計(jì)與實(shí)現(xiàn)[J].湖南郵電職業(yè)技術(shù)學(xué)院學(xué)報(bào),2020,19(3):24-27.
[2] 邱錫鵬.神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)[M].北京:機(jī)械工業(yè)出版社,2020.
[3] 周志華.機(jī)器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016.
[4] 楊耀.基于物聯(lián)網(wǎng)的智能家居系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].南京:南京郵電大學(xué),2014.
[5] 葉劍軍,葉倩,李景廣,等.室內(nèi)環(huán)境自動(dòng)監(jiān)測(cè)系統(tǒng)的數(shù)據(jù)分析研究[J].綠色建筑,2010,2(2):43-47.
[6] 卜素亮.非特定人連續(xù)語(yǔ)音識(shí)別技術(shù)研究與應(yīng)用[D].上海:復(fù)旦大學(xué),2011.
[7] 王一蒙.語(yǔ)音識(shí)別關(guān)鍵技術(shù)研究[D].成都:電子科技大學(xué),2015.
[8] 嚴(yán)涵婷,杜選,孫添程,等.基于語(yǔ)音控制的智慧家居系統(tǒng)[J].電腦知識(shí)與技術(shù),2020,16(7):213-215.
【通聯(lián)編輯:唐一東】