基于物聯網的Cortex-A53智能云鏡系統的設計與實現

2018-05-30 13:12:45童新，姚莉，倪波

物聯網技術 2018年5期

童新，姚莉，倪波

（湖北理工學院計算機學院，湖北黃石 435003）

0 引言

隨著物聯網概念的提出和技術的發展，及人們對于物聯網的熱衷和市場的走向，各類智能產品已慢慢占據了日常家居產品市場，豐富了人們對于智能產品的選擇[1]。越來越多的貼近生活的智能產品正在涌現，將云計算技術應用于智能家居產品設計中，也是物聯網技術深入居民日常生活的印證[2]。本文設計與實現的智能云鏡系統正是順應以上趨勢把科技融入生活的樣品，高度體現了科技以人為本的理念。

1 硬件設計

1.1 微處理器

系統微處理器選擇64位四核ARM Cortex-A53處理器系列的BCM2837芯片。該處理器是ARMv8架構ARM Cortex-A50系列產品，其可擴展性使ARM的合作伙伴能夠針對智能手機、高性能服務器等各類不同市場需求開發系統級芯片。Cortex-A53處理器不僅是功耗效率最高的ARM應用處理器，也是全球最小的64位處理器。能夠支持所有最新的ARM GNU/Linux，支持各類音頻、視頻和以太網接口等。

1.2 LCD顯示屏

7英寸通用LCD電容式觸摸顯示屏分辨率可達800×480，可支持常用的系統鏡像，如Raspberry Pi，Banana Pi和Banana Pro等。另外，該顯示屏支持背光控制，更節省電能。本系統的設計與實現采用靜態加載對LCD屏驅動的支持，需要在Linux內核編譯時進行配置。選中設備驅動選項“Device Drivers－＞”進入設備驅動配置界面，選中“Graphics support”進入圖形支持選項。進入“Support for frame buffer devices”配置界面選擇“LCD init in kernel”選項加入內核編譯就可使內核實現對LCD屏驅動的支持，為系統顯示設備提供編程接口。LCD驅動配置界面如圖1所示。

圖1 LCD驅動配置界面

1.3 原子鏡

原子鏡又稱單向玻璃或單面鏡，是一種對可見光具有高反射比的玻璃。透過玻璃的觀察面可以清晰觀察另一側，而在玻璃的被觀察面只能看到反射的鏡像。原子鏡之所以能產生以上單面反光的效果，是因為鏡的兩面處于不同光度的環境。本系統利用LCD屏幕和原子鏡的疊加實現“智能云鏡”的外觀顯示。

1.4 WiFi模塊

ESP8266芯片可實現串口轉WiFi功能，ESP8266是一款超低耗通用非同步WiFi數據收發器，內置TCP/IP協議棧，支持多路TCP Client連接。支持豐富的Socket AT指令，透傳時的數據最大傳輸速率為460 800 bit/s，傳輸可靠性好。本系統利用該WiFi模塊實現網絡服務，利用互聯網上傳或接收信息。

1.5 LM393雙電壓比較器

LM393是雙電壓比較器集成電路。輸出負載電阻能銜接在可允許電源電壓范圍內的任何電源電壓上，不受 Vcc端電壓值的限制。此輸出能作為一個簡單的對地SPS開路（當不用負載電阻沒被運用），輸出部分的陷電流被可能得到的驅動和器件的β值所限制。當達到極限電流（16 mA）時，輸出晶體管將退出且輸出電壓將很快上升。本系統利用比較器確認啟用錄音功能的時間，當用戶發出的聲音超過指定分貝時即表示向系統發出語音命令。

本系統還使用了LM386功放模塊、麥克風、紅外傳感器和繼電器等硬件設備。

2 軟件設計

本系統是一款基于物聯網技術，利用云平臺實現的人機交互智能云鏡系統，摒棄了傳統鏡子功能的單一性。設計方案基于WiFi無線通信技術實現物聯網聯動，開發了GUI客戶端程序。用戶可根據個人的生活習慣或喜好，在照鏡子的同時和鏡子交流。系統內置了感知組件，可根據用戶的語音和手勢動作完成指令控制操作。例如，向它提出各種問題，獲得日期、天氣、新聞、菜譜等常用信息；讓它像朋友一樣聊天、講笑話等。系統還包含了音樂播放和燈光控制功能，利用語音識別等方式進行控制，實現了一物多用。本系統選擇Linux操作系統作為開發環境，結合百度語音云和圖靈機器人開發實現。

2.1 百度語音云

語音識別是指與機器進行語音交流，讓機器明白你說什么。中國物聯網校企聯盟形象地把語音識別比作為“機器的聽覺系統”。語音識別技術就是讓機器通過識別和理解過程把語音信號轉變為相應的文本或命令的高技術[3]。語音合成是通過機械、電子方法產生人造語音的技術。TTS技術（又稱文語轉換技術）隸屬于語音合成，它是將計算機自己產生的、或外部輸入的文字信息轉變為可以聽得懂、流利的漢語口語輸出技術[4]。

百度語音是語音技術、自然語言處理、智能搜索三方面的完美融合。以更自然的交互方式對用戶所說語言進行更準確地識別，只有對用戶需求準確理解，才能為用戶提供更滿意的結果。系統集成語音識別、語義理解、深度問答、知識推理、多輪對話、智能摘要、情感分析、語言生成、語音合成等功能，能夠滿足用戶的多種復雜需求。

2.2 圖靈機器人

圖靈機器人是在人工智能的核心能力基礎上為開發人員提供云計算和大數據平臺的在線服務和開發接口，提供機器人和人的文字交互，實現前端業務邏輯的自定義[5]。圖靈機器人能用準確、簡潔的自然語言回答用戶用自然語言提出的問題，以方便人們快速、準確地獲取信息。隨著技術的進步，問答機器人目前已能夠處理常識性、開放性問題及聊天問候等。問答機器人能夠給用戶提供非常智能化和人性化的服務，為用戶帶來極大方便和美好體驗。

在本系統中可實現機器人昵稱、性別、年齡等身份屬性設置，同時在自有平臺或產品上完成知識庫的新增、刪減、更改編輯以及批量導入等操作。此外還能夠為每一位使用者分配一個獨立機器人。主要涉及的功能包括聊天對話、問答百科、生活百科、知識庫、新聞資訊、成語接龍、故事大全、菜譜大全、笑話大全、天氣查詢和日期查詢等。

3 系統實現

3.1 功能模塊設計

首先通過LM393雙電壓比較器來檢測周圍環境聲音的強度，當聲音強度達到預設值時，系統啟動，開始錄音。錄音結束后，通過post方式向百度語音平臺請求語音識別服務，然后接收反饋數據。本系統通過對識別結果的分析做出相應的響應，然后將處理后的文字信息上傳到圖靈平臺，實現智能語音的目的。

系統對圖靈平臺處理后的數據進行分析，并發送到百度語音平臺，請求語音合成服務，再驅動聲卡程序播放合成的聲音。語言合成功能是在無需本系統處理命令的情況下（如聊天等）將百度語音合成的文字轉交給圖靈處理，圖靈處理完成后再交給百度語音進行合成，待接收到合成后的語音時即可用系統的揚聲器播放出來。

3.2 主要實現代碼

3.3 系統外觀和內部結構圖

系統外觀和內部結構如圖2、圖3所示。

圖2 系統外觀圖

圖3 系統內部結構圖

4 結語

本文主要介紹了在Linux操作系統下使用Cortex-A53處理器設計實現的智能云鏡系統。本系統具有良好的交互性，體現了物聯網感知層的特定含義。系統實現了文字、音頻、紅外等信息的采集和處理。基于物聯網技術把圖靈平臺與百度語音巧妙結合，使一面普通的鏡子有了“生命”，可以跟用戶自由交流。

[1]王昊天. 物聯網智能家居發展分析[J].信息系統工程， 2016（6）：38.

[2]盧彪，邱慧麗，吳孝銀.云計算技術在物聯網平臺的應用研究[J].蘭州文理學院學報（自然科學版），2016，29（3）：49-52.

[3]劉金剛，周翊，馬永保，等.用于自動語音識別系統的切換語音功率譜估計算法[J].計算機應用，2016，36（12）：3369-3373，3384.

[4]張斌，全昌勤，任福繼.語音合成方法和發展綜述[J].小型微型計算機系統， 2016，37（1）：186-192.

[5]柳琳，羅軍.基于Android的圖靈聊天機器人設計[J].電腦知識與技術， 2016，12（17）：169-171.

[6]范靈.基于Cortex-A8的物聯網智能應用[D].成都：電子科技大學，2014.

[7]熊林云.基于ARM Cortex-M3的語音合成軟件系統設計與實現[D].成都：電子科技大學，2014.

[8]耿琳瑩，陳登偉，安新源，等.語音業務多系統融合技術研究與實現[J].物聯網技術，2016，6（12）：96-98.