任俊恒

摘要:隨著家庭智能產品逐漸實現互聯互通,傳統的單一產品設計思路已經不能應對這樣一個完善的系統和新興的用戶需求。物聯網、語音識別、云計算等技術的發展為家庭數字娛樂系統帶來新的發展機會和感官體驗。本文對一種以智能語音技術的個性化的家庭智能語音數字娛樂系統進行相關的理論和設計研究。
關鍵詞:家庭數字娛樂系統;語音交互;服務設計;物聯網
一、智能語音技術在家庭數字娛樂系統的設計原則
1.1以目標用戶的需求為中心的原則
在進行服務系統設計時始終以目標用戶的需求為導向,滿足用戶的不同需求,除了滿足用戶的基本需求外,還要強調目標用戶的多層次需求,注重實現人的價值,將情感、心理等人性化的概念融入到設計中去。在智能語音系統的服務設計研究中,主要從滿足不同家庭角色需求各異的角度去探討多需求共存的問題。在家庭數字娛樂系統的智能語音服務設計研宂中,運用以目標用戶的需求為中心的原則意在通過前期目標用戶研究,將用戶需求轉化為產品和服務的功能要素。在智能語音服務中,將用戶在語音輸入、語音修正、等待處理以及語音輸出階段的服務觸點進行細化,優化每個服務觸點的質量,滿足用戶多層次的需求。
1.2聚散重構式系統性原則
在進行服務設計時,從整體全局視角出發,綜合考慮人、服務和環境等要素以及各要素之間的相互關系,進而合理地規劃系統內各要素之間的組合順序、配合程度,最終能夠最大限度地發揮整體服務系統性能。聚散重構式系統創新是指在系統創新基礎上對智能語音服務中散落的問題點,以及服務系統中可能涉及到的諸多利益相關者進行分析,并重新建立任務關系模型。
1.3多方協作式原則
在設計研究階段,通過對目標用戶的研究分析,將用戶對智能語音服務的使用行為、體驗痛點以及期待傳達給設計團隊、技術人員或客服。在設計完成階段,邀請用戶進行體驗,對體驗較差的觸點進行優化后再上線,避免造成損失。在產品和服務上線后,用戶可以通過產品內部的反饋功能將使用體驗及時反饋給工作人員。多方協作的創新方式將用戶與設計團隊連接一起,設計團隊能夠挖掘用戶真實的需求,并為用戶提供更好的服務,實現服務價值最大化。
二、家庭數字娛樂系統中智能語音相關技術介紹
智能語音技術涉及到多個學科的知識,如聲學、認知、模式識別、人工智能技術等。智能語音的系統框架包含5個模塊,如圖1所示。語音識別模塊負責接受用戶的語音輸入并且將其轉成文字交給自然語言理解模塊。自然語言理解模塊在理解了用戶輸入的語義之后將特定的表達輸入對話管理模塊中。對話管理模塊負責協調各個模塊的調用以及維護當前對話狀態,并將特定的回復方式交由自然語言生成模塊進行處理。自然語言生成模塊生成特定回復文本輸入語音合成模塊。語音合成模塊負責將文字以語音的方式輸出給用戶。
三、家庭數字娛樂智能語音應用的系統設計
3.1語音為主、視覺為輔的多模態設計
目前,界面交互設計覆蓋大多數人機交互場景,視覺信息輔助用戶完成系列任務。在語音識別、語音合成技術尚未成熟階段,完全依賴于語音交互卻可能給用戶帶來困擾。語音交互設計剝離了界面設計,摒棄傳統的界面信息指示、引導,對用戶和設計師都是巨大的挑戰。用戶和產品的語音交互行為主要基于語音進行信息的輸入輸出,語音信息具有瞬態即時性,復雜的語音信息輸出會增加用戶心理認知負荷。例如,通過智能音箱購買電影票時,用戶需要對電影院地理位置、影院音效、商場環境、電影放映時間、座位位置等因素進行綜合考慮,語音助手完成任務的鏈路較長,用戶瞬時記憶能力很難完成訂票服務。3.2基于用戶使用場景的設計
隨著物聯網技術以及智能硬件的不斷發展,智慧家居已經逐漸走入人們的視野,家電從冷冰冰的個體演變成了智慧的系統。語音交互為智能家居系統帶來更方便、更生動的交互方式。從空間屬性上可將智慧家居可分為私密空間(臥室場景)、開放空間(客廳場景)和協作空間(廚房場景)三類場景。用戶在不同的細分場景下對產品需求各不相同,產品需要提供不同的業務邏輯匹配用戶的場景需求。在開放空間,家庭數字娛樂產品承載著公共互娛的功能屬性,如播放音樂、控制智能家居。產品可根據周圍環境的嘈雜程度自適應調整語音輸出的響度,以確保用戶能夠接收到語音信息。開放空間無關的語音信息較多,產品要能夠屏蔽過濾掉雜音,給予用戶正確的反饋。
3.2合理進行界面交互設計
在界面交互設計中,設計師通過視覺設計確保圖形、色彩、字體等元素保持一致性,準確地將產品概念傳達給用戶。相比于有形的界面設計元素,語音交互設計元素趨向于無形。響度、音色、音調、節奏等元素成為語音交互設計的材料。每個人說話的語氣、咬字、節奏都是獨特的,甚至成為個性標簽。語速快、音色脆給人年輕活潑的印象,語速慢、響度低給人沉穩可靠的感覺。家庭數字娛樂產品給人有趣、輕松、智能的印象,產品語音交互設計需傳達一致的聽覺形象。在語音形象設計中,需要刻畫產品的擬人畫像,其聽覺形象需要與產品功能屬性保持一致,將語音信息人性化地傳達給用戶。
3.3?多輪對話的互動性設計
語音交互因其與人類會話方式類似而被認為是自然交互,因此語音交互也遵循著人類合作式會話的原則。哲學家保羅?格里斯認為,輪流表達、上下文和串聯是合作式會話的組成部分,即合作原則。語音交互應當預判和推測用戶下一步的語音指令和上下語境關系,以保證用戶和產品輪流表達,傳遞信息。在家居環境中,遠場語音交互容易分散用戶注意力,對話應該通過關鍵的語料元素給用戶精準的語音提示或設備響應。這種串聯式表達能夠推進會話進程,將上下語境內容融合在一起。在人類日常對話中,經常略去前文的主語或者賓語,智能硬件在多輪互動中聯系上下語境、讀取用戶的歷史行為記錄以便更好的理解用戶。
四、結束語
隨著物聯網、云計算等計算機技術的發展,家庭數字娛樂產品之間的互聯互通成為可能。對于家庭數字娛樂系統,現階段發展的最大瓶頸在于行業之間尚未形成統一的通信標準。在未來智能語音技術在家庭數字娛樂系統的發展實踐中,相關應用程序將針對不同的用戶以及用戶多樣化的需求越來越完善,使用戶的使用體驗更加的人性化和智能化。
參考文獻:
[1] 人機語音交互存在的問題研究[J].葉子.科技傳播.2018(01)
[2] 移動智能終端的語音交互設計原則初探[J].高峰,郁朝陽.工業設計研究.2019(00)
[3] 數字娛樂產品中的自然交互方式研究[D].譚慧.江南大學2018(11)
(作者單位:深圳智明創展電子有限公司)