方馨悅,王玫,劉茜茜,鄭心怡,王鑫蓉,鄧雪梅
基于用戶測評的導醫助手語音交互設計研究
方馨悅,王玫,劉茜茜,鄭心怡,王鑫蓉,鄧雪梅
(四川大學,成都 610065)
通過研究門診導醫助手的交互程度、音調、性別對擬人化程度、有效性、滿意度的影響,為未來導醫場景及更多公共場合的語音助手的形象與話術設計提供參考。讓12位被試在模擬導醫場景下與不同交互程度、音調、性別的語音助手進行對話任務,通過綠野仙蹤測試法(Wizard of Oz)進行實驗。使用七分李克特量表獲取擬人化程度、有效性、滿意度評分并進行開放性訪談,再通過弗里德曼檢驗(Friedman Test)、威爾克爾森符號秩檢驗(Wilcoxon Signed Rank Test)與最小二乘回歸分析對結果進行量化分析,以探索用戶對導醫助手的形象與話術偏好。最后根據研究結果,對導醫系統展開了多模態用戶界面的設計實踐。在導醫場景下,用戶更偏好交互程度高的導醫助手,音調為女低音或男高音的導醫助手評分更高,用戶對導醫助手的性別沒有明顯偏好。導醫助手的用戶滿意度隨著擬人化程度的增加而增加。對于公共場合的語音交互設計,應深入調研各類用戶的偏好,設計出更受用戶喜愛的語音助手,并發揮出多模態用戶界面的優勢。
門診導醫;語音交互設計;語音助手;語音用戶界面;多模態;用戶測評;用戶體驗
門診服務是醫院與患者之間的重要連接通道,直接關系到患者對醫院的印象與就診體驗。在傳統的就診過程中,掛號、排隊等流程花費了用戶大量的時間[1],大大降低了用戶的就診體驗。為了提高服務質量,許多醫院構建起了智能化的自助導醫服務系統[2–4]。但直至現在,診療服務的人性化仍有很大的進步空間。自助導醫服務系統的一個重要升級方向便是應用智能語音技術提升操作的自然性、易用性。當下,語音助手已漸漸遍布人們的生活,語音交互設計成為了國內外的研究熱點[5]。但是對于語音助手的研究仍集中在已廣泛使用的智能手機、家居、車載等較為私密場景的語音助手方面[6],對公共場合(尤其是導醫場景)的語音助手的研究較少。本研究針對導醫語音助手,通過實驗探索了用戶對其交互程度、音調、性別的偏好,并進行了設計實踐。本研究有助于進一步了解公共場合語音助手的形象與對話設計原則,為未來的語音交互設計及多模態用戶界面設計提供了指導與參考。
相比于圖形用戶界面,語音用戶界面有以下優勢:高效,說話速度相較于打字速度更快;易學,語音是最自然的交互方式,語音交互幾乎不需要學習成本;釋放雙手;情感交互,大量的情感信息可以通過語氣、語調、語速、音量等因素傳達[7-8]。
語音交互賦予了智能系統以人物形象。無論設計師是否對產品的人格進行設計,用戶都會為產品賦予某種人格特質,因此在設計時應確定好語音助手的人物形象[7]。設計師在設計過程中需要考慮語音助手的人物形象設定是否有助于發展用戶與機器的關系、是否與工作環境相匹配。用戶對語音助手人物形象的感知主要受語氣與語調的影響,其次是表達方式與內容[9]。
李璟璐等[10]指出在進行智能交互設計時,應盡量貼近人與人的交流方式。Niculescu等[11]的實驗顯示,在公共服務領域,用戶更喜愛具有幽默感與同理心的語音助手。孫妍彥等[9]提出,在家庭場景下,女性、18~25歲、開放聰慧、與用戶關系類型為助手或朋友的語音助手最受歡迎。王爾卓等[12]研究發現,在智能家居場景下,經驗用戶和家庭用戶偏好建議者風格的語音助手,直率的溝通方式獲得了更高的滿意度、舒適度評分。Lutfi等[13]認為在語音助手的設計中加入情感可以有效減少用戶的挫敗感,提高用戶滿意度。
聲音會讓用戶對人的背景作出預判,并在此基礎上施加刻板印象[14-15]。音調、音調范圍、音量、語速這四個基本特征關系到用戶對語音助手人格的感知[16–18]。Niculescu等[11]發現,高音調的女性助手被認為社交技巧更好、更令人愉悅;低音調的女性助手被認為更強大;男性用戶認為低音調的女性助手聽起來更專業、語速更快、更有魅力。
不同性別的聲音會引發人們的刻板印象[19]。Pak等[20]發現,用戶對男性虛擬醫生更加信任。Costrich等[21]提出,當語音助手進行主導行為時,男性助手被認為自信,而女性助手則被認為咄咄逼人。Yu等[22]認為,與男性助手相比,用戶更可能對女性助手透露個人信息。Chang等[23]通過實驗發現,對于護理助手,人們更偏好外向的女性聲音,這與對承擔護理工作的角色的刻板印象一致。Heilman[24]發現用戶認為男性助手對男性話題更了解,女性助手對女性話題更了解。
不同類型的產品在功能和使用場景上各不相同,可用性和感知有用性設計的亮點可能也不盡相同[12-13]。Liao等[6]研究發現,用戶對手機語音助手與家居語音助手有不同的偏好:用戶期望手機語音助手更高效、與家居語音助手進行更多的情感交流。Pearl等[8]認為對于通用產品,應該設計不那么讓人愛憎分明,而是更為含蓄、普適的人格。
現在,越來越多的服務機器人被應用于公共場所,例如博物館[25]、機場[26]、車站[27]、酒店[28]、購物中心[29]等。對于不同場景的語音助手,應分別對用戶偏好展開研究。但是,目前少有針對公共空間語音助手的研究,尤其是對于需求日益增長的導醫語音助手的關注度較小。相較于目前語音交互研究較為豐富的智能手機、家居、車載等個人語音助手,導醫語音助手具有其獨特性。首先,導醫語音助手處于公共空間中,所面對的用戶更為復雜,用戶的年齡、文化程度、個性、情緒等各不相同[30-31],無法如個人語音助手一般根據用戶設置個性化的形象、話術,因而需要更具普適性。其次,在與個人語音助手進行交互時,用戶大多處在熟悉的私人環境中,故用戶并未習慣在公共環境下與語音助手進行互動[32]。在導醫場景下,陌生的環境及周遭大量的陌生人會使部分用戶感到尷尬、不安。同時在首次使用時,用戶對于語音助手的工作能力并不了解,容易存在不信任的因素[33]。此外,在導醫場景下用戶的目的性較強,對于對話效率的要求更高。由于導醫場景的特殊性,用戶對導醫語音助手的偏好仍有待進一步探究。
大量研究表明,人格、音調、性別等特征可以塑造語音助手的人物形象,影響用戶體驗[11]。因此,本次研究擬從交互程度、音調、性別三個維度入手,探索導醫場景下用戶對語音交互的偏好。
本次研究分為導醫場景下的交互程度偏好、音調偏好、性別偏好三個維度,探索這三個維度對導醫語音助手擬人化程度、有效性、滿意度的影響。
實驗使用的語音材料通過百度AI開放平臺的在線語音合成系統生成,圖形用戶界面見圖1。實驗使用了語音交互設計中廣泛使用的綠野仙蹤測試法[34],主試與被試分別處于不同的房間內,主試可以聽見并看見被試與導醫助手的互動過程。在被試不知情的情況下,主試根據被試的回答選擇相應的交互進程。

圖1 圖形用戶界面
根據合作原則[35],實驗設計了交互程度為低、中、高的三類導醫助手。不同交互程度的導醫助手只在對話模式和腳本上不同,語氣、音調、音量都保持不變,見表1。實驗任務為詢問科室位置的場景。為避免性別對用戶主觀感知的影響,每種交互程度的導醫助手設置男性、女性各一組。
表1 導醫助手的交互特征及對話示例

Tab.1 Interaction features and dialogue samples of outpatient service assistants
音調偏好實驗設計了女低音、女高音、男低音、男高音四個導醫助手,對話腳本、音量保持不變,實驗任務為詢問醫院工作時間。
性別偏好實驗中的導醫助手除性別外,對話腳本、音調、音量保持不變,實驗任務為掛號。
本次研究共招募了12位被試,其中包括6位女性與6位男性,年齡為20~53歲,平均年齡為29.17歲。每位被試完成所有實驗所需的時間為25~35 min。
如上所述,研究共分為三個部分:交互程度偏好、音調偏好、性別偏好。每位被試需要與9位導醫助手進行對話。在實驗開始前,被試需要閱讀實驗任務劇本,了解本次實驗所處的場景與任務目標。完成任務后,被試需填寫一份七分李克特量表來評價導醫助手。量表包含15道題,題干表述從已完成信度、效度檢驗的量表[36-38]中選取,測量被試對導醫助手的擬人化程度、有效性、滿意度評價。最后,對被試進行開放性訪問。訪問內容包括對導醫助手的印象、喜愛度排序、喜歡或不喜歡某個導醫助手的原因等。
本次實驗的數據分析通過IBM SPSS 26.0軟件完成。
問卷中擬人化程度、有效性、滿意度3個維度的科隆巴赫系數(Cronbach's Alpha)均超過0.9,表明該問卷的內部一致性與信度較高。因此,可以對數據進行進一步分析。
交互程度偏好實驗共收集到11組數據,采用弗里德曼檢驗(Friedman Test)進行分析。結果顯示,交互程度為低、中、高的導醫助手的擬人化程度(2(2)= 35.671,<0.001)、有效性(2(2)=14.262,=0.001)、滿意度(2(2)=39.127,<0.001)存在顯著差異。
成對比較結果見表2。交互程度為低與中(= 0.029)、低與高(<0.001)、中與高(=0.049)的擬人化程度具有顯著差異。交互程度為低與高(=0.013)的有效性具有顯著差異,而低與中(=0.950)、中與高(=0.189)的有效性差異不顯著。交互程度為低與高(<0.001)、中與高(=0.042)的滿意度具有顯著差異,而低與中(=0.058)的滿意度差異不顯著。交互程度對導醫助手擬人化程度、有效性、滿意度的影響,見圖2。
在前期用戶訪談中,半數的用戶提到希望導醫助手不用先開口說話或只說“您好”,希望導醫助手的道歉越簡短越好。但是在實際使用后的訪談中用戶表示,只說“您好”的低交互程度的導醫助手常讓用戶感到困惑。在實驗后的訪談中,有用戶提到低交互程度的導醫助手話術過于機械化,給人不可靠的印象,而高交互程度的導醫助手則令人放松、安心。當導醫助手無法識別用戶的話語時,高交互程度的導醫助手的道歉能減輕挫敗感與煩躁感。在詢問科室地點時,高交互程度的導醫助手提示可以拍下地圖這一行為讓用戶感到非常驚喜。
表2 不同交互程度的導醫助手的弗里德曼檢驗成對比較

Tab.2 Pairwise comparisons of Friedman test of outpatient service assistants of different interaction levels

圖2 不同交互程度的導醫助手的平均得分
音調偏好實驗共收集到12組數據,采用弗里德曼檢驗進行分析。弗里德曼檢驗結果顯示,音調為女低音、女高音、男低音、男高音的擬人化程度(2(2)= 13.109,=0.004)、有效性(2(2)= 22.878,<0.001)、滿意度(2(2)=55.062,<0.001)的差異皆具有顯著性。
成對比較結果見表3。女低音與男低音(=0.021)的擬人化程度具有顯著差異,其他組之間的差異則不具有顯著性(>0.05),其中男低音的擬人化程度低于其他音調。女低音與男低音(=0.020)的有效性具有顯著差異,其他組之間沒有顯著差異(>0.05)。女低音與女高音(<0.001)、女低音與男低音(<0.001)、女高音與男高音(=0.005)、男低音與男高音(=0.027)的滿意度具有顯著差異,其他組之間不存在顯著差異(>0.05)。音調對導醫助手擬人化程度、有效性、滿意度的影響見圖3。
在實驗后的用戶訪談中,用戶的喜好各不相同。喜歡女高音的用戶認為其聲音“溫柔”“甜美”,而不喜歡的用戶則表示女高音聽起來“太年輕”“不可靠”“有攻擊性”。喜歡男低音的用戶認為其“沉穩”“可靠”,而不喜歡的用戶認為男低音“聲音低沉”“清晰度差”。但是,對于男高音,大部分用戶認為它“年輕陽光”;對于女低音,大部分用戶認為它“沉穩專業”“成熟可靠”。
性別偏好實驗共收集到12組數據,采用威爾克爾森符號秩檢驗(Wilcoxon Signed Rank Test)進行數據檢驗。分析結果顯示,女性與男性導醫助手的擬人化程度(=0.564)、有效性(=0.068)、滿意度(=0.302)差異不顯著,見表4。
表3 不同音調的導醫助手的弗里德曼檢驗成對比較

Tab.3 Pairwise comparisons of Friedman test of outpatient service assistants of different pitch

圖3 不同音調的導醫助手的平均得分
表4 不同性別的語音助手的威爾克爾森符號秩檢驗

Tab.4 Wilcoxon signed ranks test of voice assistants of different gender
在實驗后的用戶訪談中,用戶對男性、女性助手的偏好也比較平均。偏好女性導醫助手的用戶認為“導醫人員多為女性”“符合用戶對導醫人員的固有印象”“女性的聲音更加溫柔親切”。偏好男性導醫助手的用戶則認為男性導醫助手“聽起來更加專業”,“讓人聯想到醫生的形象”。這其中仍存在一些對性別的刻板印象。
采用最小二乘回歸分析處理,探索了擬人化程度如何影響有效性、滿意度,結果如圖4所示。擬人化程度與有效性間存在線性關系(1,29)=17.246,<0.001。擬人化程度可以解釋有效性變化的37.3%。回歸方程為:有效性= 3.016+(0.501×擬人化程度)。擬人化程度與滿意度間存在線性關系(1, 31)=32.433,<0.001。擬人化程度可以解釋滿意度變化的51.1%。回歸方程為:滿意度=1.770+(0.674×擬人化程度)。有效性與滿意度隨著擬人化程度的增加而增加。
在實驗過程中,青年用戶說出的命令大多基于屏幕上已顯示的功能文字說明(如:“科室導航”),而中年用戶的命令則更接近于自然語言(如:“我想問一下血液科要怎么走”)。在實驗中還觀察到,當任務為需要穿透用戶界面的操作(即當前屏幕上沒有該功能)時,青年用戶容易受限于當前界面顯示的功能,出現疑惑的狀態,而中年用戶則會直接、自然地對導醫助手進行詢問。

圖4 擬人化程度對有效性與滿意度的影響
研究發現,高交互程度、音調為女低音的導醫助手的擬人化程度、有效性、滿意度最高,用戶對于導醫助手的性別沒有明顯偏好。另外,導醫助手的擬人化程度與有效性、滿意度正相關。在交互程度方面,雖然低交互程度的對話文本更加簡短,但用戶并不認為其有效性更高。相對于單純的縮短時間,優化對話體驗會更明顯地提高用戶滿意度。在音調方面,女低音與男高音的滿意度顯著高于女高音與男低音。
總體來說,用戶偏好高交互程度、高擬人化程度、音調為女低音或男高音的導醫語音助手。從用戶訪談可知,用戶期望導醫助手具有專業、可靠、親切、貼心的特質。
根據研究結果設計的導醫助手的人物模型如圖5。導醫助手小慧是一位女性護士,35歲,有12年的工作經驗。小慧的聲音選擇了音調較低、語速適中、音量較大的女聲。依據研究結果與大五人格理論[39],小慧的責任心、外傾性、宜人性較高,而開放性、神經質性較低。
用戶偏好交互程度、擬人化程度高的導醫助手。因此,在對話設計中,將通過插入適當的溫馨提示、禮貌性語句、語氣詞等方式提升互動性與用戶體驗,如:當插入就診卡后,導醫助手會禮貌地稱呼用戶(如:張先生、陳女士),以提示用戶讀卡成功并拉近與用戶的心理距離;在用戶完成掛號后,導醫助手會提示預計需要等待的時間;在顯示導航地圖時,導醫助手會提醒用戶可以拍照記錄;當選擇退卡時,導醫助手會提示用戶取走就診卡等。

圖5 導醫助手人物模型
同時,因為導醫系統使用于公共場合,在語音交互設計過程中也應注重用戶隱私問題。對于涉及隱私的疾病信息、個人信息等,不應通過語音播報,而應使用視覺模態進行信息輸出。
以掛號功能為例,對話設計見圖6。語音與圖形相結合的多模態用戶界面將會發揮出各自的優勢,提高信息輸入和輸出的效率,優化產品的易用性與自然度。導醫系統的多模態用戶界面設計示例見圖7。

圖6 導醫助手對話設計

圖7 多模態用戶界面設計
本研究的目的是探索語音助手在導醫場景中的人物模型與對話設計,通過實驗研究,為未來的公共場合語音助手設計提供了參考:在交互程度上,用戶更喜歡交互程度高、互動性強、貼心的導醫語音助手;在音調上,用戶更偏好女低音與男高音;在性別上,用戶的偏好沒有統計學差異;導醫助手的擬人化程度與有效性、滿意度正相關;根據實驗結果,進一步完善了導醫助手的形象、話術設計,使用多模態用戶界面提升了導醫助手的可用性與用戶體驗。
對于各類的智能語音助手設計,需要依據具體功能與應用場景進行考慮,不能一概而論。對于公共場合的語音助手,應平衡各類用戶的需求,使語音助手的形象、話術更具普適性。
醫療領域在未來的發展不會僅僅停留在追求醫治水準的進步上,還將致力于服務水平的提高。最新技術的融入會使就醫服務更加人性化,逐漸解決患者在就診流程上浪費過多時間的問題。隨著未來科技的發展,語音交互將會結合人工智能的各項技術,提升自然度、真實性和交互效率,讓用戶的操作路徑更短,系統更加智能。
[1] 劉鑫, 萬振, 孫昕, 等. 基于信息化技術的智慧門診發展現狀[J]. 醫療裝備, 2019, 32(15): 56-59.
LIU Xin, WAN Zhen, SUN Xin, et al. Development Status of Intelligent Outpatient Service Based on Information Technology[J]. Medical Equipment, 2019, 32(15): 56-59.
[2] 徐冬. 門診導醫機器人的應用及探索[J]. 醫學信息, 2019, 32(1): 28-30.
XU Dong. Application and Exploration of Outpatient Medical Robot[J]. Medical Information, 2019, 32(1): 28-30.
[3] 劉紅彥, 聞智. 智能導診機器人在綜合性醫院門診的應用[J]. 中國衛生產業, 2017, 14(26): 55-57.
LIU Hong-yan, WEN Zhi. Application of the Intelligent Guidance Robot in the Modern Comprehensive Hospital Outpatient Service[J]. China Health Industry, 2017, 14(26): 55-57.
[4] 張金慧, 徐慧雁. 智能導診機器人在門診患者就診流程中的應用效果[J]. 名醫, 2020(3): 279.
ZHANG Jin-hui, XU Hui-yan. Application Effect of Intelligent Guided Robot in Outpatient Consultation Process[J]. Renowned Doctor, 2020(3): 279.
[5] PORCHERON M, FISCHER J E, REEVES S, et al. Voice Interfaces in Everyday Life[C]//Proceedings of the 2018 CHI Conference on Human Factors in Computing Systems. New York: ACM, 2018: 1-12.
[6] LIAO Qing-lin, ZHANG Shan-shan, WANG Mei, et al. Comparing the User Preferences Towards Emotional Voice Interaction Applied on Different Devices: An Empirical Study[C]//Kurosu M. International Conference on Human-Computer Interaction. Cham: Springer, 2020: 209-220.
[7] COHEN M H, GIANGOLA J P, BALOGH J. Voice user interface design[M]. Boston: Addison-Wesley, 2004
[8] PEARL C. Designing voice user interfaces: principles of conversational experiences[M]. Sebastopol, CA: O’Reilly Media, 2016
[9] 孫妍彥, 李士巖, 陳憲濤. 情感化語音交互設計——百度AI用戶體驗部門人機交互研究地圖與設計案例[J]. 裝飾, 2019(11): 22-27.
SUN Yan-yan, LI Shi-yan, CHEN Xian-tao. Emotional Voice Interaction Design: Human Computer Interaction Research Map and Design Case of Baidu AI User Experience Department[J]. Art & Design, 2019(11): 22-27.
[10] 李璟璐, 孫效華, 郭煒煒. 基于智能交互的汽車主動響應式交互設計[J]. 圖學學報, 2018, 39(4): 668-674.
LI Jing-lu, SUN Xiao-hua, GUO Wei-wei. Proactive HMI Design Based on Smart Interaction[J]. Journal of Graphics, 2018, 39(4): 668-674.
[11] NICULESCU A, VAN DIJK B, NIJHOLT A, et al. Making Social Robots more Attractive: The Effects of Voice Pitch, Humor and Empathy[J]. International Journal of Social Robotics, 2013, 5(2): 171-191.
[12] 王爾卓, 袁翔, 李士巖. 智能家居場景中會話智能體主動交互設計研究[J]. 圖學學報, 2020, 41(4): 658-666.
WANG Er-zhuo, YUAN Xiang, LI Shi-yan. Proactive Interaction Design of Conversational Agent for Smart Homes[J]. Journal of Graphics, 2020, 41(4): 658-666.
[13] LUTFI S L, FERNáNDEZ-MARTíNEZ F, LORENZO- TRUEBA J, et al. I Feel You: The Design and Evaluation of a Domotic Affect-Sensitive Spoken Conversational Agent[J]. Sensors (Basel, Switzerland), 2013, 13(8): 10519-10538.
[14] TOLMEIJER S, ZIERAU N, JANSON A, et al. Female by Default? - Exploring the Effect of Voice Assistant Gender and Pitch on Trait and Trust Attribution[C]// CHI EA '21: Extended Abstracts of the 2021 CHI Conference on Human Factors in Computing Systems. Yokohama, Japan. New York: ACM, 2021: 1-7.
[15] SUTTON S J, FOULKES P, KIRK D, et al. Voice as a Design Material: Sociophonetic Inspired Design Strategies in Human-Computer Interaction[C]//Proceedings of the 2019 CHI Conference on Human Factors in Computing Systems. Glasgow, Scotland Uk. New York: ACM, 2019: 1-14.
[16] APPLE W, STREETER L A, KRAUSS R M. Effects of Pitch and Speech Rate on Personal Attributions[J]. Journal of Personality and Social Psychology, 1979, 37(5): 715-727.
[17] COLLINS S A, MISSING C. Vocal and Visual Attractiveness are Related in Women[J]. Animal Behaviour, 2003, 65(5): 997-1004.
[18] RIDING D, LONSDALE D, BROWN B. The Effects of Average Fundamental Frequency and Variance of Fundamental Frequency on Male Vocal Attractiveness to Women[J]. Journal of Nonverbal Behavior, 2006, 30(2): 55-61.
[19] LEE E J, NASS C, BRAVE S. Can Computer-Generated Speech Have Gender? : An Experimental Test of Gender Stereotype[C]//CHI EA '00: CHI ’00 Extended Abstracts on Human Factors in Computing Systems. The Hague, The Netherlands. New York: ACM, 2000: 289-290.
[20] PAK R, MCLAUGHLIN A C, BASS B. A Multi-Level Analysis of the Effects of Age and Gender Stereotypes on Trust in Anthropomorphic Technology by Younger and Older Adults[J]. Ergonomics, 2014, 57(9): 1277-1289.
[21] COSTRICH N, FEINSTEIN J, KIDDER L, et al. When Stereotypes Hurt: Three Studies of Penalties for Sex- Role Reversals[J]. Journal of Experimental Social Psychology, 1975, 11(6): 520-530.
[22] YU Qian, NGUYEN T, PRAKKAMAKUL S, et al. "I almost Fell in Love with a Machine": Speaking with Computers Affects Self-Disclosure[C]//CHI EA '19: Extended Abstracts of the 2019 CHI Conference on Human Factors in Computing Systems. Glasgow, Scotland Uk. New York: ACM, 2019: 1-6.
[23] CHANG R C S, LU H P, YANG Pei-shan. Stereotypes or Golden Rules? Exploring Likable Voice Traits of Social Robots as Active Aging Companions for Tech-Savvy Baby Boomers in[J]. Computers in Human Behavior, 2018, 84: 194-210.
[24] HEILMAN M E. High School Students' Occupational Interest as a Function of Projected Sex Ratios in Male- Dominated Occupations[J]. Journal of Applied Psychology, 1979, 64(3): 275-279.
[25] SHIOMI M, KANDA T, ISHIGURO H, et al. Interactive Humanoid Robots for a Science Museum[C]//IEEE Intelligent Systems. IEEE, 2007: 25-32.
[26] RAMíREZ O A I, KHAMBHAITA H, CHATILA R, et al. Robots Learning how and where to Approach People [C]//2016 25th IEEE International Symposium on Robot and Human Interactive Communication (RO-MAN). New York, NY, USA. IEEE, 2016: 347-353.
[27] HAYASHI K, SAKAMOTO D, KANDA T, et al. Humanoid Robots as a Passive-Social Medium: A Field Experiment at a Train Station[C]//Proceedings of the ACM/IEEE international conference on Human-robot interaction. Arlington, Virginia, USA. New York: ACM, 2007: 137-144.
[28] PAN Ya-dong, OKADA H, UCHIYAMA T, et al. On the Reaction to Robot’s Speech in a Hotel Public Space [J]. International Journal of Social Robotics, 2015, 7(5): 911-920.
[29] CHEN Ying-feng, WU Feng, SHUAI Wei, et al. Robots Serve Humans in Public Places—Robot as a Shopping Assistant[J]. International Journal of Advanced Robotic Systems, 2017, 14(3): 172988141770356.
[30] 曹國忠, 蘇建華, 杜雪清, 等. 基于用戶體驗的導醫機器人設計研究[J]. 藝術與設計(理論), 2019(S1): 99-101.
CAO Guo-zhong, SU Jian-hua, DU Xue-qing, et al. Research on the Design of Guided Robot Based on User Experience[J]. Art and Design, 2019(S1): 99-101.
[31] MUBIN O, AHMAD M I, KAUR S, et al. Social Robots in Public Spaces: A Meta-review[C]//International Con-ference on Social Robotics. Cham: Springer, 2018: 213-220.
[32] THUNBERG S, ZIEMKE T. Are People Ready for Social Robots in Public Spaces? [C]//HRI '20: Companion of the 2020 ACM/IEEE International Conference on Human-Robot Interaction. Cambridge, United Kingdom. New York: ACM, 2020: 482-484.
[33] TIAN Lei-min, CARRENO-MEDRANO P, SUMARTOJO S, et al. User Expectations of Robots in Public Spaces: A Co-design Methodology[C]//International Conference on Social Robotics. Cham: Springer, 2020: 259-270.
[34] STEINFELD A, JENKINS O C, SCASSELLATI B. The Oz of Wizard: Simulating the Human for Interaction Research[C]//2009 4th ACM/IEEE International Conference on Human-Robot Interaction (HRI). La Jolla, CA, USA. IEEE, 2012: 101-107.
[35] GRICE H P. Logic and Conversation[M]//Speech Acts. New York: Brill, 1975: 41-58.
[36] 廖青林, 王玫, 馮戰. 基于情感交互的智能家居產品語音交互設計[J]. 包裝工程, 2019, 40(16): 37-42, 66.
LIAO Qing-lin, WANG Mei, FENG Zhan. Voice Interaction Design of Smart Home Products Based on Emotional Interaction[J]. Packaging Engineering, 2019, 40(16): 37-42, 66.
[37] TOM T, BILL A. 用戶體驗度量收集、分析與呈現(第二版)[M]. 北京: 電子工業出版社, 2018.
TOM T, BILL A. Measuring the User Experience: Collecting, Analyzing, and Presenting Usability Merics (Second Edition)[M]. Beijing: Publishing House of Electronics Industry, 2018.
[38] HONE K S, GRAHAM R. Towards a Tool for the Subjective Assessment of Speech System Interfaces (SASSI)[J]. Natural Language Engineering, 2000, 6(3-4): 287-303.
[39] 羅杰, 戴曉陽. 中文形容詞大五人格量表的初步編制Ⅰ: 理論框架與測驗信度[J]. 中國臨床心理學雜志, 2015, 23(3): 381-385.
LUO Jie, DAI Xiao-yang. Development of the Chinese Adjectives Scale of Big-Five Factor PersonalityⅠ: Theoretical Framework and Assessment Reliability[J]. Chinese Journal of Clinical Psychology, 2015, 23(3): 381-385.
Voice Interaction Design of Outpatient Service Assistants Based on User Measurement
FANG Xin-yue, WANG Mei, LIU Xi-xi, ZHENG Xin-yi, WANG Xin-rong, DENG Xue-mei
(Sichuan University, Chengdu 610065, China)
The work aims to explore the effects of interaction level, pitch and gender on perceived anthropomorphism, usefulness, and satisfaction of the outpatient service assistant to guide the image and speech design of voice assistants in outpatient service scenarios and more public places. Twelve participants performed conversation tasks with voice assistants of different interaction level, pitch and gender in simulated outpatient service scenarios. Experiments were carried out by Wizard of Oz technique. A seven-point Likert scale was used to obtain ratings of perceived anthropomorphism, usefulness, satisfaction, and interviews were conducted. The results were analyzed by Friedman test, Wilcoxon signed rank test, and least square regression to explore users' preferences on image and speech of outpatient service assistants. Finally, according to the research results, the design of a multi-modal user interface of the outpatient service system was carried out. The results showed that in the outpatient service scenarios, users preferred outpatient service assistants with high interaction level. In terms of pitch, low-pitched female voice and high-pitched male voice were rated higher. Yet, there was no significant difference in the user's gender preferences. Satisfaction increased with the increase of perceived anthropomorphism. For voice interaction design in public places, all kinds of users should be considered to design the voice assistant that can be accepted by most users, thus taking advantage of the multi-modal user interface.
outpatient service assistance; voice interaction design; voice assistants; voice user interface; multi-modal; user measurement; user experience
TB472
A
1001-3563(2023)04-0132-09
10.19554/j.cnki.1001-3563.2023.04.016
2022–09–10
基于互聯網+的康復監測平臺及服務系統研究(2019CDYB-4)
方馨悅(1998—),女,碩士生,主攻人機交互、多模態設計、用戶體驗。
王玫(1968—),女,教授,主要研究方向為計算機輔助制造。
責任編輯:馬夢遙