張承業(yè) 張憲民
摘要:首先回顧了人機(jī)交互模式的變革史,并從5個(gè)方面討論了人工智能對(duì)人機(jī)交互的影響,分析了智能人機(jī)交互形式、技術(shù)缺陷及應(yīng)用挑戰(zhàn),提出人工智能時(shí)代對(duì)人機(jī)交互未來(lái)發(fā)展的討論和思考。
關(guān)鍵詞:人機(jī)交互;人工智能;自然交互;技術(shù)挑戰(zhàn)
中圖分類號(hào):TH122;TP274 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2018)05-0206-02
人機(jī)交互技術(shù)作為人與計(jì)算機(jī)之間信息交流的接口,是推動(dòng)計(jì)算機(jī)產(chǎn)業(yè)發(fā)展的關(guān)鍵因素之一。智能化時(shí)代,交互無(wú)處不在,人的智能與機(jī)器智能共同發(fā)展,擴(kuò)展了交互設(shè)計(jì)的廣度和維度,對(duì)人機(jī)交互能力提出了新的挑戰(zhàn)。由于缺少與新時(shí)期智能交互需求相適應(yīng)的、高效的交互界面,及成熟統(tǒng)一的交互技術(shù)[1],目前人機(jī)交互能力和交互效率仍停留在較低的水平,并沒(méi)有隨著人工智能時(shí)代的發(fā)展得到相應(yīng)的提高。為了應(yīng)對(duì)智能時(shí)代的挑戰(zhàn),把握智能時(shí)代人機(jī)交互技術(shù)發(fā)展的新機(jī)遇,實(shí)現(xiàn)交互技術(shù)的跨越式發(fā)展。本文首先回顧了人機(jī)交互模式的發(fā)展變革史,分析了人工智能對(duì)人機(jī)交互的影響,總結(jié)了智能人機(jī)交互的技術(shù)缺陷及應(yīng)用挑戰(zhàn),最后對(duì)人工智能時(shí)代人機(jī)交互未來(lái)發(fā)展進(jìn)行了討論和思考。
1 人機(jī)交互模式的變革
人機(jī)交互關(guān)注用戶與系統(tǒng)(計(jì)算機(jī))之間的信息交換,包括用戶到系統(tǒng)和系統(tǒng)到用戶的信息交換兩部分。人機(jī)交互模式的發(fā)展史,是“以計(jì)算機(jī)為中心”到“以用戶為中心”的發(fā)展過(guò)程,就交互形式而言共經(jīng)歷了以下幾個(gè)階段:
(1)基于鍵盤與命令語(yǔ)言交互階段。交互界面采用命令語(yǔ)言驅(qū)動(dòng)操作,專業(yè)性強(qiáng),只能通過(guò)操作鍵盤來(lái)輸入數(shù)據(jù)和命令信息,界面輸出為靜態(tài)字符。交互邏輯與流程復(fù)雜,拷貝粘貼等關(guān)鍵操作未簡(jiǎn)化,易出錯(cuò),只能完成單線程的單一任務(wù)。這一階段確定了QWERTY的鍵盤布局并沿用至今。(2)基于鼠標(biāo)和圖形用戶界面的交互階段。伴隨著圖形界面技術(shù)的發(fā)展,逐漸形成了WIMP界面,并引入鼠標(biāo),解決了精確定位、快速切換的難題。以超文本標(biāo)記語(yǔ)言HTML及超文本傳輸協(xié)議HTTP的網(wǎng)絡(luò)瀏覽器為特征,所形成的網(wǎng)絡(luò)用戶界面,成為當(dāng)前Internet的支柱。(3)基于多點(diǎn)觸控技術(shù)的觸屏交互。伴隨著移動(dòng)互聯(lián)網(wǎng)及微型電腦產(chǎn)品的普及,基于圖形用戶界面的多點(diǎn)觸控交互技術(shù)的出現(xiàn)豐富了交互場(chǎng)景,解決了小屏設(shè)備界面利用率及隨時(shí)隨地交互的問(wèn)題。此時(shí)交互設(shè)計(jì)以功能為中心,關(guān)注用戶體驗(yàn)和用戶情感。(4)多通道、多模態(tài)的自然交互階段。物聯(lián)網(wǎng)的發(fā)展,人機(jī)交互形式多樣并出現(xiàn)融合交叉,逐漸回歸“以用戶為中心”的初心,參與式設(shè)計(jì)與眾創(chuàng)模式成為主流,交互界面依賴于大數(shù)據(jù)、物聯(lián)網(wǎng)及人工智能進(jìn)行創(chuàng)新與精簡(jiǎn)[2],并出現(xiàn)了多種形式,如NUI自然交互界面、TUI實(shí)體交互界面[4]、可穿戴計(jì)算等。
人機(jī)交互及交互界面技術(shù)的發(fā)展伴隨著人工智能波動(dòng)與繁榮直至爆發(fā),但受限于計(jì)算機(jī)科學(xué)發(fā)展水平,在很長(zhǎng)一段時(shí)間內(nèi),人機(jī)交互以適應(yīng)機(jī)器為主,各種編程語(yǔ)言、輸入法、數(shù)據(jù)輸入設(shè)備等就是例證。隨著技術(shù)和情境的發(fā)展變化,現(xiàn)存交互形式已不再適應(yīng)要求,人們?cè)絹?lái)越追求體驗(yàn)和高效、自然和無(wú)感,回歸人機(jī)交互技術(shù)的初心,讓計(jì)算機(jī)服務(wù)并適應(yīng)人類的需要,而不是強(qiáng)求人類去適應(yīng)計(jì)算機(jī)。人工智能的繁榮與爆發(fā),為人機(jī)交互技術(shù)的更迭提供了可能。
2 人工智能對(duì)人機(jī)交互的影響
人工智能的出現(xiàn)促進(jìn)了傳統(tǒng)人機(jī)“輸入-反饋”循環(huán)向“推薦-選擇”循環(huán)的過(guò)渡。人機(jī)交互關(guān)系由“單向從屬”向“雙向訓(xùn)練”過(guò)渡。這種改變將重寫交互設(shè)計(jì)的設(shè)計(jì)思維、架構(gòu)、形式、流程、規(guī)范等。
(1)對(duì)交互設(shè)計(jì)思維的突破。人工智能連接工程師、設(shè)計(jì)師和用戶的心智模型,能夠靈活根據(jù)交互的方式與內(nèi)容,在目標(biāo)、動(dòng)機(jī)、條件與結(jié)果之間達(dá)成最優(yōu)解決方案。根據(jù)功能目標(biāo)確定交互行為模式,映射匹配出各種人機(jī)、人際、人事、人境的交互場(chǎng)景,達(dá)到場(chǎng)景化的目標(biāo)最優(yōu)路徑。而后根據(jù)用戶的體驗(yàn)反饋,分析優(yōu)化和測(cè)試改進(jìn)交互流程與交互體驗(yàn)結(jié)果,形成新的人機(jī)共生關(guān)系[2]。(2)對(duì)信息架構(gòu)的優(yōu)化。GUI時(shí)代,信息架構(gòu)由頁(yè)面和流程決定。當(dāng)信息量不斷增加,信息的展現(xiàn)需要更多的頁(yè)面來(lái)承載,導(dǎo)致了信息架構(gòu)的層級(jí)和流程變得復(fù)雜,增加了用戶的使用成本。人工智能時(shí)代,可以利用語(yǔ)音輸入以特定關(guān)鍵詞進(jìn)行信息搜索和功能觸發(fā),使信息流獲取的準(zhǔn)確性大幅度提高,產(chǎn)品不再需要復(fù)雜的架構(gòu)來(lái)承載不同內(nèi)容,可極大提高用戶的交互效率,并具有高兼容性和擴(kuò)展性,為原有信息架構(gòu)賦予了活力和流動(dòng)性。(3)對(duì)交互界面的擴(kuò)展。隨著可穿戴設(shè)備和物聯(lián)網(wǎng)技術(shù)的發(fā)展,萬(wàn)物得以數(shù)字化形式展現(xiàn),并均可能作為人機(jī)交互界面的一部分,成為人機(jī)交互的媒介,交互界面不再局限于GUI,會(huì)呈現(xiàn)不同的形式,實(shí)現(xiàn)從“有形”設(shè)計(jì)到“無(wú)形”設(shè)計(jì)的改變。(4)對(duì)交互流程的改變。一個(gè)完整的交互設(shè)計(jì)過(guò)程中的步驟主要分為:用戶調(diào)研、概念設(shè)計(jì)、創(chuàng)建用戶模型、創(chuàng)建界面流程、開發(fā)原型以及用戶測(cè)試、實(shí)現(xiàn)、統(tǒng)測(cè)試。人工智能可以分析設(shè)計(jì)過(guò)程及各階段的任務(wù),尋求符合科學(xué)規(guī)律和設(shè)計(jì)效率的最優(yōu)解,通過(guò)深入剖析人的思維模式,能夠以直接、精確的方式獲得符合人類體驗(yàn)愿景的交互設(shè)計(jì)。(5)對(duì)交互形式的顛覆。當(dāng)前人機(jī)交互多屬于近場(chǎng)、接觸式實(shí)體交互,用戶通過(guò)移動(dòng)、點(diǎn)擊、觸控等實(shí)體操作形式進(jìn)行信息的輸入,當(dāng)脫離計(jì)算機(jī)或輸入設(shè)備時(shí)信息輸入則無(wú)法完成。人工智能技術(shù)的發(fā)展拓展了信息輸入的距離和空間,如近場(chǎng)交互中,除了實(shí)體操作,語(yǔ)音、圖像等形式同樣有效;而在中遠(yuǎn)場(chǎng)景的交互中,語(yǔ)音、動(dòng)作成為了信息輸入的第一選擇,并逐漸成為重要的輸入方式之一。
人機(jī)交互趨勢(shì),是從無(wú)序到有序、從數(shù)據(jù)到語(yǔ)義、從線下到線上、從精確到非精確、從機(jī)械到自然。人工智能技術(shù)的應(yīng)用,可以將一些模糊和用戶行為習(xí)慣識(shí)別為具體、準(zhǔn)確的交互意圖,隨著人工智能技術(shù)的進(jìn)步,人類可以用自然的方式和機(jī)器進(jìn)行交互,而不是被迫去適應(yīng)機(jī)器,重新建立一套與機(jī)器對(duì)話的語(yǔ)言。
3 智能人機(jī)交互技術(shù)缺陷及應(yīng)用挑戰(zhàn)
3.1 智能人機(jī)交互技術(shù)形式
智能人機(jī)交互技術(shù)簡(jiǎn)言之是能夠?qū)崿F(xiàn)類人的“能聽會(huì)說(shuō)、自然交互、有問(wèn)必答”能力的綜合技術(shù),涉及自然語(yǔ)言處理、語(yǔ)義分析和理解、知識(shí)構(gòu)建和自學(xué)習(xí)能力、大數(shù)據(jù)處理和挖掘等技術(shù)領(lǐng)域,同時(shí)包括整合多種信息承載形式(如文字、語(yǔ)音、體感等)的通信和識(shí)別等能力。
就表現(xiàn)形式而言,可概括為多通道、多媒體的智能人機(jī)交互,如手勢(shì)識(shí)別、姿勢(shì)識(shí)別、語(yǔ)言識(shí)別、表情識(shí)別、眼部識(shí)別、情感識(shí)別等。是一種依靠人類本能與機(jī)器進(jìn)行“無(wú)感”交互的技術(shù)形式,以人為中心,關(guān)注體驗(yàn)和意識(shí)。
盡管智能人機(jī)交互技術(shù)已逐漸在智能硬件、可穿戴設(shè)備、智能家居、物聯(lián)網(wǎng)等領(lǐng)域展開應(yīng)用,但總體來(lái)說(shuō)仍存在很多的不足。
3.2 當(dāng)前智能人機(jī)交互的技術(shù)現(xiàn)狀
深度神經(jīng)網(wǎng)絡(luò)的應(yīng)用使得語(yǔ)音識(shí)別、人機(jī)對(duì)話、機(jī)器翻譯、手勢(shì)檢測(cè)與跟蹤、等領(lǐng)域技術(shù)得到了快速發(fā)展和應(yīng)用,如情感識(shí)別的結(jié)果僅比專業(yè)人士相差10%,語(yǔ)音識(shí)別的準(zhǔn)確率已接近人類水平,而圖像目標(biāo)識(shí)別已超過(guò)普通人類辨識(shí)水平。但要像人一樣“能聽會(huì)說(shuō),善解人意”,仍有大量技術(shù)難題待攻破。如在完全自然的口語(yǔ)識(shí)別及方言識(shí)別方面,語(yǔ)音識(shí)別準(zhǔn)確率還很不理想;智能硬件產(chǎn)品存在“沒(méi)聽清、聽不懂、不聰明”問(wèn)題;智能家居不“智能”,用戶激活率不足20%;而被認(rèn)為最直觀、自然的多通道人機(jī)交互,由于其信息表達(dá)的豐富性和模糊性,很難準(zhǔn)確映射為人機(jī)交互的界面操作,導(dǎo)致能以準(zhǔn)確理解用戶的意圖。究其原因,機(jī)器學(xué)習(xí)、深度學(xué)習(xí)、自然語(yǔ)言理解、語(yǔ)義理解、人機(jī)對(duì)話、需求預(yù)測(cè)、數(shù)據(jù)挖掘等技術(shù)尚處于早期,在足夠智能之前,智能水平與用戶體驗(yàn)、可靠性存在矛盾。
3.3 應(yīng)用挑戰(zhàn)
(1)使用范圍有限。盡管有新興交互方式的嘗試,但大多數(shù)交互方式的使用率不高,未形成普及化的商業(yè)應(yīng)用,更沒(méi)有達(dá)到無(wú)障礙、隨心所欲溝通的水平。如體感交互目前只應(yīng)用于游戲領(lǐng)域,動(dòng)作捕捉交互方式更多應(yīng)用于電影制作領(lǐng)域。(2)仍未擺脫界面交互,體驗(yàn)性差。雖然觸摸交互漸成主流,但仍需用戶精確輸入,對(duì)用戶而言費(fèi)神費(fèi)力。如特斯拉配備的中控大屏在操作時(shí)易造成開車過(guò)程中的分心。同時(shí)多數(shù)智能人機(jī)交互產(chǎn)品的用戶界面仍未脫離GUI的思維束縛,而超越傳統(tǒng)GUI、能與用戶及環(huán)境進(jìn)行主動(dòng)感知和交互的界面設(shè)計(jì)仍未出現(xiàn)。(3)改變用戶習(xí)慣較困難。應(yīng)用新技術(shù)開發(fā)新的交互平臺(tái)具備其合理性,但忽視與已建立操作習(xí)慣的一致性,或增加用戶的學(xué)習(xí)成本,會(huì)給用戶帶來(lái)極大的困擾。如代碼界面到圖像界面,單點(diǎn)觸控到多點(diǎn)觸控等的習(xí)慣跨越歷程。
4 未來(lái)人機(jī)交互的發(fā)展趨勢(shì)及應(yīng)用熱點(diǎn)
當(dāng)前移動(dòng)互聯(lián)網(wǎng)、虛擬現(xiàn)實(shí)、普適計(jì)算等飛速發(fā)展,對(duì)人機(jī)交互技術(shù)提出了新的調(diào)整和更高的要求,人機(jī)交互研究?jī)?nèi)容也從精確到非精確、從功能到場(chǎng)景、從交互轉(zhuǎn)向?qū)嵺`。未來(lái)的人機(jī)交互,將會(huì)演變成“交互人”和“智能機(jī)”在物理空間、數(shù)字空間及社會(huì)空間等不同空間上的交互[5]。人作為人機(jī)交互的核心,將隨著技術(shù)的發(fā)展與交互設(shè)備融為一體。計(jì)算機(jī)的主要交互行為將變成感知行為,感知場(chǎng)景、人的行為及相關(guān)屬性,形成物理世界的“直覺(jué)”,從而實(shí)現(xiàn)為人類服務(wù)。
未來(lái),人與機(jī)器的交互,將從外在互動(dòng)轉(zhuǎn)向情感交流,所有操作性設(shè)備融入智能空間內(nèi),傳感與交互無(wú)處不在,而融合人工智能、大數(shù)據(jù)的云計(jì)算平臺(tái)使得人機(jī)交互系統(tǒng)越來(lái)越聰明、越來(lái)越人性化,會(huì)是一種沒(méi)有交互的“交互”。
5 結(jié)語(yǔ)
人機(jī)交互技術(shù)是當(dāng)前信息產(chǎn)業(yè)競(jìng)爭(zhēng)的焦點(diǎn),各國(guó)紛紛將其列為重點(diǎn)發(fā)展的信息技術(shù)之一。人工智能時(shí)代,以人為中心、自然、高效等特征將是下一代人機(jī)交互系統(tǒng)的主要目標(biāo)特性。隨著技術(shù)的突破,人機(jī)交互領(lǐng)域必將實(shí)現(xiàn)跨越式發(fā)展,也必將影響整個(gè)人類發(fā)展史。
參考文獻(xiàn)
[1]Hewett T T, Baccker R, Card S, etal. ACM SIGCHI Curricula for Human-Computer Interaction. New York: ACM, 1992.
[2]覃京燕.人工智能對(duì)交互設(shè)計(jì)的影響研究[J].包裝工程,2017,38(20):27-31.
[3]郝凝輝,魯曉波.實(shí)體交互界面設(shè)計(jì)的方法思辨[J].裝飾,2014,(2):34-37.
[4]林應(yīng)明,董士海.多通道融合算法和軟件平臺(tái)的實(shí)現(xiàn)[J].計(jì)算機(jī)學(xué)報(bào),2000,23(1):90-94.
[5]范俊君,田豐,杜一,等.智能時(shí)代人機(jī)交互的一些思考[J].中國(guó)科學(xué),2018,48(4):361-375.