馬 華
(蘇州工藝美術(shù)職業(yè)技術(shù)學(xué)院 江蘇 蘇州 215000)
智能增強(qiáng)IA是人工智能領(lǐng)域正在被關(guān)注的方向。IA強(qiáng)調(diào)使用智能計(jì)算來(lái)輔助和加強(qiáng)人類的智力工作,而不是強(qiáng)調(diào)模擬人類智力并替代人類工作。IA以人為中心,關(guān)注人類用戶的需求及其任務(wù),旨在與人類用戶協(xié)同完成工作。交互設(shè)計(jì)則成為人與智能算法之間實(shí)現(xiàn)有效協(xié)同的重要因素。這為交互領(lǐng)域的研究提供了新的需求與動(dòng)力。目前,面向智能增強(qiáng)IA系統(tǒng)的交互設(shè)計(jì)研究仍處于起始階段,需要進(jìn)一步對(duì)智能增強(qiáng)的特征進(jìn)行探究,并分析其特有的交互特性、交互設(shè)計(jì)原則、策略與方法,從而為智能增強(qiáng)IA系統(tǒng)的設(shè)計(jì)研究提供有效支撐。
人工智能(artificial intelligence,AI)是正在不斷發(fā)展的機(jī)器智能重要研究領(lǐng)域。人工智能旨在復(fù)制人類的認(rèn)知過(guò)程,去處理多種來(lái)源的數(shù)據(jù)與信息,并模擬人類智能形成決策模型。智能增強(qiáng)(intelligence augmentation,IA),作為人工智能發(fā)展的另一個(gè)方向,也正在被關(guān)注和探索。
自從科學(xué)家Engelbart等[1]提出需要使用現(xiàn)代技術(shù)來(lái)“增強(qiáng)人類的智力”,研究者們分析了擴(kuò)展和增強(qiáng)人類智力能力的概念框架,設(shè)定IA的目標(biāo)為提升人類的工作效率,認(rèn)為IA是介于完全人力和完全自動(dòng)化之間的解決方案。然而針對(duì)智能增強(qiáng)IA的系統(tǒng)化研究工作還很不足。
人工智能AI基于數(shù)據(jù)和分析模型,關(guān)注計(jì)算機(jī)的算法和計(jì)算能力。而智能增強(qiáng)IA更多地關(guān)注如何使AI技術(shù)與人類能夠更好地相互補(bǔ)充、在人類的工作任務(wù)中更好地互助,以及如何更有效地使用信息技術(shù)去強(qiáng)化人類的能力。因此,對(duì)于智能增強(qiáng)而言,人是其核心的關(guān)注點(diǎn),而不是AI技術(shù)本身。例如幫助人們正確進(jìn)行英語(yǔ)書(shū)寫(xiě)的軟件“Grammarly”是IA應(yīng)用的一個(gè)典型案例。“Grammarly”通過(guò)智能算法對(duì)用戶的原始英語(yǔ)文本提出語(yǔ)法、措辭等方面的糾正建議,供用戶參考。用戶則基于建議,根據(jù)其自身的判斷,選擇接受或忽略建議,并對(duì)文本進(jìn)行修改編輯。隨后,算法基于用戶的選擇和編輯又提出新的建議。整個(gè)過(guò)程中,用戶與智能算法,通過(guò)持續(xù)的交互,共同完成英語(yǔ)書(shū)寫(xiě)的糾正和優(yōu)化任務(wù)。
因此,人機(jī)交互領(lǐng)域?qū)<彝觞h校等[2]提出:“智能增強(qiáng)是以增強(qiáng)人機(jī)交互為目的;智能增強(qiáng)為交互研究提供了新的需求和動(dòng)力,因此實(shí)現(xiàn)人機(jī)和諧成為一個(gè)新的研究課題;在基礎(chǔ)研究和應(yīng)用層面,面向智能增強(qiáng)的研究均具有其重要的研究?jī)r(jià)值”。另外,許為等[3]也提出智能增強(qiáng)IA是以人為中心的AI研究的新領(lǐng)域之一。
智能增強(qiáng)是通過(guò)強(qiáng)化人類工作能力,簡(jiǎn)化工作流程,優(yōu)化工作和生活環(huán)境等方法來(lái)實(shí)現(xiàn)的。其現(xiàn)有的應(yīng)用領(lǐng)域包含了自動(dòng)駕駛、工業(yè)互聯(lián)網(wǎng)、機(jī)器人、遙感控制、醫(yī)療健康等很多相關(guān)方面。通過(guò)分析這些應(yīng)用,可以發(fā)現(xiàn)智能增強(qiáng)具有人機(jī)互補(bǔ)性、人類自主性、任務(wù)情境化等方面特征。
(1)人機(jī)互補(bǔ)性:在基于智能增強(qiáng)的人類任務(wù)的完成過(guò)程中,機(jī)器智能與人類智能形成了有效的互補(bǔ)與互助。AI機(jī)器智能承擔(dān)了計(jì)算的角色,即通過(guò)計(jì)算進(jìn)行預(yù)測(cè)或進(jìn)行公式化的決策;人類則基于機(jī)器智能的計(jì)算力和計(jì)算結(jié)果,結(jié)合人的知識(shí)、經(jīng)驗(yàn)和智慧進(jìn)行行為的判斷。在這個(gè)過(guò)程中,機(jī)器智能的計(jì)算速度、計(jì)算準(zhǔn)確度和處理大規(guī)模數(shù)據(jù)的能力是人類無(wú)法獲得和施展的。同時(shí)人類所具有的領(lǐng)域知識(shí)、生活經(jīng)驗(yàn),以及進(jìn)行復(fù)雜判斷的能力,則是機(jī)器智能所不足的。因此,智能增強(qiáng)具有明顯的人—機(jī)的互補(bǔ)性。
(2)人類自主性:人工智能旨在沒(méi)有人類幫助的情況下工作,并且以在人類的任務(wù)中替代人類為目標(biāo)。而智能增強(qiáng)IA具有人類的自主性,IA中的智能算法不必參與決策過(guò)程。相反,IA將分析數(shù)據(jù)等結(jié)果報(bào)告給用戶,由人類自主接管,自主決策。基于機(jī)器智能的運(yùn)算,人類是系統(tǒng)運(yùn)行過(guò)程中的最終決策者。例如Apple的Siri、語(yǔ)言糾正工具Grammarly等虛擬助手,它們不會(huì)替用戶做決定,只是在用戶需要時(shí)提供合適的數(shù)據(jù)或信息,從而來(lái)輔助人們的判斷、選擇和決定。
(3)任務(wù)情境化:根據(jù)幫助人們完成的目標(biāo)不同,智能增強(qiáng)IA所面向的關(guān)聯(lián)性任務(wù)不同。這些任務(wù)的內(nèi)容包括:動(dòng)態(tài)地生成、反饋與情境相關(guān)的智能信息,提供解決方案與決策建議,以及支持人與機(jī)器智能的交互協(xié)作。其中IA面向的任務(wù)所屬的情境不同,機(jī)器智能在IA中承擔(dān)的角色就不同。例如Zhou等[4]提出IA的任務(wù)可以分為工具、助手、協(xié)作、訓(xùn)練和協(xié)調(diào)五個(gè)情境,因此機(jī)器智能在這些不同的IA情境中的角色及其與人類用戶的交互模式也有著相應(yīng)不同。
近年來(lái),機(jī)器學(xué)習(xí)領(lǐng)域提出需要更多地采用融合“以人為中心”的方法。研究者們開(kāi)始通過(guò)人與AI的交互來(lái)解決問(wèn)題,例如以人為中心AI和人在環(huán)路混合智能[5]等。同時(shí)交互領(lǐng)域的學(xué)者們也開(kāi)始研究如何通過(guò)交互來(lái)為人們使用智能工具提供支持,例如在人們與機(jī)器智能的協(xié)作過(guò)程中,設(shè)計(jì)人們與多種備選操作方案的交互、通過(guò)交互保證和實(shí)現(xiàn)人們?cè)谶^(guò)程中的主導(dǎo)性和控制權(quán)等。因此,面向智能增強(qiáng)IA的交互設(shè)計(jì)研究將進(jìn)一步推進(jìn)IA的發(fā)展。在面向IA的交互設(shè)計(jì)研究中,最核心最需要關(guān)注的問(wèn)題是:如何將智能推理的AI算法功能與以人為中心的交互系統(tǒng)進(jìn)行有效整合[6],本文主要圍繞這個(gè)問(wèn)題進(jìn)行闡述。
在智能增強(qiáng)IA中,AI與人類用戶組成了相互合作的“人—AI小組”,即機(jī)器的自動(dòng)化功能與人類用戶的自治的相互配合與協(xié)作。Sawyer等[7]提出,在AI智能與人類用戶的小組合作中,存在著一種交互“輪唱”。基于交互“輪唱”,結(jié)合其中人類用戶的感知—行動(dòng)過(guò)程,提出了“互補(bǔ)性”循環(huán)交互框架,見(jiàn)圖1。首先當(dāng)系統(tǒng)運(yùn)行了相應(yīng)的智能算法(系統(tǒng)行動(dòng)),便開(kāi)始等待人類操作者的下一步操作(用戶等待)。與此同時(shí),人類用戶開(kāi)始了從“感知”到“行動(dòng)”的過(guò)程,即“感知”智能系統(tǒng)在運(yùn)行后分析并呈現(xiàn)給人類用戶的相關(guān)信息(用戶感知),然后在此基礎(chǔ)上人類用戶決定將如何“行動(dòng)”(用戶行動(dòng))。之后在系統(tǒng)等待用戶的行動(dòng)后(系統(tǒng)等待),開(kāi)始新一輪的(系統(tǒng)行動(dòng))。于是形成了機(jī)器智能與人類用戶的交互循環(huán)。

圖1 “互補(bǔ)性”循環(huán)交互框架(基于Sawyer交互“輪唱”)
在這樣的交互循環(huán)中,機(jī)器智能與人類用戶的雙方角色在三個(gè)方面展現(xiàn)能力互補(bǔ)[8],如圖1。首先在“不確定性”方面,機(jī)器智能根據(jù)預(yù)測(cè)分析提供實(shí)時(shí)的提醒信息,人類用戶面臨不確定時(shí),能夠依靠自身直覺(jué)快速?zèng)Q策。其次面對(duì)“復(fù)雜性”時(shí),機(jī)器智能能夠收集、處理和分析數(shù)據(jù),而人類用戶能夠決定到哪里搜尋和收集數(shù)據(jù),并基于數(shù)據(jù)支持做出決定。最后對(duì)于“多義性”沖突,當(dāng)機(jī)器智能在分析后展示出多種不同的解讀時(shí),人類用戶能夠協(xié)調(diào)這樣的“多義”以形成統(tǒng)一,并通過(guò)與系統(tǒng)的交互,重新獲得智能支持。
因此,在面向IA的交互設(shè)計(jì)中,設(shè)計(jì)者可以基于互補(bǔ)性的循環(huán)交互框架,設(shè)計(jì)AI系統(tǒng)運(yùn)行過(guò)程中人類用戶參與“感知”的時(shí)刻、做出“決策”的時(shí)刻以及直接在系統(tǒng)中“操作”的時(shí)刻;設(shè)計(jì)機(jī)器智能開(kāi)始計(jì)算分析的時(shí)刻和提供給人類操作者各種信息線索的時(shí)刻等。另外,在交互設(shè)計(jì)中,雙方的互補(bǔ)能力為整合人類和機(jī)器智能,并尋找到雙方各自合適的功能角色提供引導(dǎo)。
為了引導(dǎo)智能系統(tǒng)的交互設(shè)計(jì)實(shí)踐,來(lái)自美國(guó)微軟及華盛頓大學(xué)的Amershi等[9]于2019年提出了人與AI交互的18條交互設(shè)計(jì)原則,見(jiàn)表1。此原則從交互行為的起始、行為中、行為后,以及交互出錯(cuò)時(shí)這四個(gè)時(shí)段歸納了與之相對(duì)應(yīng)的設(shè)計(jì)指導(dǎo)。

表1 人與AI的交互設(shè)計(jì)原則(Amershi等[9])
(1)在人與AI交互的起始階段,幫助用戶理解AI的功能和表現(xiàn)是交互設(shè)計(jì)需要關(guān)注的(G1和G2)。
(2)在交互行為過(guò)程中,隨著交互的進(jìn)程,實(shí)時(shí)、按需提供與用戶情境相關(guān)的信息服務(wù)(G3和G4);信息的傳遞和表達(dá)需要與用戶的習(xí)慣理解和當(dāng)下的社會(huì)文化標(biāo)準(zhǔn)相一致,以及防止產(chǎn)生各種偏見(jiàn)的可能(G5和G6)。
(3)當(dāng)交互過(guò)程中出現(xiàn)錯(cuò)誤時(shí),支持用戶依照自己的需要和理解,選擇、忽略或者糾正AI的信息服務(wù)和執(zhí)行結(jié)果(G7、G8和G9);主動(dòng)向用戶提供可供選擇的不同的可能結(jié)果(G10)并告知用戶AI行為的原因(G11)。
(4)在交互行為過(guò)后,記錄最近的用戶交互行為,并學(xué)習(xí)總結(jié)用戶的個(gè)性化特點(diǎn),賦予個(gè)性化的全局控制(G12、G13和G17);支持用戶對(duì)交互體驗(yàn)的直接反饋以及系統(tǒng)對(duì)用戶行為結(jié)果的實(shí)時(shí)反饋(G15和G16),同時(shí)將AI的系統(tǒng)變化與更新實(shí)時(shí)告知用戶(G14和G18)。
當(dāng)面向智能增強(qiáng)IA,以上交互設(shè)計(jì)原則依然能夠很好地引導(dǎo)交互設(shè)計(jì)實(shí)踐。然而,對(duì)于智能增強(qiáng)IA,交互設(shè)計(jì)需要更為著重地有效支撐智能增強(qiáng)“人—AI小組”的實(shí)現(xiàn)和運(yùn)行,即有效支持和實(shí)現(xiàn)人與機(jī)器智能的協(xié)同與協(xié)作。因此,基于1.2節(jié)描述的智能增強(qiáng)的人機(jī)互補(bǔ)性、人類自主性、任務(wù)情境化特征,以及2.1節(jié)描述的“互補(bǔ)性”循環(huán)交互框架,
本文基于以上交互設(shè)計(jì)原則,進(jìn)行了有針對(duì)性的分類重整,使其能夠更好地指導(dǎo)面向智能增強(qiáng)IA的交互設(shè)計(jì),見(jiàn)圖2。

圖2 面向智能增強(qiáng)IA的交互設(shè)計(jì)原則(G1-G18基于Amershi等[9])
基于人與機(jī)器智能的交互循環(huán)框架來(lái)分類交互設(shè)計(jì)原則,而不是以單個(gè)交互行為的前、中、后等的不同時(shí)段去分類。由于系統(tǒng)目標(biāo)的差異,交互設(shè)計(jì)原則在智能增強(qiáng)IA的交互設(shè)計(jì)中對(duì)應(yīng)著四個(gè)不同的階段,具有不同的內(nèi)涵。
如圖2,在系統(tǒng)運(yùn)行智能算法階段(系統(tǒng)行動(dòng)),交互設(shè)計(jì)首先需要關(guān)注如何幫助用戶理解智能算法的功能和表現(xiàn)(G1和G2);并在此基礎(chǔ)上向用戶提供不同的可供選擇的結(jié)果、信息和方案(G10),告知用戶產(chǎn)生這些方案的原因(G11);而當(dāng)智能算法發(fā)生變化或產(chǎn)生更新的結(jié)果時(shí),須實(shí)時(shí)告知用戶(G14和G18)。
當(dāng)進(jìn)入用戶等待和用戶感知階段,結(jié)合“人—AI小組”需要共同完成的任務(wù)及任務(wù)流,按需實(shí)時(shí)提供與完成具體任務(wù)相關(guān)的信息服務(wù)(G3和G4);同時(shí)信息的傳遞和表達(dá)需要滿足完成任務(wù)的需要,并需要與用戶的習(xí)慣理解和當(dāng)下的社會(huì)文化標(biāo)準(zhǔn)相一致,以及防止產(chǎn)生各種偏見(jiàn)的可能(G5和G6)。
在用戶開(kāi)始操作的階段(用戶行動(dòng)),交互設(shè)計(jì)支持用戶依照任務(wù)流程和自己完成任務(wù)時(shí)的需要和認(rèn)知,自行選擇或者忽略智能算法提供的信息服務(wù);并提供用戶在其自主分析的基礎(chǔ)上,對(duì)AI執(zhí)行結(jié)果進(jìn)行糾正的通道(G7、G8和G9);支持用戶在操作過(guò)程中直接反饋?zhàn)陨淼慕换ンw驗(yàn),并提供用戶個(gè)性化的全局、全過(guò)程的自主控制(G15和G17)。
在用戶操作過(guò)后,下一次智能算法開(kāi)始執(zhí)行前(系統(tǒng)等待),系統(tǒng)需要反饋用戶操作產(chǎn)生的結(jié)果和影響(G16);記錄并分析用戶已有的交互行為,并學(xué)習(xí)總結(jié)個(gè)性化的用戶特征,從而支持智能算法對(duì)個(gè)性化情境和不同用戶的算法包容(G12和G13)。
以上面向智能增強(qiáng)IA的交互設(shè)計(jì)原則,對(duì)IA系統(tǒng)的交互設(shè)計(jì)具有參考意義。特別是,在將智能推理的AI算法功能與以人為中心的交互系統(tǒng)進(jìn)行整合過(guò)程中,原則上能夠指導(dǎo)設(shè)計(jì)合適的交互流程與信息架構(gòu),從而適時(shí)、有效地確定智能算法提供信息服務(wù)的時(shí)間點(diǎn)和表現(xiàn)形式,以及人類用戶參與操作和決策的時(shí)間點(diǎn)和交互方法等。
由于智能增強(qiáng)IA具有人機(jī)互補(bǔ)性、人類自主性和任務(wù)情境化等方面的特征,需要進(jìn)一步探索有效的交互設(shè)計(jì)方法與策略,以滿足人類用戶與智能算法之間合作互動(dòng)的交互系統(tǒng)的創(chuàng)建。
(1)任務(wù)的共享呈現(xiàn):Heer[6]1845在分析現(xiàn)有智能增強(qiáng)系統(tǒng)的基礎(chǔ)上,提出了基于對(duì)人的行為預(yù)測(cè)的“任務(wù)共享呈現(xiàn)”。作為面向IA的設(shè)計(jì)方法和策略,“任務(wù)共享呈現(xiàn)”使得人與智能算法能夠相互學(xué)習(xí),并合作面對(duì)共同的系統(tǒng)目標(biāo)與任務(wù)。
具體來(lái)說(shuō),“任務(wù)的共享表現(xiàn)”是基于對(duì)人類用戶所需完成任務(wù)的計(jì)算推理,對(duì)用戶可能的行為進(jìn)行設(shè)計(jì)表現(xiàn),并提供交互界面使得用戶能夠查閱、選擇、修正或者否定駁回推理算法提供的建議結(jié)果。在這個(gè)過(guò)程中,用戶行為的呈現(xiàn)、提供人與算法有效合作的交互界面,以及對(duì)應(yīng)的交互模型是此設(shè)計(jì)策略的三個(gè)重要元素。另外,在IA系統(tǒng)中,由于人類用戶的交互操作對(duì)智能算法本身具有不斷優(yōu)化和精進(jìn)的作用,因此伴隨IA交互循環(huán)的交互界面的更新將有助于提升IA系統(tǒng)的可用性和有效性。
(2)可調(diào)節(jié)與自適應(yīng):IA需要在交互策略中提供人類用戶“調(diào)節(jié)系統(tǒng)自動(dòng)化水平”的可能,使得IA具有可調(diào)節(jié)性。所謂“調(diào)節(jié)系統(tǒng)自動(dòng)化水平”,就是在用戶和智能算法的協(xié)作中,用戶在交互過(guò)程中有自由、有可能調(diào)節(jié)人機(jī)協(xié)作中自動(dòng)算法參與程度的多少,以及用戶主動(dòng)控制程度的多少。
同時(shí)IA通過(guò)觀察用戶的交互反饋情況,來(lái)理解用戶的不同情況下的需求和狀態(tài),從而能夠主動(dòng)、動(dòng)態(tài)地分配系統(tǒng)的自動(dòng)化算法功能的部分和用戶自主控制的部分,使得IA實(shí)現(xiàn)其自適應(yīng)性,能夠適應(yīng)不規(guī)律和無(wú)法事先預(yù)測(cè)的用戶行為。
(3)強(qiáng)化認(rèn)知同步:IA的設(shè)計(jì)除了需要規(guī)劃合理的交互時(shí)間點(diǎn),還需要對(duì)人類用戶的認(rèn)知過(guò)程予以支持,從而強(qiáng)化IA與人的認(rèn)知過(guò)程的同步。人類并不具有如機(jī)器那般的快速反應(yīng)能力,也不具備如機(jī)器算法的強(qiáng)大的算力。因此,IA需要基于用戶的認(rèn)知模型,特別是與認(rèn)知的時(shí)間相關(guān)的因素與模型,來(lái)增強(qiáng)IA中智能信息服務(wù)的用戶有效性,既不分散用戶的注意力、打擾用戶,也不因?yàn)檫^(guò)長(zhǎng)的延遲時(shí)間而失去智能服務(wù)的價(jià)值。
IA一方面通過(guò)觀察用戶與系統(tǒng)交互的時(shí)間,或者通過(guò)用戶的自定義,來(lái)確定與用戶認(rèn)知過(guò)程相關(guān)的時(shí)間模型;另一方面,通過(guò)快速綜合多種信息,考慮計(jì)算算法所傳達(dá)信息的復(fù)雜度和長(zhǎng)度等,并為用戶過(guò)濾不重要的信息,或者突出重要的信息,從而降低用戶在做決策時(shí)會(huì)面臨的時(shí)間壓力。這些具體的策略和方法能夠使IA匹配用戶與智能算法之間溝通的時(shí)間節(jié)奏,使溝通更為高效。
綜上所述,智能增強(qiáng)IA作為人工智能領(lǐng)域被關(guān)注的發(fā)展方向,需要更多地引入“以人為中心”的方法。雖然人們提出了“人為中心AI”和“人在環(huán)路混合智能”,但是IA因?yàn)橥癸@了人機(jī)互補(bǔ)性、人類自主性和任務(wù)情境化等與人和情境密切相關(guān)的特征,亟待交互設(shè)計(jì)領(lǐng)域更有針對(duì)性和更為深入的研究,從而推進(jìn)其系統(tǒng)性的發(fā)展。面向智能增強(qiáng)的交互設(shè)計(jì),如何將智能推理的AI算法功能與以人為中心的交互系統(tǒng)進(jìn)行有效整合。未來(lái),更多的相關(guān)研究問(wèn)題需要被關(guān)注,人與智能算法的協(xié)同需要更緊密、更有效、更和諧。