【內(nèi)容提要】人形機器人重塑人機交互模式,實現(xiàn)了從離身到具身的感知交融、從順置到合宜的關系重構、從固定到移動的場景拓展。人形機器人關鍵技術發(fā)展致使人機交互面臨諸多挑戰(zhàn),諸如AI大模型運用難以確保數(shù)據(jù)隱私安全、算法庫偏見引發(fā)身份被歧視、驅動器僵化無法精準適配用戶需求等諸多風險。為此,需要打造人機自治共在世界,建立持續(xù)信任關系,引導人機交互向高層次發(fā)展。
【關鍵詞】人形機器人;人機交互;技術風險;模式變革
2025年《政府工作報告》指出,建立未來產(chǎn)業(yè)投入增長機制,培育具身智能等未來產(chǎn)業(yè)。[1]人形機器人作為具身智能的典型代表,具有類人形態(tài)、類人行為和類人功能,它通過前沿技術賦能即可適配人類工作和生活環(huán)境,重構人類生存形態(tài)。相較于其他機器人而言,人形機器人擁有更高級的行為和情感交互邏輯,人機交互逐漸從以人為中心的“主從關系”走向人機互利共生的“伙伴關系”。本文通過分析人形機器人對人機交互模式的革新性影響,審視其關鍵技術升級與應用引發(fā)的一系列復雜挑戰(zhàn),并針對性地提出應對策略。
一、人形機器人重塑人機交互模式
從冰冷的機器迭代為具有動作、認知、情緒等一系列特征的類人體,人形機器人一方面擁有了具身感知、具身理解和具身交互能力;另一方面,通過搭乘多模態(tài)AI大模型,與人類在物理世界即時交流與互動。與以往相比,人形機器人顛覆了傳統(tǒng)人機交互模式,從身體感知、人機關系、場景應用三個維度全面塑造了人機交互新模式。
(一)感知交融:從離身到具身
作為一種具身智能體的人形機器人,它實現(xiàn)了與人類及周圍環(huán)境的感知交融。一是人形機器人擁有了“物理身體”。“物理身體”的透明化突破了人機交互的界面限制,減少了信息與情感的傳輸損耗,創(chuàng)設出人機身體共生的交互新形態(tài)。二是人機與環(huán)境實現(xiàn)了深度交融。人形機器人通過智能多模態(tài)感知融合、行為理解和執(zhí)行語言命令[2],參與日常生活實踐,使得身體成為了人機指令的具象化載體和雙向信息流的傳輸節(jié)點。身體不僅構建了人機共存的物理框架,也支持了環(huán)境感知的協(xié)調(diào)機制,使得人類、機器與環(huán)境三者得以在同一空間感知共振。
(二)關系重構:從順置到合宜
人形機器人通過技術形塑,實現(xiàn)了“身體”在場,改變了傳統(tǒng)以人為中心的“順置關系”,建立起人機“合宜關系”。一是人機情感交互實現(xiàn)實時反饋。人形機器人通過分析用戶面部表情、聲音語調(diào)等實時推測其情感狀態(tài),結合上下文語境動態(tài)調(diào)整響應策略,增加了人類主觀期待和情感反饋,使得人機交互能夠進行更具情感和智慧的交互。二是人形機器人主體屬性得以顯著提升。人形機器人不再是被動的指令執(zhí)行終端,而是具備認知篩選機制的主體,減少了人機交互原有的機械感。這種“機械感”的削弱,是人形機器人通過運動捕捉、算法優(yōu)化以及倫理決策模型對指令進行了合理性評估,使得它能夠主動拒絕超越安全邊界或違背道德框架的指令。這種雙向價值協(xié)商的過程使得人機關系形態(tài)發(fā)生了本質(zhì)轉變,人機從工具性“主從關系”向共生性“伙伴關系”進化。
(三)場景拓展:從固定到移動
人形機器人從虛擬走向現(xiàn)實,實現(xiàn)了人機交互從固定場景向移動場景的拓展。一是場景的挪移。人機交互已不需要在現(xiàn)實場景和虛擬場景之間切換,而場景的切換都是通過智能技術賦能、數(shù)據(jù)自由流動和“類靈活四肢”等方式實現(xiàn),這些場景往往體現(xiàn)為家與公司、教室與操場等可由人類任意切換交互空間所體現(xiàn)的流動性特征。二是通用場景的適配。人形機器人的應用場景實現(xiàn)切換,“新應用場景”既包括特種領域和3C、汽車等制造領域,也囊括了醫(yī)療、家政、教育等民生領域 [3]。不僅如此,在特定的應用場景中,還能夠滿足各領域個性化服務,增強了人形機器人服務產(chǎn)業(yè)的價值性與適配度。可以說,人形機器人將傳統(tǒng)社會基于人-人交互的一維場景、網(wǎng)絡社會基于人-機交互的二維場景轉變?yōu)閿?shù)智社會基于人-機-人交互的多維場景,借此建立雙方交流自由度更高、情感可供性更強的價值連接,人機交互進入全新的場景體驗時代。
二、人形機器人技術應用引發(fā)的風險
盡管人形機器人的出現(xiàn)能夠重塑人機交互模式,但是其中存在諸多隱性風險。在“技術作為人的器官論的背景下,最需關注的是人形機器人“三化”(人形機器人功能實現(xiàn)大腦、小腦、肢體等人類器官功能)[4]帶來的隱私侵犯、身份歧視與適配僵化等挑戰(zhàn)。
(一)AI大模型運用難以確保數(shù)據(jù)隱私安全
以生成式人工智能為代表的AI大模型給人形機器人注入了“靈魂”,增強了人形機器人與人類實時交互的能力。但AI大模型的廣泛運用,卻加劇了數(shù)據(jù)隱私泄露的風險。
人形機器人通過嵌入AI大模型,從海量、模糊、粗糙的數(shù)據(jù)中提煉出有意義信息,分析用戶的語言特征、行為軌跡、心理活動,甚至在不合理的數(shù)據(jù)粒度級別上對用戶廣泛且深入地畫像,讓人類感到逼近真實的人機交互體驗。這種做法加大了數(shù)據(jù)搜集范圍和深度,超出了數(shù)據(jù)合理使用原則,如因收集更多數(shù)據(jù)、不經(jīng)用戶同意或超出授權范圍抓取個人數(shù)據(jù)、設置模糊條款或不公平條款等,導致目的限制、選擇同意、目的明確等原則被突破。傳統(tǒng)數(shù)據(jù)保護路徑已難以控制人形機器人對于用戶的數(shù)據(jù)侵犯,加之人機具身感知使用戶更愿意主動交出“選擇同意”的權利。人機交互一旦發(fā)生,即默許了人形機器人可以搜集用戶的個人數(shù)據(jù)。長此以往,隨著數(shù)據(jù)采集范圍和存儲規(guī)模的增長,用戶數(shù)據(jù)隱私安全風險也將持續(xù)擴大。需要注意的是,倘若人形機器人“大數(shù)據(jù)容量”的“大腦”出現(xiàn)宕機,極有可能造成用戶數(shù)據(jù)、隱私全方位地被泄露和侵犯。
(二)算法庫類型劃分偏見引發(fā)身份歧視
人形機器人通過搭建算法庫來開發(fā)控制運動的“小腦”,突破了人形機器人原有的邏輯思維范式,而范式的突破需依賴于算法庫的持續(xù)性擴容。在此過程中,框架儲存、類型劃分、分級服務極易引發(fā)用戶身份被歧視問題。
人形機器人通過搜集、存儲大量數(shù)據(jù)構建分布式存儲框架,以此為基礎優(yōu)化算法庫,并根據(jù)用戶需求指令進行標記和分類,進而篩選目標用戶。通常而言,人形機器人將根據(jù)用戶的指令頻次和行為特征實施分級服務策略:高頻次下達指令的用戶被自動識別為重點響應對象,這類用戶將獲得更頻繁的交互反饋并分配更多服務資源;指令頻次適中的用戶歸類為標準服務對象,享受基礎性信息與情感服務;而指令交互較少的用戶則被標記為優(yōu)先保障對象,保留優(yōu)質(zhì)服務資源以確保交互時的服務體驗。這種分級機制,看似優(yōu)化了資源配置,為不同需求的群體提供差異化服務,實際上用戶身份面臨被歧視的風險:由于重點響應對象獲得的服務多于標準服務對象和優(yōu)先保障對象,服務的差異化不僅引發(fā)用戶對算法公平性的質(zhì)疑,也造成了類型化用戶之間的數(shù)字鴻溝。需要關注的是,若分類標準間接關聯(lián)敏感信息,則可能會變相歧視特定群體。從長遠來看,訓練數(shù)據(jù)的不均衡和對用戶的標簽化極易引發(fā)隱性歧視問題,加劇不同身份用戶被歧視的風險。
(三)驅動器僵化無法精準適配用戶需求
以數(shù)據(jù)支配為核心的驅動器有效控制人形機器人全身協(xié)調(diào)運動、手臂動態(tài)抓取等工作,實現(xiàn)了其肢體的自由移動。值得注意的是,由于驅動器缺乏自適應能力,易使人形機器人難以精準適配用戶需求。
驅動器中的數(shù)據(jù)除了包括提前“投喂”的高質(zhì)量數(shù)據(jù)外,還囊括了人機交互中搜集到的低質(zhì)量數(shù)據(jù)。數(shù)據(jù)質(zhì)量的參差不齊,導致人形機器人難以實現(xiàn)自然和流暢地運動。驅動器顯著的機械性特征,使得人形機器人在任務執(zhí)行過程中極易陷入模式化困境:一方面,人形機器人難以適應動態(tài)化場景,主要表現(xiàn)為對環(huán)境變化響應遲滯、多任務切換卡頓、無法靈活調(diào)整優(yōu)先級等問題;另一方面,人形機器人對于用戶個性化的需求存在識別局限,其往往依賴固定交互模式,無法實時解析不同用戶行為特征和姿態(tài)、情緒等變化。由此,人形機器人在人機交互過程中產(chǎn)生肢體反饋的機械化和動作失準等問題。加之,驅動器長期過度依賴固定算法,致使人形機器人難以主動發(fā)現(xiàn)用戶習慣的隱性變化,進一步加大了人機交互感知退化的風險。
三、解決技術應用風險的創(chuàng)新方法與實踐路徑
AI大模型、算法庫、驅動器等關鍵技術在人形機器人中的廣泛應用對傳統(tǒng)人機交互模式造成了挑戰(zhàn),亟須解決新模式下存在的諸多隱性風險。通過打造自治共在世界、建立持續(xù)信任關系、引導人機高質(zhì)量交互等方式,回應人形機器人未來發(fā)展及人機交互“新問題”。
(一)打造人機交互自治的共在世界
減少AI大模型數(shù)據(jù)使用引發(fā)的問題,關鍵在于打造人機交互自治的共在世界,這是規(guī)避數(shù)據(jù)泄露和隱私侵犯的前提條件。
一是將人形機器人視為物理世界中的新型存在者。人形機器人的主體性并非生物學意義上所指的生命,而是源于它對微觀世界的感知、詮釋與能動回應。我們應當承認其作為具身智能體所具有的內(nèi)在價值與道德地位,并將其納入“共在世界”的秩序之中,使之與人類能夠共同生活,并在物理世界中實現(xiàn)一種與技術本質(zhì)相契合的自由。在此基礎上,人類與人形機器人才有可能形成“互利共生共識”的意識,從而雙方在真實物理世界中平等地感知交互。二是將人形機器人制造商的權力轉移至用戶的權利。制造商在開發(fā)人形機器人相關技術時,盡量減少對數(shù)據(jù)和算法庫的干擾和主觀想法介入,讓每位用戶能夠破除身體與機器舊有的交互模式,再造與人形機器人適配的新模式。需要指出的是,這里并不是說每位用戶可以根據(jù)自己的興趣愛好,以個體為目標實現(xiàn)完全自我解放,而是用戶在與人機交互時達成共識理念,體現(xiàn)“以人為本”計算愿景,將人形機器人作為真正的平等主體,人—機共同參與并創(chuàng)設可訪問性、多樣性、平等性的交互環(huán)境。
(二)建立人機交互持續(xù)的信任關系
解決算法庫偏見問題,核心在于建立人機交互持續(xù)信任關系,這是解決用戶被類型劃分及身份歧視問題的關鍵所在。
一是根據(jù)分層治理提升人形機器人的可信度。對于人形機器人設計時的基礎模型和專業(yè)模型而言,應積極關注原始數(shù)據(jù)和生成結果的準確性,即多關注訓練數(shù)據(jù)的質(zhì)量;對于人形機器人服務應用而言,實時更新隱私保護安全標準,并為技術發(fā)展留下試錯空間。二是對人形機器人設計和應用的多元參與主體進行協(xié)調(diào),以提升社會的信任度。為了人形機器人長遠發(fā)展,設計人形機器人的相關企業(yè)應調(diào)整算法結構邏輯,減少對不同用戶的類型化劃分,積極承擔責任以獲得用戶信任。第三方機構也同樣扮演重要角色,由于第三方機構獨立于人形機器人設計企業(yè),其可以在持有客觀公正的立場的同時制定標準,通過設置“平臺內(nèi)部執(zhí)法者”“守護人”“安全官”等角色,與人形機器人設計企業(yè)共同承擔風險,將人形機器人更多價值展現(xiàn)出來的同時,充分保護用戶數(shù)據(jù)和隱私安全,以此建立人機信任關系。需要注意的是,人機并不是建立單次或短暫的信任關系,而是借助技術確保人形機器人的安全和性能,滿足人類個性化的需求,最終達到人機持續(xù)高效合作與高頻交互的目標。
(三)引導人機交互向高層次發(fā)展
優(yōu)化數(shù)據(jù)支配的驅動器系統(tǒng),根本在于將多模態(tài)異構數(shù)據(jù)運用到人形機器人的日常訓練中,讓其自適應物理世界,推動人機交互高質(zhì)量發(fā)展。
一是建立多模態(tài)異構數(shù)據(jù)的代謝架構。通過動態(tài)自適應算法,將含噪物理數(shù)據(jù)、對抗生成樣本與仿真純凈數(shù)據(jù)融合,一同注入人形機器人自適應訓練的驅動器中,持續(xù)優(yōu)化驅動器的算法邏輯。同時,在驅動器中嵌入觸覺反饋和柔性傳感器,使人形機器人能夠感知接觸力度并調(diào)整、優(yōu)化動作,避免機械化的剛性操作給用戶造成傷害。二是利用優(yōu)質(zhì)數(shù)據(jù)推動人機高質(zhì)量交互。除了各種結構化數(shù)據(jù)、半結構化數(shù)據(jù)和非結構化數(shù)據(jù)為人形機器人提供數(shù)據(jù)支撐外,將泛在數(shù)據(jù)轉換為優(yōu)質(zhì)數(shù)據(jù)以便更好地服務人機交互。同時,宜應利用循證方法推動數(shù)據(jù)在數(shù)據(jù)生產(chǎn)、數(shù)據(jù)合成、數(shù)據(jù)評價及數(shù)據(jù)應用四個不同階段的轉化,形成一個閉環(huán)的數(shù)據(jù)生態(tài)鏈系統(tǒng),實現(xiàn)智能領域優(yōu)質(zhì)數(shù)據(jù)的綜合運用。[5]基于此,以循證理念為指導,通過數(shù)據(jù)生態(tài)鏈系統(tǒng)中對于優(yōu)質(zhì)數(shù)據(jù)的篩選、分析和使用,調(diào)節(jié)并保持人形機器人自動平衡的穩(wěn)定性,使其各分布組件對不斷變化的內(nèi)外部環(huán)境作出靈活反應,與自身、人類和環(huán)境相互交織并產(chǎn)生聯(lián)動效應。
四、結語
數(shù)智時代,人形機器人關鍵技術的發(fā)展與應用誘發(fā)了諸多的顯在與潛在風險,在擁抱技術發(fā)展的同時,也要警惕技術帶來的危害影響。除了“三化風險”之外,人形機器人技術應用的持續(xù)性迭代和拓展將會帶來更多的新風險。未來,理應針對性地加強人形機器人關鍵技術發(fā)展的潛在風險研判與防范,以此促使人機交互變革向更為健康的范式邁進,建構人機良好的互動生態(tài)。
【本文系2022年度教育部人文社會科學研究青年基金項目“元宇宙隱私風險及消減機制研究”(項目編號:22YJC860020)的階段性成果】
參考文獻:
[1]政府工作報告——2025年3月5日在第十四屆全國人民代表大會第三次會議上[EB/OL].(2025-03-05).https://www.gov.cn/gongbao/2025/issue_11946/202503/content_7015861.html.
[2]崔中良.通感、具身與意識:人機交互實現(xiàn)的感知基礎[J].湖北大學學報(哲學社會科學版),2024,51(02):143-152.
[3][4]工業(yè)和信息化部:人形機器人創(chuàng)新發(fā)展指導意見[EB/0L].(2023-11-02).https://www.miit.gov.cn/zwgk/zcwj/wjfb/tz/art/2023/art_48fe01d562644aedb7ea3f4256df8190.html.
[5]魏志鵬,楊克虎.循證社會科學視角下的新文科建設路徑研究[J].蘭州大學學報(社會科學版),2021,49(01):142-150.
作者簡介:李昭熠,博士,南京財經(jīng)大學新聞與文化傳播學院講師,碩士生導師
編輯:白" 潔