





摘要:我國老齡化趨勢日益明顯,老年人的情感需求迅速上升。與此同時,人工智能技術(shù)的迅猛發(fā)展為社會帶來了深遠(yuǎn)的變革,為解決老年人的情感需求問題提供了新的可能。基于此,文章首先設(shè)計了一種新型的助老陪伴機(jī)器人情感慰藉系統(tǒng)框架。然后,從機(jī)器人與計算機(jī)連接、智能語音交互、人物聲音模型訓(xùn)練以及機(jī)器人動作設(shè)計四個方面,詳述各模塊原理;從技術(shù)實現(xiàn)的角度來看,該系統(tǒng)依托于Yanshee機(jī)器人、Gpt-sovists和LIAMA模型。通過在敬老院等場所的實際測試,其有效性得到了驗證:超過 75% 的老年人報告獲得情緒改善,約 80% 的老年人對系統(tǒng)功能表示滿意。
關(guān)鍵詞:輔助陪伴機(jī)器人;情感慰藉;人工智能
中圖分類號:TP18" "文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2025)16-0035-04
開放科學(xué)(資源服務(wù)) 標(biāo)識碼(OSID)
0 引言
在過去的幾十年里,人工智能技術(shù)的迅猛發(fā)展為社會帶來了深遠(yuǎn)的變革,也正在深刻地影響著人們的生產(chǎn)和生活。人工智能不僅在數(shù)據(jù)處理、決策制定和自動化方面表現(xiàn)出色,而且在模擬人類思維和行為方面也取得了突破性進(jìn)展。機(jī)器人作為人工智能的最佳載體,其技術(shù)也隨著人工智能的發(fā)展不斷取得突破。在人-機(jī)器人交互領(lǐng)域中,機(jī)器人可以通過模擬人類的交流方式,使用語音識別技術(shù)融入人類的語音交流中,使得人與機(jī)器之間的互動變得簡單而自然[1]。智能陪伴機(jī)器人作為一種新型的社交工具,已經(jīng)在多個領(lǐng)域中展現(xiàn)出其巨大的應(yīng)用潛力:在老年人護(hù)理領(lǐng)域中,它能實時關(guān)注老年人的生活狀況,提供健康提醒與生活協(xié)助;在兒童教育領(lǐng)域中,它能通過趣味互動的方式激發(fā)孩子的學(xué)習(xí)興趣,助力知識的啟蒙與積累;而在心理輔導(dǎo)領(lǐng)域中,智能陪伴機(jī)器人憑借對情緒的敏銳感知,能夠為用戶提供及時的心理支持與疏導(dǎo)。
在我國,老齡化程度正在不斷加深,而老年人的情感需求也在急劇上升[2]。孤獨、缺乏陪伴和缺乏情感支持是許多老年人面臨的普遍問題,這些問題不僅影響著他們的心理健康,還可能導(dǎo)致一系列生理健康問題。因此,如何為老年人提供情感慰藉、改善他們的生活質(zhì)量,已經(jīng)成為社會和科技發(fā)展的重要研究課題。可以預(yù)見的是,依托人工智能技術(shù),以智能陪伴機(jī)器人的形態(tài),針對老年人的情感需求構(gòu)建合適的、具身的情感慰藉系統(tǒng),在助于老年人緩解孤獨、減少焦慮,并提供一種新的陪伴方式。智能陪伴機(jī)器人能夠通過語音對話、表情識別等方式與老年人進(jìn)行互動,滿足其情感交流的需求;同時,這些機(jī)器人不僅能夠提供日常生活中的實用幫助,還能在情感層面給予老年人關(guān)懷和陪伴,有助于緩解老年人的心理壓力,促進(jìn)其愉悅的心情。因此,本文針對上述設(shè)想,探討了一種助老陪伴機(jī)器人的情感慰藉系統(tǒng)的設(shè)計與應(yīng)用過程。
1 研究現(xiàn)狀
縱觀國內(nèi)外,已有許多學(xué)者開展了助老陪伴機(jī)器人的探索,該方向的研究圍繞如何讓機(jī)器人更好地為老年人提供合適的陪伴服務(wù)。德國弗勞恩霍夫研究所(Fraunhofer Institute) [3]發(fā)明的 Care-o-bot 機(jī)器人,能夠在日常生活中為老年人提供幫助(例如:給植物澆水、開關(guān)電視機(jī),在緊急情況下還能呼叫救援服務(wù)等) ,使得老年人的生活更加便捷與安全。Vercelli等[4]提出,針對出生率低以及老齡化逐漸加劇的情況,可以讓老年服務(wù)機(jī)器人作為新的老年陪護(hù)解決方案,設(shè)計了相關(guān)功能,包括協(xié)助老年人生活起居、協(xié)助護(hù)工人員處理日常事務(wù)、檢測老年人的行為以及身體健康狀況等,并對醫(yī)療保健系統(tǒng)引入機(jī)器人技術(shù)的可行性進(jìn)行了分析。
另外,Yang等[5]提出了一種將穩(wěn)態(tài)驅(qū)動理論和來自環(huán)境的人類刺激應(yīng)用于機(jī)器人的混合系統(tǒng),以解決老年人護(hù)理日益增長的需求。該系統(tǒng)的實驗表明,機(jī)器人可以通過人類的反饋進(jìn)行強(qiáng)化學(xué)習(xí),最終人類對服務(wù)的滿意度達(dá)94%,并且能夠進(jìn)一步服務(wù)和滿足老年人的要求。而Oh等[6]則研究了各種類型的陪伴機(jī)器人,根據(jù)文獻(xiàn)綜述和商業(yè)型機(jī)器人開發(fā)了5款機(jī)器人的設(shè)計概念,并進(jìn)行了相關(guān)實驗。Lee[7]等人則對機(jī)器人與老年人的交互方式進(jìn)行了相關(guān)開發(fā);他們將老年用戶的主要需求進(jìn)行分組,設(shè)計了機(jī)器人的功能元等構(gòu)件,并對多名老年人進(jìn)行了可用性測試,獲得用戶的積極反應(yīng)和良好的接受度。
沈陽航空航天大學(xué)的石承睿等[8]設(shè)計了一款基于語音定位導(dǎo)航系統(tǒng)的老年人陪伴機(jī)器人。該機(jī)器人以樹莓派為控制核心,搭配語音模塊等各種功能模塊,能夠讓老年人通過語音控制機(jī)器人,使機(jī)器人根據(jù)聲音快速定位并移動至相應(yīng)位置。這一設(shè)計理念是陪伴機(jī)器人的一項重大突破,能夠有效解決老年人行動不便、普通語音操作難度大等問題,滿足市場需求。而江蘇師范大學(xué)的李函青等[9]提出了一種基于FAST法和QFD的養(yǎng)老陪伴機(jī)器人設(shè)計方法。該設(shè)計方法將FAST與QFD兩種理論相結(jié)合,通過特征轉(zhuǎn)換設(shè)計老年陪伴機(jī)器人的功能,進(jìn)而產(chǎn)出陪伴機(jī)器人的最佳設(shè)計方案。通過對該方法的運用,能夠有效提高機(jī)器人為老年人提供的陪伴服務(wù)質(zhì)量。
此外,河北工業(yè)大學(xué)的李潔等[10]針對情感慰藉對機(jī)器人的萌形態(tài)進(jìn)行了研究,通過提取被試的fEMG、EDA、HRV等信息,對機(jī)器人的萌形態(tài)進(jìn)行了相關(guān)實驗,并構(gòu)建了機(jī)器人萌體驗與用戶生理指標(biāo)的關(guān)系模型。北京化工大學(xué)的李紫妍[11]通過對寵物的觀察、Kano分析等,設(shè)計了一款基于情感共生理念的寵物犬樣式的陪伴型機(jī)器人,探索實現(xiàn)了陪伴機(jī)器人的合適形態(tài)與陪伴方式。而沈陽工業(yè)大學(xué)的王征等[12]則針對老年病人吃藥的問題設(shè)計了六足移動機(jī)器人,有效解決了行動不便的老年病人的安全問題。華南理工大學(xué)的陳章韶[13]設(shè)計了面向助老服務(wù)的智能家居系統(tǒng),基于云—邊—端架構(gòu)的框架,能夠讓用戶遠(yuǎn)程與智能家居系統(tǒng)進(jìn)行交互,為老年人營造一個便捷、安全、個性化的居家環(huán)境。
盡管目前國內(nèi)外在助老陪伴機(jī)器人方面的研究已取得了一定的進(jìn)展,但基于智能陪伴機(jī)器人的高效、成熟和功能完善的老年人情感慰藉系統(tǒng)仍存在不足,有待進(jìn)一步研究和探索。
2 系統(tǒng)設(shè)計
本文介紹了一種助老陪伴機(jī)器人的情感慰藉系統(tǒng)的可行方案(其示意圖見圖1) 。該系統(tǒng)針對老年人這一特殊群體的需求,設(shè)計了人性化的功能,旨在為老年人提供多種個性化服務(wù)。所依托的智能機(jī)器人形態(tài)為雙足類人機(jī)器人,以樹莓派主板為核心,全身上下由多組舵機(jī)構(gòu)成;其提供的具體個性化服務(wù)主要涉及:1) 雜技舞蹈表演:通過獨特的展示形式,為老年人帶來別樣的趣味體驗;2) 音樂戲曲展示:用豐富多樣的音樂戲曲內(nèi)容,豐富老年人的精神生活;3) 深度式情感陪伴:給予老年人貼心且深入的情感關(guān)懷。
與小米音箱等同類產(chǎn)品相比,本文提出的情感慰藉系統(tǒng)具備以下顯著優(yōu)勢:1) 借助聲音模型庫中的聲音,機(jī)器人能夠模擬人聲,以此為老年人提供情緒價值,并讓老年人通過感知親人的聲音獲得更有效的情感慰藉;2) 本系統(tǒng)采用雙足類人機(jī)器人,可通過相應(yīng)的程序代碼對機(jī)器人舵機(jī)進(jìn)行精密控制,進(jìn)而為老年人呈現(xiàn)精彩的藝術(shù)表演,在視覺上給老年人帶來愉悅享受;3) 上述機(jī)器人能夠與LIAMA模型實現(xiàn)對接,憑借該模型強(qiáng)大的語言處理能力,完成與老年人之間的深度聊天,為老年人提供更專業(yè)化、更貼合需求的情感陪伴,進(jìn)而切實滿足老年人在情感交流方面的期望。
2.1 Yanshee 機(jī)器人
Yanshee 機(jī)器人(見圖2) 是優(yōu)必選科技公司研發(fā)的一款具備豐富功能與廣泛應(yīng)用場景的雙足類人機(jī)器人。該機(jī)器人內(nèi)置高性能處理器,能夠靈活處理各項復(fù)雜指令,確保機(jī)器人的相關(guān)任務(wù)完成度;同時,它配備觸覺、聽覺、視覺等多種傳感器,并且具有靈活的關(guān)節(jié)與驅(qū)動系統(tǒng),全身上下由多個舵機(jī)構(gòu)成,能夠完成雜技、舞蹈等高難度動作的表演。正因 Yanshee 機(jī)器人各項優(yōu)異的配置,使其在教育、家庭陪伴、娛樂活動、智慧醫(yī)療等領(lǐng)域得到了廣泛的認(rèn)可與應(yīng)用。
2.2 系統(tǒng)框架
系統(tǒng)框架如圖3所示,Yanshee 機(jī)器人在整個系統(tǒng)中扮演著至關(guān)重要的角色(人—機(jī)器人交互接口) ;它主要是通過各類先進(jìn)的傳感器以及機(jī)器人內(nèi)部強(qiáng)大的處理器來實現(xiàn)其功能。下面分別從機(jī)器人、人機(jī)交互接口與本地計算機(jī)三方面進(jìn)行論述。
機(jī)器人主要通過傳感器實現(xiàn)其感知能力。本項目中,機(jī)器人所使用的傳感器具有如下重要功能:1) 語音采集模塊能夠敏銳地捕捉周圍環(huán)境中的聲音信息,將老年人的話語或其他聲音信號準(zhǔn)確地收集起來,為后續(xù)的處理和反饋提供基礎(chǔ)數(shù)據(jù);2) 語音播報模塊可以清晰地播放各種語音信息,無論是溫馨的問候語,還是對老年人問題的回答,都能通過這個模塊傳達(dá)給老年人;3) 動作模塊可以控制機(jī)器人做出各種動作,例如,在進(jìn)行雜技舞蹈表演時,該模塊能夠精確地控制機(jī)器人的舵機(jī),展現(xiàn)出精彩的動作表演,為老年人帶來視覺上的享受;4) 音樂播放模塊能夠播放各種類型的音樂,為老年人營造出舒適的氛圍,豐富他們的精神生活;5) 機(jī)器人內(nèi)置的處理器則承擔(dān)著對數(shù)據(jù)進(jìn)行初步打包的重要任務(wù),起到了數(shù)據(jù)中轉(zhuǎn)站的關(guān)鍵作用;6) 傳感器與處理器之間相互配合、相輔相成,共同實現(xiàn)了精準(zhǔn)語音反饋、雜技舞蹈表演以及音樂播放等各項功能。
在人機(jī)交互接口中,Yanshee機(jī)器人主要通過語音采集模塊和語音播報模塊實現(xiàn)與人類用戶的交互。其中,語音采集模塊負(fù)責(zé)收集人的聲音數(shù)據(jù),經(jīng)機(jī)器人內(nèi)部處理后,通過語音播報模塊反饋給用戶。
在本地計算機(jī)方面,本項目通過利用TCP/IP協(xié)議與Socket技術(shù)實現(xiàn)通信,并對接LIAMA模型以及進(jìn)行聲音模型的訓(xùn)練。通過與LIAMA模型的對接,機(jī)器人能夠理解老年人的交流意圖并進(jìn)行深度聊天,為老年人提供更專業(yè)化的情感陪伴;而聲音模型的訓(xùn)練則可以讓機(jī)器人模擬其親人的音色,為老年人提供更有效的情感慰藉。另外,機(jī)器人與本地計算機(jī)之間主要通過穩(wěn)定的互聯(lián)網(wǎng)絡(luò)進(jìn)行通信,以確保數(shù)據(jù)的快速傳輸和交互,使得整個系統(tǒng)能夠高效、穩(wěn)定地運行。
3 模塊說明
本系統(tǒng)的軟件實驗環(huán)境如表1所示,分別展示了Yanshee機(jī)器人、遠(yuǎn)程服務(wù)器的軟件/模塊信息。系統(tǒng)實現(xiàn)涉及機(jī)器人內(nèi)置的Linux系統(tǒng)以及VNC viewer、WinSCP等軟件,實現(xiàn)機(jī)器人的語音聊天、舞蹈展示、戲曲表演等多項功能。
3.1 機(jī)器人與計算機(jī)連接
為了連通整個系統(tǒng),需要先連接好Yanshee機(jī)器人與VNCviewer,其連接方式如下:首先,通過手持設(shè)備(如手機(jī)、平板等) 上的App與Yanshee機(jī)器人進(jìn)行交互,獲取機(jī)器人的IP地址;然后,進(jìn)入VNCviewer界面,輸入該機(jī)器人的IP地址,即可完成本地計算機(jī)與機(jī)器人的連接。機(jī)器人與計算機(jī)連接的流程如圖4所示。在Yanshee機(jī)器人的Linux頁面中進(jìn)入編程平臺,即可開始對Yanshee機(jī)器人進(jìn)行二次開發(fā)。為了在Yanshee機(jī)器人與本地計算機(jī)之間傳輸數(shù)據(jù),需要利用計算機(jī)上的WinSCP軟件,其操作方式如下:根據(jù)獲取的機(jī)器人IP地址,在WinSCP的界面中輸入該主機(jī)號(IP地址) 等,連接成功后頁面會分別顯示本地計算機(jī)文件庫與機(jī)器人文件庫。這樣,基于TCP/IP協(xié)議及Socket技術(shù),可以將相應(yīng)的音樂文件、動作文件、聲音模型文件置入機(jī)器人文件夾中。需要注意的是,音樂文件路徑為home/pi/documents/music,動作文件路徑為home/pi/documents/motion,路徑必須設(shè)置正確,以便于后續(xù)機(jī)器人的相應(yīng)開發(fā)。
3.2 智能語音交互
在完成 Yanshee 機(jī)器人智能語音交互之前,需要先在本地計算機(jī)上下載并部署LIAMA模型。當(dāng)用戶與機(jī)器人發(fā)生交互時,機(jī)器人中的語音采集模塊會識別相應(yīng)的語音,并將用戶的語音轉(zhuǎn)為文字,形成一個文本文件,通過TCP/IP協(xié)議傳輸至本地計算機(jī)。本地計算機(jī)在接收到文件后,會將問題傳輸至本地部署的LIAMA模型中。接下來,模型將結(jié)合相關(guān)算法給出合適的回答,并將相應(yīng)的文字轉(zhuǎn)成文本文件,傳輸至人物模型調(diào)用板塊,代碼在識別后會自動調(diào)用所訓(xùn)練的人物模型,形成一個MP3文件并通過網(wǎng)絡(luò)通信傳回至機(jī)器人,而機(jī)器人則通過調(diào)用MP3文件使用人物模型對應(yīng)的聲音進(jìn)行回答,最終完成與用戶的交互。智能語音交互的流程如圖5所示。
3.3 人物聲音模型訓(xùn)練
在本地計算機(jī)中,基于TCP/IP協(xié)議及Socket技術(shù)與WinSCP,分別實現(xiàn)了仿人語音模型的訓(xùn)練、本地計算機(jī)與機(jī)器人內(nèi)置處理器網(wǎng)絡(luò)通信、模型文件傳輸?shù)裙δ堋F渲校P陀?xùn)練的具體操作步驟包括:1) 打開GPT-sovits啟動器,進(jìn)入WEBUI界面。首先進(jìn)行前置工作,將相應(yīng)的音頻文件進(jìn)行UVR5處理,獲得純粹的人聲。2) 將處理好的音頻進(jìn)行語音切分。切分后的文件默認(rèn)保存至路徑output/slicer_opt。在文件夾找到對應(yīng)切片文件后,在ASR模塊進(jìn)行語音匹配。在模塊中填入基礎(chǔ)參數(shù),例如:ASR模型:達(dá)摩ASR;ASR語言設(shè)置:zh;數(shù)據(jù)精度類型:float32(參數(shù)較多,這里僅列舉部分) 。GPT會將相關(guān)文件掃描并進(jìn)行語言配對,配對完成后進(jìn)入1-GPT-SOVITS-TTS頁面,設(shè)置相應(yīng)變量名、填寫相關(guān)參數(shù)后即可進(jìn)行模型訓(xùn)練,采用GPT-sovits的默認(rèn)算法。3) 模型訓(xùn)練好后,會生成自定義命名的ckpt、pth文件;基于TCP/IP協(xié)議及Socket技術(shù),Yanshee機(jī)器人會根據(jù)老年人的需求向本地計算機(jī)端口傳輸相應(yīng)的文本文件。在接收到文件之后,本地計算機(jī)會提取其中的文字,調(diào)用模型后向機(jī)器人原路返回一個MP3格式文件,機(jī)器人調(diào)用相關(guān)文件即可與老年人進(jìn)行語音交流。
3.4 機(jī)器人動作設(shè)計
在Yanshee機(jī)器人的內(nèi)置系統(tǒng)中,基于YanAPI庫、Python語言和BLOCKLY可視化編程工具,本系統(tǒng)能夠精密控制機(jī)器人的全身舵機(jī),進(jìn)而實現(xiàn)雜技、舞蹈、京劇等多種面向老年人的動作文件的設(shè)計。具體的動作設(shè)計方式如下:定義BLOCKLY中的舵機(jī)命令,排版組合成一個命令模塊,系統(tǒng)識別命令行后生成對應(yīng)的Python語言,隨后調(diào)用YanAPI庫中的YanAPI.start_play_motion()函數(shù),基于TCP/IP協(xié)議及Socket技術(shù),實現(xiàn)對機(jī)器人數(shù)據(jù)的傳輸,進(jìn)而使Yanshee機(jī)器人遵循YanAPI命令執(zhí)行相應(yīng)的舵機(jī)轉(zhuǎn)動工作。通過對舵機(jī)轉(zhuǎn)動的各項組合與編排,形成多樣的機(jī)器人動作。
4 結(jié)束語
本文設(shè)計并實現(xiàn)了一種新型的助老陪伴機(jī)器人情感慰藉系統(tǒng),并介紹了其中重要模塊的原理及實現(xiàn)技術(shù)。該系統(tǒng)作為一個針對老年人服務(wù)場景所設(shè)計的人工智能應(yīng)用,其有效性得到了驗證,達(dá)到了設(shè)計目標(biāo)。具體來說,通過在敬老院等場所的實際測試(如圖6) ,測試結(jié)果良好:超過75%的老年人報告獲得情緒改善,約80%的老年人對系統(tǒng)功能表示滿意。
在未來,隨著多模態(tài)大模型與機(jī)器人技術(shù)的深度融合,將為助老陪伴機(jī)器人的情感慰藉系統(tǒng)完善提供新途徑。可以設(shè)想,機(jī)器人將從語音、文本、圖像、視頻等多模態(tài)數(shù)據(jù)中綜合感知老年人的情感狀態(tài),并有針對性地進(jìn)行情感慰藉,進(jìn)而完成與老年人的交互,從而實現(xiàn)更好的效果。然而,現(xiàn)實中仍存在多模態(tài)數(shù)據(jù)對齊、老年人口音問題等挑戰(zhàn),有待進(jìn)一步研究解決。
參考文獻(xiàn):
[1] 倪自強(qiáng),王田苗,劉達(dá).醫(yī)療機(jī)器人技術(shù)發(fā)展綜述[J].機(jī)械工程學(xué)報,2015,51(13):45-52.
[2] 周祎敏,姚宇哲,葉旭春.社區(qū)老年人對照護(hù)機(jī)器人感知與期望的Meta整合[J].護(hù)理學(xué)報,2023,30(9):43-48.
[3] POLLACK M E,BROWN L,COLBRY D,et al.Pearl: A mobile robotic assistant for the elderly[C]//Proceedings of the AAAI Workshop on Automation as Eldercare.Menlo Park,California,United States: AAAI Press,2002:85-91.
[4] VERCELLI A,RAINERO I,CIFERRI L,et al.Robots in elderly care[J].DigitCult-Scientific Journal on Digital Cultures,2018,2(2):37-50.
[5] YANG C Y,LU M J,TSENG S H,et al.A companion robot for daily care of Elders based on homeostasis[C]//2017 56th Annual Conference of the Society of Instrument and Control Engineers of Japan (SICE).IEEE,2017:1401-1406.
[6] OH S,OH Y H,JU D Y.Understanding the preference of the elderly for companion robot design[C]//Advances in Human Factors in Robots and Unmanned Systems.Cham:Springer,2020:92-103.
[7] LEE S B,YOO S H.Design of the companion robot interaction for supporting major tasks of the elderly[C]//2017 14th International Conference on Ubiquitous Robots and Ambient Intelligence (URAI),Korea.IEEE,2017:655-659.
[8] 石承睿,胡立夫,勾明洋,等.基于語音定位導(dǎo)航系統(tǒng)的老人陪伴機(jī)器人設(shè)計[J].電子器件,2024,47(5):1415-1419.
[9] 李函青,李永鋒.基于FAST和QFD的養(yǎng)老陪伴機(jī)器人用戶體驗設(shè)計研究[J].湖南包裝,2024,39(4):67-72.
[10] 李潔,劉詩雨,于卓遠(yuǎn),等.面向情感療愈的機(jī)器人萌形態(tài)研究[J].包裝工程,2024,45(16):30-39.
[11] 李紫妍.基于情感共生理念的寵物犬陪伴機(jī)器人設(shè)計研究[D].北京:北京化工大學(xué),2024.
[12] 王征,李紅雙,王國琦.六足移動式助老助殘機(jī)器人設(shè)計[J].機(jī)械設(shè)計,2023,40(S1):54-58.
[13] 陳章韶.面向助老服務(wù)的智能家居系統(tǒng)設(shè)計與實現(xiàn)[D].廣州:華南理工大學(xué),2023.
【通聯(lián)編輯:唐一東】