張靜

通過AI 產(chǎn)品,陳薇使用自己原聲跟顧客交流
在杭州市西湖區(qū)浙江省殘疾人聯(lián)合會(huì)旁邊,有一個(gè)幫助殘疾人就業(yè)的網(wǎng)紅街區(qū)——馬塍路殘疾人融合就業(yè)街區(qū)。這里的7個(gè)沿街店鋪開設(shè)4類門店:經(jīng)營(yíng)面包、蛋糕、咖啡的“筑夢(mèng)烘焙”,經(jīng)營(yíng)快剪的“無聲發(fā)藝”,盲人推拿,還有以殘助產(chǎn)品銷售為主的直播帶貨門店。這里的工作人員基本都是殘障人士,近半是聽障者。
近日,街區(qū)迎來喜事——“無聲發(fā)藝”店鋪里,聽障美發(fā)師用自己的聲音說出了“人生第一句”。
這是浙江省殘疾人福利基金聯(lián)合網(wǎng)易集團(tuán)、網(wǎng)易公益發(fā)起“人生第一句”聲音復(fù)原公益計(jì)劃,利用網(wǎng)易互娛AI Lab的iSpeech技術(shù)打造首個(gè)AI復(fù)原聽障人士原聲的工具:聽障人士?jī)H需在音書App上傳2分鐘發(fā)聲片段,之后在產(chǎn)品中輸入想要表達(dá)的文字,音書App就可以幫助他們用自己的音色把話“說”出來。目前該音色復(fù)原產(chǎn)品已向全國(guó)聽障人士免費(fèi)開放,幫助他們無障礙、有情感地與外界交流。
浙江省殘疾人福利基金會(huì)理事長(zhǎng)趙小飛告訴《瞭望東方周刊》:“殘疾人融合就業(yè)街區(qū)是杭州亞殘運(yùn)會(huì)期間對(duì)外展示的窗口。有了科技助力,無聲小店的工作人員就能夠便捷流暢地與各方來客交流,為他們提供更好的服務(wù),向世界展示中國(guó)殘疾人群體的新風(fēng)貌?!?blockquote>
聽障人士?jī)H需在音書App 上傳2分鐘發(fā)聲片段,之后在產(chǎn)品中輸入想要表達(dá)的文字,音書App 就可以幫助他們用自己的音色把話“說”出來。
近年來,我國(guó)信息無障礙建設(shè)相關(guān)制度體系不斷完善。2021年國(guó)務(wù)院印發(fā)的《“十四五”殘疾人保障和發(fā)展規(guī)劃》明確提出加快信息無障礙建設(shè),將其作為數(shù)字社會(huì)、數(shù)字政府、智慧城市建設(shè)的重要組成部分。2023年6月28日,十四屆全國(guó)人大常委會(huì)第三次會(huì)議表決通過《無障礙環(huán)境建設(shè)法》,為信息無障礙建立起更有優(yōu)勢(shì)的發(fā)展環(huán)境。
趙小飛表示,浙江省共有持證殘疾人133.7萬人,其中聽力殘疾20.8萬人、言語殘疾1.7萬人?!霸谂c有聽力語言障礙人群的日常接觸和溝通中,我們發(fā)現(xiàn)超過2/3有聽力語言障礙的人士在生活、學(xué)習(xí)、工作中有進(jìn)一步的社交溝通需求,他們渴望能夠向身邊的人傳遞自己的聲音,哪怕只是簡(jiǎn)單的問候。為了更好幫助該群體解決其面臨的問題,基金會(huì)面向浙江特殊教育職業(yè)學(xué)院的學(xué)生和音書App的部分用戶開展了一個(gè)需求調(diào)研,了解他們社交現(xiàn)狀、無障礙通信使用情況和真實(shí)需求?!壁w小飛說。
調(diào)研結(jié)果顯示,僅有1/10的受訪對(duì)象能夠通過簡(jiǎn)單口語與身邊的人進(jìn)行交流,大多數(shù)人經(jīng)歷過太多“想說卻說不出”的自卑與懊惱,最大的夢(mèng)想是能說出“人生第一句”。
超過67%的受訪對(duì)象表示“愿意使用音色復(fù)原技術(shù)”,超過50%的受訪對(duì)象表示“愿意將音色復(fù)原技術(shù)推薦給身邊有需要的人”,也有部分受訪對(duì)象表示除了手機(jī)App軟件以外,希望音色復(fù)原技術(shù)廣泛應(yīng)用于公交、出租車、飯店、超市、銀行、高鐵等公共場(chǎng)所。
綜合受訪對(duì)象的需求,基金會(huì)攜手網(wǎng)易集團(tuán)、音書科技共同打造出音色復(fù)原技術(shù)產(chǎn)品?!拔覀兿Mㄟ^這一AI技術(shù)幫助他們用自己的音色向他人傳遞內(nèi)心想法,進(jìn)而推動(dòng)解決該群體和健全人溝通交流中存在的障礙問題,改變他們的生活、學(xué)習(xí)和工作環(huán)境及相應(yīng)的能力水平,使他們能夠更平等地參與社會(huì)生活,實(shí)現(xiàn)人生價(jià)值?!壁w小飛說。
如何運(yùn)用AI技術(shù)幫助聽障人士傳遞自己的聲音?
網(wǎng)易互娛AI Lab技術(shù)總監(jiān)林悅告訴《瞭望東方周刊》:“目前,大多數(shù)語音克隆產(chǎn)品需要輸入大量講話以采集數(shù)據(jù),提供給后期語音合成,對(duì)無法發(fā)出清晰語義的聽障人士來說并不適用,因?yàn)樗麄兊陌l(fā)聲往往只有簡(jiǎn)單音節(jié),導(dǎo)致語音難以識(shí)別。此外,市面上服務(wù)聽障人士的交流工具大多采用文字轉(zhuǎn)語音,不能讓他們用自己的聲音去說?!?/p>
網(wǎng)易研發(fā)團(tuán)隊(duì)利用iSpeech技術(shù),基于海量數(shù)據(jù)的預(yù)訓(xùn)練模型,加上聽障人士極少量的純語音數(shù)據(jù)的快速微調(diào)算法模型,在快速克隆說話人音色的同時(shí)保留基礎(chǔ)模型的內(nèi)容發(fā)音能力,聲音復(fù)原工具,讓聽障人士輸入文字就可以實(shí)時(shí)用原聲流暢表達(dá)。

杭州西湖區(qū)馬塍路殘疾人融合就業(yè)街區(qū)

聽障用戶使用AI 產(chǎn)品錄入語音
“研發(fā)難點(diǎn)在于,從極短的無語義的語音中提取到個(gè)人聲音特征。正常的語音合成技術(shù)往往需要半小時(shí)到一個(gè)小時(shí)的語料建模,而我們的研發(fā)團(tuán)隊(duì)克服了技術(shù)難度,僅需要聽障者發(fā)出兩分鐘簡(jiǎn)單音節(jié),就能復(fù)原他們?cè)镜穆曇??!绷謵傉f,“和文字轉(zhuǎn)語音工具相比,我覺得這個(gè)技術(shù)更有價(jià)值之處在于,自己的聲音能體現(xiàn)情緒和意愿,代入感更強(qiáng),能讓殘障人士與親友實(shí)現(xiàn)情感上的共鳴?!?h3>科技向善
1999年出生的陳薇(化名)先天聽障,因?yàn)橄矚g美食而學(xué)習(xí)了烘焙技術(shù),也許因?yàn)槭澜鐚?duì)于她是一片寂靜,所以她做起甜品、面包來非常專注。她做的牛角包每天一出爐,就會(huì)被顧客一搶而空。有些顧客甚至專門學(xué)了幾句簡(jiǎn)單的手語,就為了與她打招呼。陳薇很感動(dòng),但更希望有機(jī)會(huì)與顧客“親口”交流。有一次遇到商品原料問題,她想跟顧客道歉,又是比畫又是打字,雖然顧客說不計(jì)較,但沒法直接說“對(duì)不起”的感覺讓她更加自責(zé)。
試用了音色復(fù)原工具后,陳薇覺得效果很理想。她第一時(shí)間跟父母說了“我愛你們”?!拔腋杏X自己有了底氣,能和顧客主動(dòng)交流了?!标愞庇靡羯珡?fù)原工具對(duì)《瞭望東方周刊》說,“我希望更多聽障人士能用上這個(gè)產(chǎn)品,把心里想說的話,充滿情感地直接說出來!”
沈師傅也是聽障人士。他在馬塍路殘疾人融合就業(yè)街區(qū)做理發(fā)師10多年了,尤其擅長(zhǎng)快剪男頭。因?yàn)樾r(shí)候家里條件不好,他沒有做過讀聽能力康復(fù)訓(xùn)練,如今只能用“文字+手勢(shì)”跟客人溝通。有時(shí)遇到年紀(jì)大的顧客,雙方都覺得在手機(jī)上寫字交流十分費(fèi)勁。如今用了音色復(fù)原工具,他覺得不但能讓自己更好地理解顧客對(duì)理想發(fā)型的需求,而且“以后上醫(yī)院、超市、高鐵都方便多了”。
普通人難以想象,對(duì)聽障人士來說,在一些人生特殊時(shí)刻,“說話”是多么重要——對(duì)愛人說一句“謝謝”、在孩子婚禮上說一句“祝賀”等等。
一歲時(shí)的一次發(fā)燒打針,讓顧琴燁的世界永遠(yuǎn)失去了聲音。她的童年在四處求醫(yī)中度過,后來媽媽把她送進(jìn)聾兒康復(fù)中心進(jìn)行語言康復(fù)訓(xùn)練,雖然盡了一切努力,但效果有限?!爱?dāng)我說話的時(shí)候,有些人還是會(huì)用異樣眼光看我,我覺得很自卑?!鳖櫱贌罨貞?。
在康復(fù)老師的鼓勵(lì)下,她學(xué)習(xí)畫畫、書法、舞蹈,最終成為一名殘疾人藝術(shù)團(tuán)的舞蹈家。她參加過浙江賽區(qū)環(huán)球小姐比賽,拍過殘奧會(huì)獻(xiàn)禮影片,還參加過世界巡演。在這些人生高光時(shí)刻,她無法流暢地表達(dá)自己,這成為她心中永遠(yuǎn)的遺憾。
“現(xiàn)在我能說話了,這對(duì)我們聽障人來說是最大的福音!我要親口感謝老師、感謝父母!我還要對(duì)女兒說聲對(duì)不起,我有太多話要和她說了?!蹦苡米约旱穆曇舯磉_(dá),讓顧琴燁十分激動(dòng)。
科技向善,信息無障礙建設(shè)不僅提升殘障人士的生活能力和生活質(zhì)量,更是對(duì)他們個(gè)人尊嚴(yán)的提升。趙小飛說:“社會(huì)融合是一個(gè)系統(tǒng)性問題,在實(shí)際推進(jìn)過程中,不同的殘疾人在基本生活、社會(huì)參與、勞動(dòng)就業(yè)、醫(yī)療教育等方面仍會(huì)面臨各種特殊障礙與挑戰(zhàn)。智能科技促進(jìn)人類信息流動(dòng)無障礙,助力不同群體進(jìn)一步暢達(dá)溝通。此次音色復(fù)原技術(shù)的探索性嘗試取得了顯著成果,我們還會(huì)持續(xù)搭建更多智慧無障礙落地場(chǎng)景?!?/p>