陶瑾 陶?qǐng)@琦
1977年,吳方言被收錄進(jìn)一張金色唱片中,跟隨美國(guó)國(guó)家航空航天局探測(cè)器“旅行者1號(hào)”從地球出發(fā),開(kāi)啟太空之旅。43年后,一首吳方言版的童謠《搖啊搖,搖到外婆橋》又被制作成音頻,隨著長(zhǎng)征六號(hào)遙三運(yùn)載火箭的成功發(fā)射,駛向浩瀚的宇宙。
方言似乎離我們?cè)絹?lái)越遠(yuǎn)。夯撥郎當(dāng)、吃生活、拎勿清、來(lái)三、花里吧啦……你還會(huì)說(shuō)蘇州閑話嗎?方言式微,江南軟語(yǔ)今猶在?隨著城鎮(zhèn)化進(jìn)程和網(wǎng)絡(luò)傳播的發(fā)展,方言在年輕人文化圈層中的聲音漸漸淡出,隨之消失的不僅僅是一種發(fā)音、一些詞匯,還有方言背后積淀的文化因子。
進(jìn)入人工智能新時(shí)代,就得用新技術(shù)新辦法。科大訊飛(蘇州)科技有限公司(以下簡(jiǎn)稱蘇州訊飛)運(yùn)用AI力量,讓蘇州方言煥發(fā)新生,也讓更多年輕人產(chǎn)生了對(duì)鄉(xiāng)音的情感共鳴。
讓AI說(shuō)一口流利的蘇州話
面對(duì)方言的日漸式微,2017年訊飛輸入法發(fā)起“方言保護(hù)計(jì)劃”,2018年蘇州訊飛落地蘇州以后,也開(kāi)始了對(duì)蘇州方言的技術(shù)化保護(hù)與開(kāi)發(fā)應(yīng)用。
AI就像一個(gè)天馬行空的“孩子”,讓它“說(shuō)”出一口相對(duì)標(biāo)準(zhǔn)的普通話已經(jīng)很難,更別提要合成有著28個(gè)聲母、49個(gè)韻母、8個(gè)聲調(diào)的蘇州話了。在蘇州方言語(yǔ)音識(shí)別與合成系統(tǒng)研發(fā)過(guò)程中,大小挑戰(zhàn)接踵而來(lái)。讓AI學(xué)會(huì)說(shuō)蘇州話,機(jī)器既聽(tīng)得懂又能說(shuō)得出是重要的技術(shù)要求。因此蘇州訊飛尋找地道母語(yǔ)者、專業(yè)發(fā)音人、評(píng)彈老師、具有代表性的專業(yè)機(jī)構(gòu)等,請(qǐng)他們共同錄制語(yǔ)料、篩查語(yǔ)法規(guī)則,通過(guò)語(yǔ)料資源的采集與標(biāo)注,訓(xùn)練AI模型的方言能力。
蘇州話源遠(yuǎn)流長(zhǎng),今日的吳語(yǔ)發(fā)音者稀缺,加上吳語(yǔ)地區(qū)方言分布廣、地域差別大,所謂“十里不同音”,這些都為收集相對(duì)標(biāo)準(zhǔn)的方言語(yǔ)料帶來(lái)難度。“為訓(xùn)練蘇州方言識(shí)別系統(tǒng)而錄制方言語(yǔ)料的過(guò)程中,需要選擇標(biāo)準(zhǔn)的地區(qū)、標(biāo)準(zhǔn)的語(yǔ)料錄制人。而在訓(xùn)練方言合成系統(tǒng)過(guò)程中,發(fā)音人的選擇需要滿足合適的代際標(biāo)準(zhǔn),蘇州方言分為‘老、中、新三個(gè)派別,而‘中派則是訊飛團(tuán)隊(duì)進(jìn)行語(yǔ)料錄制的要求之一。此外文白轉(zhuǎn)譯能力、地道化表述能力及對(duì)變調(diào)的標(biāo)準(zhǔn)把控等,都在發(fā)音人選擇標(biāo)準(zhǔn)之中。”蘇州訊飛蘇州方言研發(fā)項(xiàng)目負(fù)責(zé)人于馥源介紹。
為此,蘇州訊飛做了許多嘗試。在選擇發(fā)音人時(shí),考慮到發(fā)音人的社會(huì)角色和聽(tīng)眾的感受,盡可能保證錄制到發(fā)音相對(duì)標(biāo)準(zhǔn)且聽(tīng)感舒適的語(yǔ)料,這一過(guò)程耗費(fèi)了大量時(shí)間和精力。今年,訊飛計(jì)劃錄制6000至8000句男聲語(yǔ)料,來(lái)初步豐富合成端發(fā)音角色,而此項(xiàng)工作,至少需要近一年時(shí)間才能全部完成。蘇州訊飛技術(shù)團(tuán)隊(duì)用了幾年時(shí)間,識(shí)別端累計(jì)采集并標(biāo)注蘇州方言地方語(yǔ)料1100余小時(shí),合成端累計(jì)積累語(yǔ)料共1.7萬(wàn)余句。同時(shí)整理迭代大量書(shū)籍選定語(yǔ)言規(guī)范,優(yōu)化“正字表”等基礎(chǔ)工具,讓AI模型不斷訓(xùn)練發(fā)音,目前訊飛輸入法字識(shí)別率已提升至84%。
用故事喚醒鄉(xiāng)音
2021年,一部蘇州方言演繹的古裝短片受到很多人關(guān)注。片中純正的吳儂軟語(yǔ)旁白,讓很多人印象深刻。而這樣的吳儂軟語(yǔ),竟然是用高科技合成的。
《姑蘇瑣記·金縷衣》講述了明代姑蘇城外,幾位不同出身的女性之間相互扶持的故事。片中除了精美的器物和華美的服飾外,由AI語(yǔ)音技術(shù)合成的吳語(yǔ)旁白,是本片一大亮點(diǎn)。之后蘇州訊飛又推出姊妹篇《姑蘇瑣記·懶畫(huà)眉》和《姑蘇瑣記·天仙子》。《姑蘇瑣記》系列短片將人工智能方言技術(shù)新穎地加入文藝創(chuàng)作中,發(fā)聲腔調(diào)、語(yǔ)音語(yǔ)氣都透著真切,顯得自然貼近,仿佛帶來(lái)了一場(chǎng)時(shí)空穿越,將屏幕前的年輕觀眾帶入歷史情境中。
“這三部曲是我們和古風(fēng)UP主‘蜃樓志studio一起出品的‘方言保護(hù)計(jì)劃公益短片。當(dāng)時(shí)我們決定拍攝這一系列短片,主要是因?yàn)橹救は嗤叮p方都希望為方言保護(hù)貢獻(xiàn)一份力量,試圖通過(guò)當(dāng)下年輕人喜歡的視頻形式去呈現(xiàn)方言的美,傳達(dá)蘇州方言值得被傳承、被聽(tīng)見(jiàn)、被習(xí)得的理念。”于馥源告訴記者。在創(chuàng)意階段,他們參考了《吳郡歲華紀(jì)麗》《長(zhǎng)物志》等地方古書(shū)。蘇州地方文化多而龐雜,時(shí)代變遷也對(duì)文化產(chǎn)生很大影響,如果從大處著眼,很難用8分鐘的視頻體量講清楚。最是人間煙火動(dòng)人心,平凡人的生活片段,既能表現(xiàn)地方四時(shí)不同的習(xí)俗風(fēng)物,也能看到方言溝通中的地區(qū)思想特點(diǎn)。
據(jù)悉,《姑蘇瑣記》前兩部的畫(huà)外音和第三部中“天仙子”的聲音,都是借助“科大訊飛AI蘇州方言合成系統(tǒng)”配音完成,語(yǔ)調(diào)婉轉(zhuǎn)和真人發(fā)音無(wú)異。尤其在第三部中應(yīng)用了蘇州訊飛首次推出的古風(fēng)高保真數(shù)字孿生虛擬人“雨笙”,與元宇宙的跨界聯(lián)動(dòng),構(gòu)建了全新的互動(dòng)體驗(yàn)。說(shuō)到數(shù)字孿生虛擬人“雨笙”,對(duì)比常見(jiàn)的虛擬人,蘇州訊飛團(tuán)隊(duì)的著眼點(diǎn)從“更美”轉(zhuǎn)換到“更真”,把握細(xì)節(jié),力求真實(shí),為未來(lái)元宇宙中人的形象,拓寬了想象空間。
語(yǔ)言從來(lái)都是越用越活的。當(dāng)下,方言已經(jīng)從一個(gè)交流的工具蛻變成一個(gè)文化的符號(hào)和情感的紐帶。
為數(shù)字產(chǎn)業(yè)裝載文化心臟
保護(hù)方言需要做大量的幕后工作,讓AI會(huì)說(shuō)蘇州話只是方言保護(hù)的第一步。如何讓AI蘇州話走進(jìn)生活場(chǎng)景,讓更多人領(lǐng)略吳地文化的美,尤其是探索年輕人與地方文化之間的關(guān)系,才是讓方言真正實(shí)現(xiàn)“被感受、被使用”的創(chuàng)新路徑。
2021年,蘇州訊飛與蘇州博物館跨界合作,發(fā)起“用姑蘇軟語(yǔ)傳承千年文化”活動(dòng),將蘇州話與館藏文物結(jié)合,借助方言講述文物歷史的形式,讓人們足不出戶“云賞”蘇博珍品。去年,蘇州訊飛聯(lián)手蘇州市非遺辦,啟動(dòng)非遺數(shù)字化項(xiàng)目,開(kāi)展非遺作品高精三維數(shù)字掃描及AI蘇州方言有聲播報(bào)項(xiàng)目。近百件數(shù)字非遺作品“云端”上線,觀眾一邊傾聽(tīng)人工智能的方言解說(shuō),一邊近距離全方位觀賞數(shù)字化非遺精品作品。現(xiàn)階段,蘇州訊飛又與廣州美術(shù)學(xué)院及蘇州博物館聯(lián)合打造AI方言藝術(shù)裝置,以更有趣、更接地氣的方式,滲入蘇州人的日常生活。目前已有7個(gè)作品成型,今年將在蘇博亮相。屆時(shí)參觀者可以身臨其境地觀賞藝術(shù)與技術(shù)的鏈接,與AI方言藝術(shù)裝置進(jìn)行交互。
盡管越來(lái)越多數(shù)字文化產(chǎn)品受到年輕人的推崇和喜愛(ài),蘇州方言的“接力棒”也漸漸回到年輕人手中,不過(guò)當(dāng)代人還需探索方言的多元表達(dá),開(kāi)辟數(shù)字文化應(yīng)用新場(chǎng)景,不斷用人工智能講好蘇州故事,推動(dòng)傳統(tǒng)文化的“破圈”傳播。