◎張婧怡
1.智能音頻APP的類型及界定
首先,本文論述的智能音頻APP不同于以音頻娛樂(lè)功能為主的APP(例:唱吧、全民K歌等),也不同于以音頻實(shí)用功能為主的APP(例:QQ、微信中語(yǔ)音的社交功能、百度輸入法中語(yǔ)音的輸入功能等)。
接下來(lái)將例舉并歸納四款智能音頻APP(數(shù)據(jù)均采集于2020年7月的App Store),它們?cè)陂_(kāi)發(fā)基于音頻的娛樂(lè)功能、社交功能、教育功能時(shí),不同程度的應(yīng)用了人工智能技術(shù),并實(shí)現(xiàn)了較好的創(chuàng)新和融合。另外,這四款A(yù)PP中包含的社交功能都在致力于構(gòu)建以“聲音”為基礎(chǔ)的社交關(guān)系。
第一款是“嗚嗚練聲”,主打智能練聲和聲樂(lè)教學(xué),評(píng)分4.9(基于6166個(gè)評(píng)分)。這款A(yù)PP的功能主要由以下三點(diǎn):其一,問(wèn)診式聲音檢測(cè)體系;其二,實(shí)時(shí)AI監(jiān)測(cè)練聲過(guò)程;其三,大數(shù)據(jù)匹配名師,一對(duì)一解惑。值得一提的是該款A(yù)PP的“智能語(yǔ)音識(shí)別及檢測(cè)”,使用者進(jìn)行對(duì)發(fā)聲、音域、音準(zhǔn)的測(cè)試,AI自動(dòng)識(shí)別優(yōu)劣,應(yīng)用于后續(xù)制定練習(xí)計(jì)劃、匹配名師。
第二款是“朗讀語(yǔ)音”,主打語(yǔ)音朗讀功能,評(píng)分4.9(基于基于1.9萬(wàn)個(gè)評(píng)分)。該款A(yù)PP的語(yǔ)音朗讀功能非常強(qiáng)大,不論是圖片、文字還是網(wǎng)頁(yè)鏈接皆可一鍵收聽(tīng)。另外,還可以根據(jù)用戶個(gè)人的聲音定制主播聲音,使用“復(fù)刻”功能,朗讀一段文字,朗讀者的聲音即可生成語(yǔ)音包應(yīng)用于任意語(yǔ)段。
第三款是“很皮語(yǔ)音包”,主打定制語(yǔ)音包功能,評(píng)分4.6(基于3.3萬(wàn)個(gè)評(píng)分)。該款A(yù)PP定制的個(gè)性語(yǔ)音包可跨平臺(tái)傳播,適配性較高。另外還有設(shè)有語(yǔ)音直播間、聲音社區(qū)、個(gè)性化主頁(yè)展示,更利于結(jié)交同好好友,垂直社交。
第四款是“比鄰”,主打語(yǔ)音社交功能,評(píng)分5.0(基于2059個(gè)評(píng)分)。該款A(yù)PP可以實(shí)時(shí)匹配用戶,陌生人社交。另外還設(shè)有語(yǔ)音直播間、個(gè)性化主頁(yè)展示等。相較于其他陌生人社交的APP,“比鄰”更注重聲音的作用,以聲音交友也可以避免隱私泄露的尷尬,在目前的移動(dòng)端APP中確實(shí)較為新穎。
2.智能音頻APP發(fā)展現(xiàn)狀
(1)日常應(yīng)用
在今天,智能化、場(chǎng)景化、定制化的聲音傳播已然實(shí)現(xiàn)。試想以下場(chǎng)景,人們?cè)谇宄空Z(yǔ)音喚醒智能設(shè)備預(yù)約出行,連接智能家居泡咖啡、聽(tīng)音樂(lè);工作學(xué)習(xí)中,語(yǔ)音查詢信息,解放雙手;結(jié)束一天忙碌,打開(kāi)音遇APP歡唱片刻,再用私人定制的智能主播朗讀伴音入睡。原本只出現(xiàn)在科幻電影中的假想,正悄然滲透到我們的日常生活,未來(lái)已來(lái)。人工智能不僅重塑了音頻產(chǎn)業(yè)的形態(tài)和樣貌,使得智能音頻廣泛應(yīng)用于智能搜索、新聞播報(bào)、語(yǔ)音識(shí)別等諸多前沿領(lǐng)域,更是改變了人們的生活方式和虛擬空間的交際常態(tài)。聲音傳播的新生態(tài)正是智能媒體時(shí)代面臨的巨大機(jī)遇和全新挑戰(zhàn)。
(2)特殊需求
據(jù)調(diào)查中國(guó)視障群體約有1731萬(wàn)人,30歲以下的人群占比23.5%。對(duì)于主打或兼具社交功能的音頻APP而言,這是一個(gè)巨大潛在市場(chǎng)。一些主流社交APP中的智能音頻功能已經(jīng)在更新迭代中日漸成熟了,其實(shí)用性不言而喻。但是相較之下,范圍更廣、形式更豐富的基于音頻的虛擬社交還是一片幾乎未開(kāi)發(fā)的空白。
3.智能音頻APP優(yōu)勢(shì)分析
(1)情感層面
聲音作為一種傳播載體可謂是獨(dú)一無(wú)二,例如人聲的語(yǔ)氣、語(yǔ)調(diào)、音質(zhì)等以及幾乎不可計(jì)數(shù)的音效,這些元素是其他傳播方式不可替代的,所以聲音傳播具有天然的優(yōu)勢(shì)。人類對(duì)于情感的需求是極其強(qiáng)烈的,面對(duì)壓力、排解焦慮、渴望陪伴等都在不斷激發(fā)人們的社交欲望,基于智能音頻的虛擬社交的特點(diǎn)正可以滿足人們的情感需求和社交欲望,不論時(shí)間地點(diǎn)的匿名社交環(huán)境為人們提供了心靈放松、私密性高的新型社交模式。但是,在開(kāi)發(fā)和傳播智能音頻APP的同時(shí),也要注意傳播積極健康的音頻內(nèi)容,避免音頻質(zhì)量良莠不齊,和諧可持續(xù)的發(fā)展方式才是此類APP的未來(lái)。
(2)技術(shù)層面
雖然聲音作為單一介質(zhì)只是傳播內(nèi)容入門級(jí)別的一種呈現(xiàn),但是智能音頻可依據(jù)用戶需求進(jìn)行適當(dāng)?shù)恼{(diào)整,傳播效果和用戶體驗(yàn)正在實(shí)現(xiàn)最大優(yōu)化。智能音頻場(chǎng)景化可以使用戶身臨其境;智能音頻定制化可以滿足不同用戶的個(gè)性要求。當(dāng)然,一切的基礎(chǔ)還要建立在人工智能技術(shù)的飛速發(fā)展上大數(shù)據(jù)分析、算法推算等技術(shù)在不斷注入智能音頻領(lǐng)域,使其領(lǐng)域不斷拓寬、深度不斷延伸。在未來(lái),伴隨著人工智能技術(shù)的更新迭代,智能音頻產(chǎn)業(yè)必然會(huì)蓬勃發(fā)展。
1.聲音社交的誕生背景:普遍存在的“群體性孤獨(dú)”
“虛擬社交”是指人們利用互聯(lián)網(wǎng)營(yíng)造的虛擬空間,進(jìn)行人類社會(huì)中情感交流。科技發(fā)展讓網(wǎng)絡(luò)化生存無(wú)限接近現(xiàn)實(shí),也衍生了看似緊密的新型親密關(guān)系,但實(shí)際上,時(shí)刻在線的虛擬社交使人們普遍深陷“群體性孤獨(dú)”。“群體性孤獨(dú)”的概念來(lái)自雪莉·特克爾(Sherry Turkle)的著作《群體性孤獨(dú)》。她認(rèn)為人們正在逃離現(xiàn)實(shí)游離到虛擬世界,處于既渴望親密交流又不想被打擾的矛盾狀態(tài)。智能音頻APP的出現(xiàn)滿足了人們對(duì)陪伴的強(qiáng)烈需求,開(kāi)辟了一種新型的輕量社交關(guān)系。在人工智能技術(shù)的加持下,個(gè)性化匹配的實(shí)時(shí)在線社交對(duì)象通過(guò)音頻交流,適當(dāng)?shù)木嚯x構(gòu)建了一種私密性較高的社交方式,游離于親密與克制之間。基于智能音頻的虛擬社交方式消解了人們對(duì)親密關(guān)系的抗拒,使得親密聯(lián)系與保持距離兩種狀態(tài)在聲音社交關(guān)系中融洽結(jié)合。
2.推動(dòng)聲音社交發(fā)展的重要因素
(1)用戶體驗(yàn)提出新要求
我們常常在通過(guò)網(wǎng)絡(luò)交流時(shí)遇到這種困擾——在一些語(yǔ)境下發(fā)送文字消息,不添加語(yǔ)氣詞“呢”“呀”“哈”等就會(huì)產(chǎn)生情感傳達(dá)的偏差,令接受者感到“語(yǔ)氣生硬”或“情緒不佳”;又或是在發(fā)送簡(jiǎn)短文字消息是一定要追加一個(gè)甚至數(shù)個(gè)表情包,以顯示并非敷衍。以智能音頻APP為主要載體的聲音社交消解了傳受主體間的傳播隔閡,避免了不必要的理解偏差,有效的調(diào)節(jié)了純文字信息中的情緒傳達(dá),對(duì)個(gè)體交往和群體互動(dòng)有著重要的價(jià)值和意義。人們可以從“聲音包”中根據(jù)聲音媒介傳達(dá)的信息,直觀認(rèn)知到主體的情感狀態(tài)并進(jìn)行情感互動(dòng)。語(yǔ)言學(xué)家威廉·馮·洪堡特(William von Hongbaote)曾說(shuō):“發(fā)聲器官發(fā)出的聲音恰似有生命體的呼氣,從人的胸中流出,即使在未使用語(yǔ)言的情況下,聲音也可以傳達(dá)痛苦、歡樂(lè)、厭惡和渴望。”這也正是聲音在人際交往中具備絕對(duì)優(yōu)勢(shì)的原因。
(2)虛擬社交觀念的轉(zhuǎn)變
人工智能技術(shù)正在改變和重塑虛擬社交方式,人們?cè)谔摂M空間中獲得更多伸張個(gè)性、表達(dá)思想的可能,社交觀念亦隨之變化。與“表情包”的流行相似,以“聲音包”領(lǐng)跑的聲音社交滿足了人們自我呈現(xiàn)的需求。自我呈現(xiàn)(preservation of self)又稱印象管理(impression management),是社會(huì)學(xué)家歐文·戈夫曼在著作《日常生活中的自我呈現(xiàn)》中提出的,人與人之間的互動(dòng)交往具有明顯的表演性,每個(gè)人都有多個(gè)不同的“自我”,這取決于他們?cè)诂F(xiàn)實(shí)生活中面臨的不同情境當(dāng)中進(jìn)行自我展現(xiàn)的不同方式。另外,馬斯洛需求理論中也認(rèn)為“自我實(shí)現(xiàn)”是最高等的需求,在自我實(shí)現(xiàn)需求的驅(qū)動(dòng)下極具個(gè)人色彩、充分釋放情緒的聲音表達(dá)實(shí)屬不二之選。
(3)亞文化熱度持續(xù)升溫
迅速革新的技術(shù)不僅加速了亞文化的發(fā)展,而且撕裂了亞文化的傳統(tǒng)形態(tài),賦予其新的風(fēng)格轉(zhuǎn)向。亞文化群體棲居在虛擬空間所進(jìn)行的亞文化實(shí)踐,不局限于信息的獲取和傳播,而是基于網(wǎng)絡(luò)新媒體的運(yùn)用進(jìn)行人際交往、符號(hào)傳播和文本創(chuàng)作,展現(xiàn)出亞文化新的風(fēng)格特征,需要新的價(jià)值研判。其中誕生于網(wǎng)絡(luò)時(shí)代、在新媒體時(shí)代走向高潮的網(wǎng)絡(luò)新語(yǔ)體極具代表性,這種網(wǎng)絡(luò)新語(yǔ)體是指出現(xiàn)在虛擬空間的全新表達(dá)方式,融匯在當(dāng)代亞文化的各種形態(tài)中,夾雜文字、圖像,在方言、普通話、古文、白話文等語(yǔ)體中自由轉(zhuǎn)換,多彩且易變。應(yīng)用于音頻的人工智能技術(shù)在最大程度上發(fā)揮了聲音的多樣性,展現(xiàn)了個(gè)性化的虛擬社交可能性。
虛擬社交已經(jīng)已經(jīng)成為人們?nèi)粘I畹囊徊糠郑黝愔悄芤苿?dòng)端的軟件通過(guò)視頻、圖片、文字等給我們傳遞了大量的信息。目前以音頻為核心的應(yīng)用相對(duì)較少,社交軟件不乏表情包,但缺乏聲音包。智能音頻產(chǎn)業(yè)的迅速發(fā)展使音頻APP逐漸脫離原本單一的實(shí)用目的,而轉(zhuǎn)變?yōu)楦鞣N通過(guò)聲音調(diào)配、音效重組、賦予情節(jié),以復(fù)雜的形式表情達(dá)意,在情節(jié)中感受和體驗(yàn)該社會(huì)語(yǔ)境中的情感活動(dòng)。它既可以反映社會(huì)現(xiàn)狀,建構(gòu)社會(huì)現(xiàn)實(shí),映照社會(huì)情感,為亞文化群體提供“想象性的解決方案”,又可充當(dāng)情感治療的“治療藥”和負(fù)向情感的“減壓閥”。
總之,將人工智能技術(shù)融入音頻產(chǎn)業(yè),開(kāi)發(fā)更多智能音頻APP有著廣闊的前景。智能音頻也會(huì)在未來(lái)逐漸滲透、改變我們的虛擬社交方式甚至生活方式。但是其中仍存在許多問(wèn)題需要規(guī)避,例如用戶隱私保護(hù)、內(nèi)容審查等,都值得我們仔細(xì)思考。