999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

AIGC 時代有聲書行業(yè)的機遇與挑戰(zhàn)

2024-01-25 06:31:44■文/程
張江科技評論 2023年6期
關鍵詞:音色內容

■文/程 輝

在生成式人工智能時代,有聲書行業(yè)的生產流程將重塑,生產力會有突破性提高。

隨著人工智能(Artificial Intelligence,AI)技術的不斷發(fā)展,聊天生成式預訓練模型(Chat Generative Pre-trained Transformers,ChatGPT)橫空出世,我們迎來了生成式人工智能(Artificial Intelligence Generated Content,AIGC)時代。

AI 正加速滲透各行各業(yè),以塑造產業(yè)新范式,一場新的生產力與創(chuàng)造力革命蓄勢待發(fā)。AI 語音技術是AIGC 領域的重要分支之一,隨著AI 技術的發(fā)展,其角色功能、產品服務和行業(yè)生態(tài)等都發(fā)生了巨大的變化。

AIGC 影響各行各業(yè)

2022 年,ChatGPT 憑借其在語義理解、文本創(chuàng)作、代碼編寫、邏輯推理、知識問答等方面的卓越表現,以及自然語言對話的低門檻交互方式,迅速躥紅網絡,收獲了大批用戶。ChatGPT-4 引起了人們對AIGC 的廣泛關注。第50 次《中國互聯(lián)網絡發(fā)展狀況統(tǒng)計報告》顯示,截至2022 年6 月,中國互聯(lián)網普及率已高達74.4%。在網民規(guī)模不斷提升、網絡接入環(huán)境日漸多元、AI 技術助推行業(yè)數字化轉型升級的宏觀環(huán)境下,作為新型內容生產方式的AIGC 技術,為行業(yè)轉型的落地提供了想象空間。

AIGC 是一種基于人工智能技術的自動化內容生成系統(tǒng),可以使用機器學習和自然語言處理(Natural Language Processing,NLP)等技術,學習和分析海量數據,讓計算機模擬人類的創(chuàng)造力和判斷力,自動生成符合人類需求的各種文本、圖像、音頻和視頻等多媒體內容。

AIGC 興起主要源于自然語言處理和擴散模型(Diffusion Model)的發(fā)展與開源。20世紀50年代,計算機科學家就開始嘗試使用計算機生成語言模型。隨著機器學習和深度學習等技術的不斷突破,AIGC 技術得到了快速的發(fā)展。

AIGC 是一次新技術革命,具有極強的普適性,可以改造和升級人類生產、生活的方方面面。它的發(fā)展分為3 個時期:醞釀萌芽階段(20 世紀50年代至90 年代中期)、穩(wěn)步推進階段(20 世紀90 年代中期至21 世紀第二個十年中期),以及迅猛發(fā)展階段(21 世紀第二個十年中期至今)。

在醞釀萌芽階段,AIGC 處于實驗室探索中。在穩(wěn)步推進階段,隨著算法的不斷優(yōu)化,AIGC 逐步出現在各式各樣的應用場景和商業(yè)模式中,在圖像、音樂、視頻等領域得到了廣泛應用。在迅猛發(fā)展階段,AIGC 開始與其他技術深度融合,如自然語言處理、計算機視覺、機器學習等,融合后,AIGC 更加全面,可以實現更復雜、更高級的內容生成和創(chuàng)作等。

艾瑞咨詢2023 年發(fā)布的《AIGC 系列報告——中國AIGC 產業(yè)全景報告》指出,內容生成與理解是大模型的核心能力,AIGC 的產業(yè)價值主要體現在以此為核心的“變革內容生產方式”與“變革人機交互方式”兩方面。大模型對內容理解和內容生成的雙向能力使AIGC 既能以極低門檻實現多模態(tài)內容生成,也可脫離內容生產核心場景泛化為一種人機對話的媒介。基于此種理解,AIGC 將實現內容創(chuàng)作權的下放,借助針對各垂直領域衍生的大量AI 生產工具,實現全行業(yè)內容生產效率的飛升。

AIGC 會引發(fā)內容行業(yè)巨變。2023 年9 月21 日,愛奇藝創(chuàng)始人、首席執(zhí)行官龔宇在“2023 愛奇藝iJOY 悅享會”上分享了他對行業(yè)的最新思考。在他看來,AI 在影視內容策劃、開發(fā)、制作以及宣發(fā)等方面將有重要的應用空間。其實,不僅在影視行業(yè),AIGC 還會在許多其他內容行業(yè)如編輯出版、新聞、設計等的生產端、分發(fā)端、產業(yè)端重構生產模式。

AIGC 可幫助教育行業(yè)突破傳統(tǒng)教育模式及人工生產效率的限制,實施個性化教學、智能輔導、自動化評估,構建在線學習平臺以及提供全面的管理。它的介入會提升教學效率和質量,實現個性化教育和精準教育,助力教育行業(yè)的數字化轉型和教學模式的變革。

AIGC 與金融業(yè)的結合也格外引人注目。目前,摩根士丹利、彭博、德意志銀行等都已有初具雛形的應用落地。有學者指出,AIGC 可以在金融行業(yè)中的客戶服務、產品創(chuàng)新、智慧辦公、研發(fā)管理、監(jiān)管合規(guī)知識庫建設和代碼開發(fā)等方面發(fā)揮作用。有了AIGC 的加持,金融行業(yè)將發(fā)生質的蛻變。

對網絡視聽行業(yè)而言,置身以內容分發(fā)平臺為核心的內容消費賽道,連接供應端的創(chuàng)作者和需求端的大量用戶,線上內容資源是最核心的生產力,創(chuàng)作者需要將內容質量保持在可持續(xù)吸引用戶注意力的水平。AIGC 主要影響的是內容創(chuàng)作與人機交互,線上化程度越高、內容占比越大的行業(yè),變革越深刻和廣泛。由此,它的入局對業(yè)態(tài)而言勢必是一場深刻的顛覆與變革。

語音合成技術進入有聲書行業(yè)

近年來,國內各大互聯(lián)網巨頭的發(fā)展軌跡都有一個“共性”:利用AI 技術賦能傳統(tǒng)行業(yè)。AI語音技術作為AIGC 的重要分支之一,被應用于傳統(tǒng)有聲書出版業(yè),為有聲書行業(yè)重塑生產流程、提高生產力提供了可能性。

AI 語音技術包括語音識別(Automatic Speech Recognition,ASR)、自然語言處理和語音合成(Text to Speech,TTS)等三大技術。其中,語音合成技術在有聲書行業(yè)的生產端已顯現出強大的生產力。

語音合成是將計算機自己產生的或外部輸入的文字信息轉變?yōu)榭谡Z輸出的技術。它涉及聲學、語言學、數字信號處理、計算機科學等多個學科,主攻如何將文字信息轉化為可聽的聲音信息,讓機器像人一樣開口說話。不同于錄音機式的聲音回放設備,語音合成是將任意文本轉換成具有高自然度的語音。

語音合成流水線包含文本前端(text frontend)、聲學模型(acoustic model)和聲碼器(vocoder)等3 個主要模塊。語音合成的流程是:通過文本前端模塊將原始文本轉換為字符/音素;通過聲學模型將字符/ 音素轉換為聲學特征,如線性頻譜圖、mel 頻譜圖、LPC特征等;通過聲碼器將聲學特征轉換為波形,最終合成語音。

隨著AI 的進步,神經網絡、深度學習等技術出現,“TTS+AI”的組合使得電子合成語音愈發(fā)自然和準確。針對情感起伏大、音色個性化、聲線多元、貼合人聲等更精細化的需求,目前已有AI 語音廠商提供“情感TTS”定制,旨在通過調整音色的語調、音高、語速,甚至模擬人類的生氣、傷心、高興等語氣,讓電子合成語音符合語境或場景,具有“情感”。

得益于互聯(lián)網技術發(fā)展與移動終端的普及,近年來,人們更青睞于“內化”的居家生活方式,有聲讀物市場呈爆發(fā)式增長。智研咨詢認為,2023 年中國有聲讀物市場規(guī)模有望突破100億元(見圖1)。

圖1 2015—2023 年中國有聲讀物行業(yè)市場規(guī)模

有聲書行業(yè)的傳統(tǒng)制作流程由人工手動操作。審聽音頻、拼接多名主播的人聲、制作后期墊樂等依靠純人工完成,僅20 萬字的讀物需要耗費近1 個月的時間才能完成制作。此外,有聲書行業(yè)存在大量重復勞動的工作,準入門檻低,從業(yè)人員多由利用閑散時間發(fā)展副業(yè)的兼職人員組成,內容裂變雖然增長迅速,優(yōu)質精品卻是鳳毛麟角,目前尚未形成行之有效、監(jiān)管有力的行業(yè)規(guī)范?,F存有聲書普遍存在制作流程周期長、成本高、質量不穩(wěn)定、水平良莠不齊的問題,傳統(tǒng)低效的制作方式很難滿足井噴式增長的有聲書市場需求。AI 入局,其內容創(chuàng)作方式與人機交互模式會充分發(fā)揮技術優(yōu)勢,為有聲書行業(yè)的轉型提供參考路徑。

首先,AI 音色具有高擬人度、高流暢度的特色。語音合成平臺能提供多樣化、個性化的音色,可模擬人在不同場景下的語氣、狀態(tài)與情感,在一定程度上媲美真人,其提供的大量音色素材,為有聲書創(chuàng)作奠定了技術基礎。

其次,有聲讀物的制作周期縮短。TTS 技術在短時間內將海量文本生成語音,極大地縮短了錄制時間。例如,在Reflect Audio 推出的有聲讀物制作平臺上,AI 主播的制作速度超過500 萬字/天。

最后,制作成本降低。用AI 代替真人,音色可從語音合成平臺提供的豐富音色中選擇,實實在在地省去了高昂的錄制費用,低廉的成本即可獲得一級主播的優(yōu)質聲音,實現高品質的創(chuàng)作。

“AI+有聲”新模式

在大量AI 生產工具的應用陸續(xù)落地的背景下,各類企業(yè)數字化語音廠商都在圍繞大模型尋找自身的優(yōu)勢空間與定位。在有聲書行業(yè)這一垂直領域內,涌現一大批在AI 語音發(fā)力的企業(yè),或能實現AI 語音生產的實際落地。

國內一家首創(chuàng)“AI+真人”混合錄制形式的企業(yè)——上海家瑤網絡科技有限公司的業(yè)務模式與成長路徑,或能為“AI+有聲”的應用層落地提供注腳。除利用“情感TTS”音色批量錄制有聲讀物之外,針對有聲書行業(yè)存在的核心痛點問題,公司獨立研發(fā)的AI 自動對軌、AI 輔助審聽的應用級產品“愛對軌”,借助行業(yè)領先的語音識別模型,實現了AI 全流程參與制作,由AI 自動完成繁復低效的操作,并輔助對音頻內容進行審校,“以看代聽”,極大地縮短了制作周期,提高了內容準確率。

AIGC 在內容消費領域引起了生產力變革,從技術到商業(yè)模式的路徑已全線打通,各類企業(yè)借助技術背景發(fā)揮自身優(yōu)勢,帶來的海量下游應用優(yōu)化將進一步釋放行業(yè)創(chuàng)作活力與創(chuàng)新力?!癆I+有聲”模式作為其中一個縮影,也將拓展有聲書行業(yè)市場規(guī)模,助力形成更加蓬勃發(fā)展的有聲書市場。

猜你喜歡
音色內容
內容回顧溫故知新
科學大眾(2022年11期)2022-06-21 09:20:52
內容回顧 溫故知新
科學大眾(2021年21期)2022-01-18 05:53:48
精雕細琢的外形與音色 Bowers & Wilkins(寶華韋健)805 D4
內容回顧溫故知新
科學大眾(2021年17期)2021-10-14 08:34:02
出人意表的音色與音質表現 Cambridge Audio劍橋|AXC25 CD機 AXA25合并放大器
擅長營造美好的音色 Marantz SA-10 S1/PM-10 S1
論長笛演奏的音色變化
北方音樂(2017年4期)2017-05-04 03:40:10
從輝煌到柔美——七彩音色之西方管樂篇
學與玩(2017年6期)2017-02-16 07:07:16
主要內容
臺聲(2016年2期)2016-09-16 01:06:53
有一個音色
遼河(2004年4期)2004-04-29 00:44:03
主站蜘蛛池模板: 午夜日韩久久影院| 91香蕉视频下载网站| 狠狠五月天中文字幕| 国产在线视频自拍| 91精品啪在线观看国产91九色| 五月婷婷综合色| 97精品久久久大香线焦| 伊人激情综合网| 国产成人精品优优av| 色欲综合久久中文字幕网| 亚洲人成亚洲精品| 日韩a级毛片| 毛片免费在线视频| 国产又色又爽又黄| 免费啪啪网址| 制服丝袜 91视频| 日本国产精品| 中文无码伦av中文字幕| av一区二区三区高清久久| 尤物精品视频一区二区三区| 91在线精品麻豆欧美在线| 无码人妻免费| 精品三级在线| 日韩在线播放中文字幕| 国产日韩丝袜一二三区| 亚洲AV无码乱码在线观看裸奔 | 在线视频精品一区| 青青青国产免费线在| 成人伊人色一区二区三区| 国产在线视频自拍| 欧美成人精品一级在线观看| 小说 亚洲 无码 精品| 99爱视频精品免视看| 成年看免费观看视频拍拍| 亚洲制服丝袜第一页| 国产精品永久在线| 欧亚日韩Av| 国产精品va| 欧美精品亚洲精品日韩专区va| 91无码人妻精品一区二区蜜桃| 一本无码在线观看| 精品少妇人妻无码久久| 性视频一区| 国产成人精品无码一区二| 91成人在线观看| 91在线日韩在线播放| 亚洲成aⅴ人在线观看| 亚洲无线观看| 青草视频免费在线观看| 伊人色综合久久天天| 久久99这里精品8国产| 伊人色综合久久天天| 久久国产精品娇妻素人| 在线中文字幕日韩| 最新国产高清在线| 免费观看精品视频999| 一级毛片免费的| 午夜激情福利视频| 国产精品专区第一页在线观看| 欧美影院久久| 成人中文在线| 国产肉感大码AV无码| 理论片一区| 四虎影视永久在线精品| www中文字幕在线观看| 欧美精品高清| 日韩精品欧美国产在线| 欧美一级黄色影院| 男女性午夜福利网站| 毛片久久久| 99久久国产综合精品2023| 免费xxxxx在线观看网站| 青青青国产视频| 五月天丁香婷婷综合久久| 精品人妻AV区| 亚洲啪啪网| 五月激情综合网| 亚洲无码精品在线播放| 国产在线无码av完整版在线观看| 国产在线97| 国产精品大白天新婚身材| 真实国产乱子伦高清|