OpenAI公司3月29日最新推出了一項名為“語音引擎”的人工智能工具,其僅憑一段15秒的聲音樣本,便能夠精準模仿出該人的聲音,讓它以一種“情感和現實”的方式讀出喜歡的任何文本。OpenAI發布的剪輯聽起來令人印象深刻,盡管它們有輕微生硬的機器人痕跡。
“語音引擎”展示了一些已經開始應用的例子。如生成更自然、更富有情感的聲音;將視頻內容翻譯成多種語言,以拓寬其全球受眾范圍。這項技術的一大特色是,在翻譯過程中能夠保留演講者原有的口音特征,為翻譯增添了更多真實感和個性化色彩。
“語音引擎”還可為語言障礙者提供支持,例如開發針對語言障礙者的治療應用,為有特殊學習需求的人提供教育輔助,使用戶能選擇最能體現其個性的聲音,并且對那些使用多種語言的用戶,保持在各種語言中聲音的一致性。“語音引擎”使用一位年輕患者之前為學校項目錄制的視頻音頻,成功恢復了她因血管性腦瘤而失去的流暢語言能力。
“語音引擎”目前僅處于有限測試階段,主要原因是擔心被濫用。
(摘自《科技日報》)