余明火



摘要:語聲、圖像賦能電視感知的多樣化,屏幕發聲技術賦能電視多形態的立體聲設計,而智慧電視的發展需要電視具有更豐富、以用戶為中心的智慧能力,其中基于感知的音質智慧能力是視聽產品最重要的智慧能力之一。提出一種基于用戶定位的電視立體聲系統設計,詳細闡述了系統工作原理,重點介紹了語聲定位、云臺攝像頭定位等關鍵技術,該系統方案極大提升了大尺寸超高清電視的沉浸式語聲體驗,整體效益好,現已應用于具有傳聲器陣列、云臺攝像頭的屏幕發聲電視。
關鍵詞:用戶定位;云臺攝像頭;語聲;立體聲;智慧電視
中圖分類號:TN949.1;TN912.2 文獻標識碼:A
0 引言
2019 年以前,語聲交互是電視的主要感知方式[1],隨著榮耀終端有限公司發布了帶有內置攝像頭的智慧屏,電視帶攝像頭、具有“看”感知能力成為電視發展新方向,語聲能力、攝像頭圖像采集能力僅僅是電視機感知能力的基礎,語音、圖像的交互促進了電視智慧化程度的逐步提升[2]。電視機作為視聽產品,音畫、互動才能給用戶直觀的體驗,在提升電視畫質方面催生了各種以感知為基礎的畫質增強算法,如基于環境光的圖像調節[3];在提升音質方面,杜比、多聲道等聲音技術都已應用于電視[4]。雖然電視面板不斷發展,多聲道的屏幕發聲電視相繼推出[5],但總體音質智慧能力仍有提升空間。
本文提出了一種基于用戶定位的電視立體聲系統設計,以用戶為中心,通過語聲采集傳聲器、攝像頭采集電視機前用戶的位置,利用算法實現用戶定位。在聲音系統設計方面,設計立體聲屏幕發聲單元,基于用戶定位控制發聲單元邏輯,實現以用戶為中心的沉浸式語聲體驗。
1 系統原理
如圖1 所示,基于用戶定位的智慧電視立體聲系統主要包括用戶定位、立體聲設計、電源管理、電視系統等。其中,用戶定位包括語聲定位、圖像定位,語聲定位由傳聲器陣列、集成于電視芯片內部的聲音處理、聲音定位算法組成。該傳聲器陣列采用線性傳聲器陣列模塊和防反射收音管道設計工藝,隱藏于電視機內部,滿足電視應用環境的高識別率和喚醒率。圖像定位由攝像頭、實現攝像頭大屏全覆蓋的機械結構、集成于電視芯片內部的圖像處理單元、圖像定位算法組成。攝像頭具有云臺結構,可內置于電視機,隱藏式攝像頭使用兩軸云臺技術,實現云臺攝像頭自由升降、水平和垂直旋轉,全面覆蓋大屏使用區域,在保護用戶隱私的同時保證整機外觀完整性。立體聲設計包括語聲源、操作系統內核中央處理器(central processing unit,CPU)、數字語聲輸出、功放、喇叭、顯示屏,其中喇叭安裝設計在顯示屏的背板,該顯示屏具有柔性結構,如有機發光二極管(organic light-emittingdiode,OLED)顯示屏。電視系統包括除用戶定位、立體聲設計、電源管理之外構成電視的系統。本文設計的系統在大屏電視上應用效果顯著。
當系統工作時,傳聲器陣列采集電視機前用戶的聲音,系統根據聲音,并且通過定位算法計算用戶在電視傳聲器前的水平相對方位。根據傳聲器陣列和揚聲器陣列之間的位置關系,計算用戶和揚聲器之間的方位關系。而當內置于電視結構的云臺攝像頭處于激活狀態時,云臺攝像頭實現垂直方向升降,用戶無發聲狀態,攝像頭采集電視前的畫面,通過人體識別、云臺機械機構水平轉向角度,計算用戶在電視機前的相對位置以及用戶和揚聲器的方位關系。確定好用戶位置后,通過對各通道語聲輸出信息增加時延算法,使得電視的揚聲器聲音在用戶位置實現同相位干涉增強。
2 關鍵技術
基于用戶定位的電視立體聲系統采用的關鍵技術主要有語聲定位技術、云臺攝像頭定位技術等。如圖2 所示,內置攝像頭、傳聲器陣列、喇叭等重要模塊在電視系統結構中有序分布,其中內置攝像頭采用隱藏式設計結構,安裝在電視機的中間頂部;喇叭設計于屏幕發聲單元的背面;顯示屏具有柔性結構,可實現屏幕發聲;傳聲器陣列多設計在電視機的下邊緣結構件內。
2.1 語聲定位技術
語聲定位技術包括硬件系統設計和軟件算法設計。硬件系統設計至少2 個傳聲器陣列模組,為適應電視機大尺寸的特點,傳聲器陣列多采用4 個傳聲器結構。本文基于語聲的定位算法將采用四麥陣列模組,傳聲器采用適用于電視的線性傳聲器陣列模塊及防反射收音管道設計工藝[6]。
軟件算法設計則基于用戶與傳聲器方位,用戶與傳聲器陣列相對位置示意圖如圖3 所示。