王艷坤
(國家知識產權局專利局電學部,北京 100088)
智能電視是傳統電視與各種新技術結合產生的。智能電視可以定義為具有操作系統,可以為第三方應用提供功能擴展,能夠實現多網絡接入,具備人機交互功能的電視。當前階段,智能電視具備電視點播、搜索、應用商店以及個性化智能推薦等人機交互體驗。
智能電視人機交互是指用戶在觀看電視或者使用第三方應用時,通過智能遙控設備或者電視機的人機交互模塊進行的信息交換與操作過程。
隨著計算機技術、通信技術的快速發展,人機交互技術逐漸成為智能電視行業發展的重要分支。現階段,智能電視人機交互包括智能遙控、語音識別、姿勢和手勢識別以及人臉識別等分支技術[1]。
調查數據顯示,2005年之前,我國智能電視人機交互技術專利的申請量遠遠落后于美國、韓國、日本等國家。但是從2008年開始,我國在該領域的專利申請量快速增加。根據中國專利全文庫(CNTXT)檢索的結果,截止2022年8月,在國家知識產權局提交的有關智能電視的專利申請共53 472件,其中智能電視的人機交互技術占27 137件,在智能電視技術發展中占有50.7%的比例。其中,中國占有22 464件發明專利,美國占2 908件,韓國占553件。中國、美國在該領域引領全球技術發展,韓國、開曼、日本等緊隨其后。世界各國在中國智能電視人機交互領域的專利申請數量如圖1所示。

圖1 世界各國在中國申請智能電視人機交互領域的專利申請數量圖
我國智能電視人機交互領域的專利申請量從2011年開始逐年大批量增多,尤其是2020年、2021年,申請量更是成倍增長。專利申請布局主要集中在H04N、G06F、G06K等領域,如圖2所示。H04N、G06F、G06K屬于國際專利分類表IPC分類號。H04N領域涉及圖像通信信號的處理,G06F領域涉及電數字數據處理,包括數據的輸入、輸出、功能器件之間的交互,信號的識別、轉換、錯誤檢測及監控等;G06K領域涉及圖形數據讀取,圖像或視頻識別和理解等。以騰訊、華為、海信、小米、百度、長虹、TCL等為代表的中國企業積極在這些領域研發和布局,不斷發展、創新,領跑世界智能電視產業,并仍然在不斷地進步與提高,擁有巨大的 潛力[2]。

圖2 智能電視人機交互技術專利申請趨勢圖
3.2.1 智能遙控
隨著全球第一款智能電視的問世,傳統的紅外線遙控器已滿足不了智能電視的功能需求,智能遙控因此產生。智能遙控器包括簡化版遙控器和多功能版遙控器[3]。
(1)簡化版遙控器。簡化版遙控器可以使用戶通過簡單的按鍵操作便能實現智能遙控。簡化版遙控器的設計更多地考慮了用戶的思維習慣和操作習慣,以人機工程學設計原理為基礎,對遙控器的大小、布局以及與電視進行信息通信等方面進行優化。
(2)多功能版遙控器。多功能版遙控器既能實現簡化版遙控器的功能,又能實現空間操控、語音遙控及觸摸操控等功能。多功能版遙控器的空間操控主要運用在智能電視娛樂健身功能中,通過控制遙控器在空間移動,實現遙控光標的自由移動。多功能版遙控器的語音遙控是指用戶通過遙控器上設置的語音識別模塊,將用戶語音指令轉換為電視能夠理解的操作指令,從而實現相應的操控功能。多功能版遙控器的觸摸操控是指用戶通過遙控器上的觸摸屏,操控電視屏幕上光標的移動并選擇相關功能菜單。
國外企業在智能電視人機交互的智能遙控領域的研究和發展先于我國,且較早地進行了專利布局[4]。但是我國在該領域快速發展、成熟,專利申請趨向穩定,專利布局逐漸趨向完善,涵蓋技術面廣。我國的專利申請布局主要集中在國際專利分類表IPC分類的H04N、G06F、G06K等領域,多功能遙控技術在智能電視人機交互專利中占有相當大的比重。當前,為了進一步完善智能電視的使用功能,提高用戶體驗,專利申請布局中對遙控器的改進包括觸摸屏觸控操作準確度,麥克語音識別及時性及準確度,增加鍵盤、鼠標模塊以獲取空間操控功能,以及上述多種功能組件的組合模式。遙控器技術專利申請趨勢如圖3所示。

圖3 遙控器技術專利申請趨勢圖
3.2.2 語音識別
智能電視的語音識別是指將用戶的操控指令以語音的形式發送給智能電視,智能電視對該語音指令進行理解并執行相應操作[5]。
國外企業在智能電視語音識別領域的研究和應用先于我國,且較早地開始專利布局。美國、日本、韓國等國在該領域申請了大量的專利。
從2010年之后,我國的智能電視語音識別技術進入快速發展階段,在該領域的專利申請一直是我國企業布局的重點,每年的專利申請量都很大,主要集中在國際專利分類表IPC分類的H04N、G06F、G06K等領域,具體如圖4所示,涉及語音信號的傳輸和接收、識別精度等方面的改進。該領域專利申請技術的發展方向主要包括如何提高自然語言識別的精度,如何提高語音識別的完整性,音頻信號的降噪處理以及語音模型的改進等多樣化的需求。

圖4 語音識別技術專利申請趨勢圖
3.2.3 姿勢和手勢識別
智能電視的姿勢識別是指通過智能電視設置的攝像頭,攝取用戶肢體實時視頻或圖像,通過數學算法或神經網絡學習模型對視頻圖像信息及空間數據進行學習和判斷,以識別用戶意圖來控制智能電視的相關操作。智能電視的姿勢識別包括靜態識別和動態識別,不僅可以識別用戶人體的整體,也可以識別人體的一部分。姿勢識別易受所處環境的影響,包括空間和光線等因素。因此,姿勢識別的算法、學習模型以及識別準確性是其發展和布局的主要方向[6]。
智能電視的手勢識別是指智能電視對用戶的手或/與胳膊相結合而產生的動作的識別進而控制智能電視的操作,包括靜態手勢識別和動態手勢識別。其與姿勢識別的不同之處僅在于識別的對象為手勢,其也易受所處環境的影響[7]。
美國、日本、韓國等國企業在該領域的專利布局較早,但逐漸被我國企業趕超。從2010年開始,我國企業有關姿勢和手勢識別的專利申請量逐年遞增。姿勢和手勢識別逐漸成為我國企業在智能電視行業中專利布局的重點領域,主要集中在國際專利分類表IPC分類的G06F領域,具體如圖5所示。在該領域,專利申請技術方案的發展方向主要包括如何對姿勢和手勢跟蹤定位,如何對背景信號降噪,姿勢和手勢與人臉識別的融合等多樣化的需求。

圖5 姿勢和手勢識別技術分類號分析圖
3.2.4 人臉識別
智能電視的人臉識別是指智能電視基于數學算法或神經網絡模型對人臉視覺特征信息進行分析比較,以進行相應的智能操控。智能電視的人臉識別包括人臉的檢測、面部表情或特征的定位以及與人臉數據庫的比對。智能電視的人臉識別的發展主要經歷了人臉特征的自動識別階段,數學算法或模型的改進階段以及外界因素影響的魯棒性提高階段[8-9]。
隨著我國企業專利保護意識的提高,在該領域的專利申請量已逐漸超過了國外企業。從2011年開始,有關人臉識別技術的專利申請量逐年遞增,人臉識別技術也逐步成熟和完善[10-11]。我國企業在該領域的專利布局集中在國際專利分類表IPC分類的G06K、G06F、H04N等領域方向,具體如圖6所示。目前,人臉識別技術改進方向主要有:

圖6 人臉識別技術專利申請趨勢圖
(1)為提高時效性,對人臉識別所運用的神經網絡模型算法的改進;
(2)如何減少人臉識別過程中外部因素諸如光照條件以及人臉上的胡須、頭發等影響,以提高識別精度;
(3)人臉上的眼睛視線焦點、嘴巴開閉程度、各種表情情緒的精確識別及智能化推薦。
根據中國專利全文庫(CNTXT)檢索的結果可以發現,隨著計算機和通信技術的進步,在用戶體驗需求不斷提升的情況下,尤其是隨著智能電視顯示屏的功能更加全面,應用的場景更加多變,在不同場景中能夠選擇的顯示屏的尺寸也更多樣化的情況下,面對大尺寸顯示屏如超過86寸的會議白板等,智能電視人機交互技術將呈現多功能遙控、語音、體感、人臉識別相結合的多模式交互方式,如語音、臉部表情、嘴唇開啟閉合程度及相關動作、手及與胳膊結合的動作、肢體姿勢等,以充分理解用戶意圖,執行指令操作。
在我國智能電視領域興起之前,美國的蘋果、谷歌、微軟,韓國的三星、LG,日本的索尼、松下等公司已經完成了智能電視上游技術領域的專利布局。面對當前國際貿易存在的很大不確定因素以及復雜的國際知識產權環境,以騰訊、華為、海信、小米、百度、長虹、TCL等為代表的中國企業需要合理運用知識產權制度,從自身技術優勢出發,進行智能電視人機交互領域的專利布局分析,梳理智能電視領域的全球發展脈絡,把握機會,提升自身競爭力,在知識產權強國建設政策激勵下,全面提升知識產權創造、運用和保護,創建中國智能電視的自有技術生態。