來 毅**,2,辛可嘉,劉 穎
(1.西安郵電大學(xué) 通信與信息工程學(xué)院,西安 710121;2.中國科學(xué)院 光譜成像技術(shù)重點實驗室,西安 710119)
隨著視頻采集設(shè)備的廣泛應(yīng)用,視頻數(shù)量呈爆炸性增長,如何快速有效地從海量視頻數(shù)據(jù)中找到用戶感興趣的視頻內(nèi)容,是視頻深度應(yīng)用中急需解決的主要難題之一[1]。鏡頭是指視頻中兩個剪接點之間的片段,即沒有場景變化的一段連續(xù)畫面,其內(nèi)容通常具有很高的相似性。鏡頭變換有突變和漸變兩種類型。突變時,鏡頭直接切換到下一個鏡頭,視頻內(nèi)容差異明顯,易于檢測。漸變則是前一個鏡頭的尾幀緩慢地被下一個鏡頭的首幀所代替,是一個持續(xù)多幀的變化過程。漸變時幀間差異變化緩慢,致使?jié)u變鏡頭難以準(zhǔn)確檢出,導(dǎo)致漸變鏡頭漏檢。鏡頭分割,又稱鏡頭邊界檢測,其目的是準(zhǔn)確找出視頻序列中相鄰兩個鏡頭的邊界。鏡頭分割對于視頻檢索、快速瀏覽和高效壓縮等多種應(yīng)用具有重要研究意義和實際應(yīng)用價值[2]。
國內(nèi)外許多學(xué)者對鏡頭分割技術(shù)進行了大量探索和研究,在這方面已取得了不錯的成績,提出了不少關(guān)于視頻鏡頭分割的算法[3-14]。Gao等[8]實現(xiàn)了一種新聞視頻解析系統(tǒng),該系統(tǒng)包含兩個重要內(nèi)容:一是通過無人值守的模糊c均值聚類算法來檢測鏡頭邊界,實現(xiàn)新聞視頻的鏡頭分割;二是利用Graph-Theoretical聚類分析算法,將新聞視頻鏡頭劃分為新聞消息鏡頭和節(jié)目主持人預(yù)告鏡頭。Biswas等[9]聯(lián)合局部相似度和全局特征,采用矩陣余弦相似度的方法檢測鏡頭邊界?!?br>