1.北京信息科技大學 中文信息處理研究中心,北京 100101
2.北京拓爾思信息技術股份有限公司,北京 100101
1.北京信息科技大學 中文信息處理研究中心,北京 100101
2.北京拓爾思信息技術股份有限公司,北京 100101
視頻是一種非結構化、大信息量的數據,基于文本檢索的傳統方法人力財力耗費巨大,并且視頻內容受個體主觀因素影響較大,因而基于內容的視頻檢索(Content Based Video Retrieve,CBVR)成為研究熱點。鏡頭檢測是將隨時間變化的圖像流分割出內容不同的一個個鏡頭,是CBVR的基礎,直接影響到檢索結果的準確性。鏡頭檢測(即鏡頭的邊界檢測),通過比較視頻幀的幀間差異,尋找鏡頭的邊界變化。
對鏡頭進行檢測,首先要解決的問題是何為一個鏡頭。一個鏡頭是由一個攝像機連續拍攝得到的時間上連續的若干幀圖組成[1]。
鏡頭檢測,是根據視頻中圖像的內容特征差異來區分,不同的鏡頭其圖像視覺內容也不同,從而其圖像特征也會不同。因此,鏡頭檢測的效果很重要一部分是依賴于特征的選擇,在選擇檢測特征時需注意:(1)應該體現出幀間的視覺差異;(2)對攝像機、物體運動有一定的魯棒性;(3)能有效克服或消除光照變化對檢測結果的影響。
文獻[2]采用直方圖變換率HCR(Histogram Change Ratio)法,其對單一的使用直方圖的方法進行了改進,仍然沒有考慮像素的位置信息,其效果也是有限的。文獻[3]將小波與神經網絡結合進直方圖的方法,其運算量太大,對性能的限制大。文獻[4]使用了SVM進行鏡頭檢測,其也是用了HSV的顏色統計特征,也沒有用像素的位置信息特征;……