李 勇,梁志貞,夏士雄
LI Yong,LIANG Zhizhen,XIA Shixiong
中國礦業大學 計算機科學與技術學院,江蘇 徐州 221116
School of Computer Science and Technology,China University of Mining and Technology,Xuzhou,Jiangsu 221116,China
在大規模的數據分析問題中,高維的特征向量會造成高維協方差矩陣奇異性問題,從而使問題的解決變得困難,因此降維是非常重要的。要求它在不降低性能表現的前提下,通過降低特征向量的維數來簡化問題。主成分分析(PCA)[1]就是一種常用的降維方法,它常用一組向量來最大限度地表示所給的數據。這些向量組成了一個低維的線性子空間,通過這個子空間,可以有效地獲取原始輸入空間中的數據的內在結構。
由于PCA是基于圖像向量的方法,所以它在降低特征維數時,比不上直接基于兩維圖像矩陣的方法方便。1993年Liu等人提出利用數字圖像矩陣直接構造圖像散布矩陣,并在此基礎上進行鑒別分析的新方法[2];2003年Yang改進了Liu的方法[3],得到一種具有統計不相關性的圖像投影鑒別分析方法;2004年Yang等人[4]將文獻[3]的方法用于圖像重構,取得了很好的效果。
由于在PCA和2DPCA[4]中的目標函數都運用了L2范數,所以異常值的出現會因L2范數的使用而被擴大,所以這種方法對異常值較敏感。為了減輕這個問題的影響并且取得更好的穩定性,許多人做了相關的研究[5-9],在文獻[7]中,改進了以往的L1-PCA算法,并取得了不錯的效果。在文獻[8]中,改進了基于L2范數的傳統的2DPCA,提出了基于L1范數的2DPCA(2DPCA-L1)方法。
本文對2DPCA-L1方法進行了改進和推廣,提出了基于L1范數且受Lp范數約束的2DPCA方法(2DPCA-Lp),其主要思路是直接對圖像矩陣進行操作,目標函數仍采用L1范數,而在求投影向量時,使用Lp范數進行約束。……