弱矩條件下的誤差估計

2021-09-08 00:59:58黃收友范凱旋黃冠利

湖北師范大學學報(自然科學版) 2021年3期

關鍵詞：理論

黃收友，范凱旋，黃冠利

(1.湖北師范大學數學與統計學院，湖北黃石 435002；2.北京電子科技職業學院基礎學院數學部，北京 100176)

0 引言

在過去的幾十年里, 人工智能得到了快速發展, 已經成為許多國家大力發展的方向。伴隨著人工智能的飛速發展，數據也呈指數級增長。而面對這樣的大數據，經典的方法或者數據庫在獲取和存儲數據等方面變得捉襟見肘，發展行之有效的方法已成必然。另外，大數據又很容易被異常值污染, 或者含有重尾分布的變量等等，這些使得許多傳統的方法都不適用。例如：受異常值或非高斯分布的噪聲影響, 經典的最小二乘法[1,2]很容易產生較大偏差。

自從 Huber[3]提出穩健估計以來，已經有許多這方面的工作。文獻[4]介紹了參數模型的穩健估計理論，并將其應用到實際中。Sun[5]等人近期提出了自適應 Huber 回歸估計。在弱矩條件下，他們建立了回歸參數的相位平移的穩健估計，并通過仿真證明了該方法的有效性。需要特別指出的是：在弱矩條件下，文獻[6]考慮了誤差熵最小化算法的點對學習問題。不僅論證了算法的相合性，而且證得最優收斂率。此外，Huang[7]等人研究了基于Huber損失函數的穩健學習問題。

盡管關于指數損失函數的文獻已有一些，例如：Middleton[8,9]將指數損失函數應用到通信理論中。基于指數損失函數， Deutsch[10]研究了在非高斯噪聲情況下的通信理論，但目前尚未發現有人研究在弱矩條件1+α階下的穩健學習問題，為此本文將進行這方面的研究。

1 準備知識

在統計學習理論框架下，通常假設隨機變量X取值于輸入空間Θ，隨機變量Y取值于輸出空間

假設1 (弱矩條件) 存在一個常數α>0，使得

本文將基于加性噪聲模型

Y=f*(X)+ξ

假設2 不失一般性，令M=max{‖f*‖∞，supf∈H‖f‖∞,1}<∞對任意f∈H以及目標函數f*，則有

(1)

其中H為假設空間，在統計學習理論中通常選取再生核希爾伯特空間。假設2表明f以及目標函數f*是有界的，這是由于在統計機器學習中，通常采用小樣本學習。該假設條件也是統計學習理論中經典假設條件。我們的目的在于：通過樣本去學習一個定義在假設空間H上的函數，使其能很好地逼近回歸函數f*(X).這個函數就是經驗目標函數，即

其中L(yi-f(xi))為經驗損失函數。εz(f)為經驗誤差，其相應的泛化誤差為

ε(f)=EL(Y-f(X))

在經典的回歸分析中，我們常常利用最小平方誤差來刻畫，此時的經驗目標函數

眾所周知，對于高斯噪聲，fz是最優的。然而在現實問題中，樣本點易受離異值或者重尾噪聲干擾，經典的最小二乘回歸容易產生較大偏差，因此本文選用一個更穩健的方法來代替經典的最小二乘法，我們定義穩健的經驗風險最小函數

其中σ是調節參數且大于零，指數損失函數為

其中K>0.取K=2σ2，當σ充分大時，利用泰勒公式展開可知,

Lσ(y-f(x))≈L(y-f(x))

進而可知，其相應的穩健泛化誤差為

εσ(f)=ELσ(Y-F(X)).

引理1 若f(x)是定義在Θ上的有界函數，f*(x)是回歸函數，則有

證一方面，由平方差公式可得

(y-f(x))2-(y-f*(x))2=2y(f*(x)-f(x))+(f(x))2-(f*(x))2