陳濤
(中國傳媒大學數據科學與智能媒體學院,北京 100024)
系統分析和預測的主要目標是通過分析觀測到的系統行為數據,建立數學模型。一旦確定了數學模型,則可以運用相應的數學理論分析工具和數值計算方法探究模型的性質,從而描述系統的變化規律,預測系統發展趨勢。在一些發展成熟的學科,比如物理學,描述系統變化規律的數學模型是基于已經被透徹理解的物理機制而建立的,模型中的參數可以通過第一性原理求解或者直接測量得到[1]。然而,在當前很多學科中的系統問題中,比如社會系統,經濟系統和傳播系統等,系統運行的機制和傳播規律并沒有被人們所充分理解,此時建立的數學模型中含有的未知參數并不能通過第一性原理或測量得到。因此,需要從觀測數據中估計出數學模型中的未知參數。
微分方程是一類廣泛用于描述系統變量隨時間變化的數學模型,被廣泛應用于很多學科。考慮采用微分方程描述系統的變化規律:
其中x是系統變量,一般觀察系統變量隨時間的變化,因此自變量是時間變量t。符號α代表一個參數集,表示模型中的待定參數。灰色系統理論[1]創始人鄧聚龍教授(1982)指出,社會系統,經濟系統等均可視為廣義的能量系統,而能量的積累和釋放一般遵循指數規律[9]。指數函數在微分算子的作用下是關于自身的線性函數,即設f=ax+b,則可以得到最基本的灰色預測GM(1,1)模型[4]:
該模型的參數集α={a,b} 含有兩個待定參數。希望通過系統的觀測數據,來估計模型的未知參數a和b。使用傳統的統計方法比如極大似然估計[5],貝葉斯方法[6],或者現代的神經網絡[7],機器學習方法[8]做模型的參數估計時,都需要大量的樣本數據。和這些方法不同,灰色系統理論主要是分析和求解由于信息不完全和不準確而導致的不確定性問題,其最顯著的特征是小樣本數據建模[9]。灰色系統理論的一個基本準則是充分開發和利用現有的數據,從而發現更多隱藏在數據背后的系統規律[10]。
當今的移動互聯網上每天產生海量的數據。我們可以獲得數目巨大的樣本,但是用于建模的觀測變量卻很少,因為系統通常只記錄了樣本在什么時間,什么位置,做了什么事。并且這些數據也只是記錄了用戶的行為,而至于用戶為什么這么做?動機在哪?這些變量很難測量[11]。由于缺乏這方面的建模數據,導致部分信息明確,而部分信息不明確,屬于灰色系統[9]。此外,獲得的觀測數據存在誤差[11],尤其是生成式智能機器人的出現,導致互聯網上大量的非人為信息出現,并非真實體現人類樣本的行為。這些問題給建模帶來了很大的困難。
鄧聚龍教授(1984)提出了累加生成算子(AGO)[3][4],它是一種作用在數據序列的算子,有兩個目的:首先,它為建模提供中間數據;其次,它將原有隨機序列的隨機性加以弱化。對于非負數據序列,通過適當的累加生成后,得到的累加序列已由隨機變為非隨機,服從指數法則,可以通過微分方程模型進行擬合。累加生成算子已經成為很多灰色模型的建模的必要過程[12]。
累加生成算子可以連續多次作用于數據序列,自然產生高階累加生成算子的概念,比如累加生成算子連續作用m次相當于m階累加生成算子,即m-AGO,m∈?自然數集。在很多灰色模型中,累加生成算子的階數是一個很重要的參數。關于累加生成算子的階數已有大量的研究。吳利豐等(2015)提出了分數階累加生成算子,其中p,q∈?+正整數集[13][14]。本質上分數屬于有理數。曾波和孟偉等(2016)將累加生成算子的階數推廣到任意實數階,即r-AGO,r∈?實數集[15][16]。吳正鵬等(2016)將累加生成算子的階數推廣到頻率域,即z-AGO,z∈?復數集,這是累加生成算子階數最一般的結果,因為復數域是目前已知的最廣的數域[17][18][19]。以上提到的工作都有一個共同特點,它們都是通過代數求和的方式構造累加生成算子。最近有一些工作是從新的途徑研究累加算子,肖新平和毛樹華(2016)發展了以矩陣形式表示累加生成算子[20]。韋保磊和謝乃明等(2020)引入積分匹配法解釋累加生成算子的機制[21]。林長海等(2021)引入信號處理領域的頻譜分析方法研究累加生成算子在頻率域中的形式[22]。本文的主要工作是,采用數據序列的卷積運算構造累加生成算子相應的卷積序列,從而通過數據序列的卷積運算實現累加生成。
本文結構:第2 部分主要介紹數據序列卷積運算的定義并通過卷積定義累加生成,引入單邊Z 變換將累加生成卷積序列變換到頻率域上。第3 部分,基于卷積定義逆累加生成算子。第4部分,從三種視角,算子的角度、卷積序列的角度和頻率域的角度,討論累加生成算子和逆累加生成算子的互逆關系。第5部分通過實際案例驗證理論的正確性和方法的有效性。
本節引進數據序列的卷積運算來定義累加生成算子。采用小寫字母“ago”表示累加生成算子和累加生成卷積序列。傳統的累加生成算子的定義如下:
下面,引入數據序列的卷積運算,然后通過卷積重新定義累加生成算子。
引理2.1 表明單位脈沖序列對于任何序列具有卷積不變性,從而它在卷積運算中,扮演著單位元素的角色,即可以認為δ[n]=I[n]。如果序列和其它數據序列做卷積不會改變數據序列的結果,那么稱為卷積單位元素,即x[n]?I[n]=I[n]?x[n]=x[n]。
通過以上定義,給出關于累加生成算子在卷積運算中的具體形式,即找到一個序列,任何其他序列和它做卷積,相當于做了累加的結果。
證明:由定義2.2,可得:
對比(7)式,則得結論(8)。
定義1.4 同一序列多次重復卷積稱為卷積冪:
由定義2.4,式可重新寫為卷積冪級數的形式:
接下來,引進單邊Z 變換(SSZT)將累加生成卷積序列變換到頻率域,分析它在頻率域的性質。首先可以把有限長的數據序列延拓到無限長的序列。通常有兩種延拓方式,一種是周期延拓,另一種是零延拓。本文考慮零延拓,即直接在原數據序列的基礎上直接補零。
其中,z=rejθ為復變量,r=|z|為模,θ=Arg(z)為輻角。
引理2.2 單位脈沖序列的單邊Z變換為:
證明:由單邊Z變換的定義,可得:
證明:由單邊Z變換的定義,可得:
由引理2.2和引理2.3,可得:
證明:由單邊Z變換的定義,可得:
評注:公式(18)是無窮的幾何級數,其收斂域是|z-1| <1,即|z| >1,其收斂的結果為:
這個結論和單位階躍序列u[n]的單邊Z 變換結果一致:
本節將基于序列卷積運算給出逆累加生成算子的定義。首先從逆累加生成算子出發。
以下定理通過序列卷積運算給出了逆累加生成算子的定義。
證明:由序列卷積運算的定義,可得:
對比(24)式和(22)式,可得結論(23)式。
從定理3.1,可以推導出逆累加生成卷積序列的具體形式如下:
評注:逆累加生成卷積序列具體形式如下:
證明:由單邊Z變換的定義,可得:
從定義2.1 和定義3.1,可知累加生成算子和逆累加生成算子相互之間是互為逆算子的關系:
從這個角度來看,可得:
那么,重新使用卷積定義的累加生成算子是否繼續保持這種互逆的關系,或者更進一步,這種互逆關系在卷積運算下會變成什么樣的形式,下面給出相關定理。
從引理2.1,單位脈沖序列δ[n]對任何序列保持了卷積不變性,相當于卷積運算中的單位元素,即δ[n]=I[n]。因此,可以定義類似于公式(30)的互逆的卷積序列。
根據卷積滿足交換律:
從而公式(34)成立。
證明:從定理2.2,可得:
從定理2.2,可得:
然后,將公式(36)和(37)相乘可得結論。
評注:現在至少有三個觀點看待累加生成算子的互逆關系:
第一,從序列的算子的觀點看,由定義2.1 和定義3.1,可得累加生成算子ago()和逆累加生成算子iago()之間的互逆關系,即:
這里“?”應該理解為算子的復合操作,而算子中的單位元素應該理解為單位算子I。
第二,從算子對應的卷積序列來看,由定義2.2 和定義3.2,可得累加生成卷積序列和逆累加生成卷積序列之間的互逆關系,即:
其中“?”是卷積運算,而卷積序列中的單位元素變成了單位脈沖序列。
第三,從單邊Z變換的觀點看,由定理4.2,可得累加生成卷積序列的單邊Z 變換AGO[z]和逆累加生成卷積序列的單邊Z 變換IAGO[z]之間的互逆關系,即:
此處“?”為普通的復數乘法,而復數中的單位元素退化為數1。
根據公式(4),可得:
計算兩個序列的卷積結果并和傳統的逆累加生成算子的結果進行比較。
根據公式,可得:
根據公式(4),設:
因此,累加生成卷積序列和逆累加生成卷積序列之間的互逆關系得到了驗證。
例4.設原始數據{x[n]}為1985-2021 年世界發總電量(單位:Terawatt-hours),數據見表1和圖1。數據來自2022年七月發布的BP世界能源統計年報[25]。

圖1 1985-2021年世界總發電量(單位:Terawatt-hours)

表1 1985-2021年世界總發電量(Unit:Terawatt-hours)
(1)將所有年份減去首年份1985,把首年份平移到0。設和累加生成卷積序列,然后計算兩者的卷積,,從而生成累加序列:
卷積得到的累加序列見圖2。

圖2 卷積x[n]*ago[n]和GM(1,1)擬合值的比較(單位:Terawatt-hours)
和時間響應函數:
和相應的時間響應序列:
擬合結果見圖3。擬合值和原始數據之間的誤差列在表格2,其中每個時間數據相應的殘差定義如下:
每個時間數據相應的相對誤差定義如下:
綜合所有時間數據,定義平均絕對百分比誤差(MAPE)計算公式如下:
本文構造了累加生成算子相應的累加生成卷積序列實現了累加生成的運算,按照信號處理的觀點,相當于找到了累加生成系統的脈沖響應函數在時域的離散序列。而借助Z 變換得到了累加生成卷積序列在頻率域的表達形式,相當于累加生成系統的傳遞函數。通過卷積和Z 變換,可以從新的角度去理解累加生成算子和逆累加生成算子之間的互逆關系。在實際的案例中,數據序列和累加生成卷積序列做卷積生成了累加數據,數據序列和逆累加生成卷積序列做卷積生成了累減數據。累加生成卷積序列和逆累加生成卷積序列互為逆卷積序列。經過累加生成卷積序列做卷積生成的數據和灰色系統模型GM(1,1)的擬合度很高,驗證了理論的正確性和方法的有效性。
本文后續可能開展的工作包括:
(1)累加階數在灰色預測模型中具有重要作用,對應到累加生成卷積序列是什么?如果是整數m階累加生成算子,是否對應累加生成卷積序列的m次重復卷積?
(2)接問題(1),分數階累加生成算子相應的卷積形式如何實現?累加生成卷積序列會有分數階卷積嗎?
(3)通過構造累加生成卷積序列,對累加生成的機制是否有更深的理解,累加生成能夠弱化原數據的隨機性的機制是什么?為什么灰色建模必須經過累加生成?