

DOI:10.3969/j.issn.1004-910X.2025.07.011 [中圖分類號]F425;F224 [文獻標識碼]A
引言
在全球經濟版圖迅速擴張的宏大背景下,現代產業的多元化領域正經歷著前所未有的繁榮機遇與深刻挑戰交織并存的局面[1,2]。然而,這一發展浪潮中,產業界亦不可避免地遭遇著來自內外部環境的重重考驗。部分產業因內部技術壁壘高企、自主創新能力不足等內在短板,其成長步伐受到顯著掣肘[3]。與此同時,市場風向的瞬息萬變、政策環境的調整更新、自然氣候的不可預測波動,乃至突發的社會輿論風波等外部力量,如同暗流涌動,為產業發展平添了諸多不確定性與潛在影響[4]。在此背景下,隨著信息檢索技術的日新月異、大數據浪潮的泗涌澎湃以及人工智能領域的持續革新,產業數據以前所未有的速度激增,形成了一個浩瀚無垠的數據海洋,其中蘊藏著推動經濟社會高質量發展的寶貴知識寶藏[5]。這一趨勢不僅極大地豐富了數據資源,更為精準洞察產業未來走向提供了可能。產業風險預測,作為一項基于歷史數據深度挖掘、趨勢前瞻性分析以及復雜模型構建的綜合性工作,正逐步成為導航產業穩健前行的重要燈塔[6。它通過對紛繁復雜的風險因素進行系統梳理與量化建模,旨在提前洞悉并預警潛在風險,科學預測產業未來可能面臨的風險等級與影響范圍[7]
當前,各產業正處于技術和業務管理快速變化的階段,技術之間的相互依賴性不斷增強,對風險預測的準確性和實時性提出了更高的要求[8]。此外,官方機構發布的產業統計數據是產業風險預測最基本的數據來源之一,通過分析各產業指標,可以總結歸納出產業發展變化潛在的客觀規律,并對某一時間節點的產業風險進行科學量化的分析[9]這些產業指標根據不同的采樣頻率又可分為年度、季度、月度等類型。年度指標是對產業在整個年度內的表現進行評估的時間序列數據集合,提供了對產業長期趨勢和發展方向的洞察[10]。通常,低頻數據具有高穩定性和高可靠性,受到短期波動的影響較小,可以更好地反映產業中長期趨勢和結構性變化[1]。高頻數據具有高實時性和高細節性,可以更深人及時地分析市場的細微變化和波動[12]。結合混頻數據模型和其它統計方法,既可以改進模型的預測精度和時效性;也能夠捕捉不同頻率下的數據動態特征,從而更全面地解釋數據之間的關聯和趨勢[13]。因此,在產業風險預測中,如何高效利用高頻數據成為一個亟待解決的問題。
產業風險預測與深度學習的深度融合,正逐步成為風險管理領域不可忽視的革新力量[14]。作為人工智能領域的最新算法,深度學習憑借其卓越的數據處理效能與模式識別能力,為產業風險預測開辟了一條前所未有的路徑[15]。在這一融合進程中,復雜多變的產業風險數據,其源頭廣泛分布于多個時間尺度(如日、月、季度等),形成了極具挑戰性的混頻數據集。為了應對這一挑戰,基于深度學習的混頻數據預測模型應運而生,其中GRU-CNN混合模型尤為引人注目。不僅能夠有效捕捉各頻率數據中的時序依賴性,還能在特征層面上實現跨頻率的數據融合與統一,極大地提升了預測的精度與魯棒性。尤為關鍵的是,深度學習模型在處理非線性關系及高維數據方面有良好性能,使得其在揭示產業風險背后錯綜復雜的因果關系與交互效應時游刃有余[16]。通過構建深度神經網絡架構,模型能夠深人挖掘數據間隱藏的深層次聯系,精準把握風險演變的脈絡,為產業風險的提前預警與有效管理提供了堅實的數據支撐與科學依據[17]。因此,本文致力于探索深度學習技術與混頻時序分析相結合的全新視角,針對產業風險預測問題提出創新解決方案。
本文聚焦于中國汽車制造業,選取2012\~2023年間的產業相關數據作為研究樣本,旨在將產業風險預測問題轉化為復雜的多源時序預測挑戰。在這一背景下,不同采樣頻率的數據源構成了預測過程中的關鍵輸入,使得問題更加貼近實際且充滿挑戰。為解決這一問題,本文創新性地設計并構建了一種基于GRU-CNN混合神經網絡與雙重注意力機制的產業風險預測模型。該模型的核心思想在于充分利用深度學習技術在處理時序數據和特征融合方面的優勢,同時結合注意力機制以突出關鍵信息對預測結果的影響。具體而言,模型先部署了一組門控循環單元網絡,這些網絡被配置以學習并捕捉來自不同頻率數據源的時序關聯特性。通過GRU網絡的處理,原始的時序數據被轉化為富含動態信息的編碼矩陣,為后續的特征融合提供了堅實的基礎。隨后,模型引入了一組卷積神經網絡,這些網絡在特征層上發揮了至關重要的作用。CNN網絡不僅能夠自適應地擴展或提取各個頻率編碼矩陣的時序特征,還能夠有效地實現混頻信息在長度上的統一和特征層面上的深度融合。這一過程極大地豐富了模型對數據的理解和表示能力,為后續的預測任務奠定了良好的數據基礎。在特征融合的基礎上,模型進一步引入了時間和特征雙重注意力機制。這一機制從兩個關鍵維度出發一時間維度和特征維度—對經過GRU和CNN層提取的信息進行重要性評估。通過精細的注意力計算,模型能夠區分出哪些時間點和哪些特征對預測結果具有更大的影響,并據此調整預測過程中的權重分配。這一過程極大地提高了模型對關鍵信息的敏感度和預測結果的準確性。
綜上所述,本文通過構建基于GRU-CNN的混合時序深度學習模型,不僅成功地將多源時序預測問題轉化為可處理的數學模型,還在實踐中驗證了該模型在提升預測精度和時效性方面的顯著優勢。研究成果不僅為中國汽車制造業的風險管理提供了有力支持,也為其他產業的類似問題提供了寶貴的參考和借鑒。
1 相關工作
1.1產業風險預測研究
風險預測模型的傳統研究方法多采用統計分析和數學模型[18],通過對歷史數據的累積和分析,觀察過去的事件和趨勢,以預測未來可能的風險。在風險預測中,多元判別分析用于識別不同的風險群體,并確定導致風險的關鍵因素。通過分析多個變量之間的關系,多元判別分析能夠幫助識別那些與特定風險密切相關的因素,并基于這些因素建立預測模型。Logistic回歸是一種統計模型[19],常用于評估某些因素對風險事件發生的影響。灰色預測模型則適用于數據缺乏或數據不完整的風險預測場景,通過灰色數列建模、灰色關聯分析和灰色模型修正,揭示各風險指標的規律性和趨勢,從而實現對未來風險的預測。支持向量機(SupportVector Machine,SVM)是一種監督學習算法[20]通過學習歷史數據的模式和趨勢,識別潛在風險因素,并將數據點分類為不同風險級別,實現風險事件的預測。
近年來,基于上述傳統風險預測模型的改進及其應用相繼涌現。如Hao等[2]基于算法優化的模型對食品安全數據集進行分類檢測,通過算法優化模型的參數以找到最優解,提高了食品安全風險預測的準確度。劉瀟雅和王應明[22]在模型中引入基于信息熵增益率分類原理的決策樹來進行優化,并將其應用于個人信用風險預測中。尹海寧[23]采用回歸森林組合模型,結合了邏輯回歸的概率建模和回歸森林的集成學習優勢,為急性冠狀動脈綜合癥后風險提供了更及時準確的預測手段。潘翱和賴健瓊[24借助Verhulst模型殘差修正優化灰色預測模型,明顯提高了交通事故預測的精度。然而,這些研究大多未涉及汽車產業,忽視了該產業巨大的市場價值,因此,本文將以汽車產業為例,進行深入分析。
在產業風險預測研究中,行業特性是影響模型構建和預測效果的關鍵因素。汽車產業作為典型的資本和技術密集型行業,其風險特征顯著區別于其他領域?,F有研究表明[25],汽車產業具有三重獨特性:(1)政策敏感性強,各國新能源補貼政策和碳排放法規的調整會直接改變市場競爭格局;(2)供應鏈脆弱性突出,全球分布的零部件供應體系易受地緣政治和突發事件影響;(3)技術迭代快速,電動化和智能化轉型帶來技術路線競爭風險。這些特性使得傳統風險預測模型在汽車產業應用中面臨數據非平穩性、變量非線性相關等特殊挑戰。針對汽車產業的風險預測,近年研究開始關注行業特定要素的整合。Plante等[26]指出,傳統統計模型難以有效捕捉汽車產業的技術顛覆性風險,建議結合復雜網絡理論分析供應鏈風險傳導路徑。Deiva和Kalpana[27]的實證研究顯示,芯片短缺等突發事件的影響評估需要融合實時供應鏈數據與灰色預測方法。然而,現有文獻在汽車產業風險的系統性建模方面仍存在明顯不足,特別是缺乏對政策變動與技術演進交互影響的動態分析框架,這正是本文試圖突破的重點方向。
1.2 混頻數據預測模型
在實際研究中,結合金融、經濟時間序列數據和相應理論模型的應用是混頻數據預測模型關注的重點。自前,最主要的模型是以混頻向量自回歸(Mixed Frequency Vector Auto Regressive,MF-VAR)[28]模型為代表的混頻狀態間模型和混頻數據樣(Mixed Frequency Data Sampling Regression Models,MIDAS)[29]模型及其變體。MF-VAR模型將低頻變量視作周期性缺失序列[30],結合了向量自回歸(VAR)模型和分數階差分的概念,利用低頻數據來預測高頻數據。Bekertman和Gribisch[3i使用隨機波動形式的MF-VAR模型對混頻資產收益率的動態和分布特性進行了較可靠的解釋。劉洪等[32]利用穩態隨機先驗拓寬了MF-VAR的應用場景并提高了預測精度。Foroni 等[33]在分布滯后模型(DL)的基礎上首次提出MIDAS模型,核心思想是將高頻數據轉換為低頻數據,并利用分布滯后多項式函數對轉換后的低頻向量施加約束。
MIDAS模型在后續研究中不斷得到擴展,并衍生出眾多變體,以適應不同場景下的混頻數據處理需求。由于MIDAS模型的約束函數多適用于金融領域,Foroni等[33]提出了反向無約束混頻模型,以解決使用低頻向量解釋并預測高頻向量的問題,并在頻率倍差較小的混頻數據集中取得了良好的預測效果。 Xu 等[34]在MIDAS和RU-MIDAS模型的基礎上結合ANN提出反向限制性ANN-MIDAS模型,實驗證明該模型在捕捉混頻數據的非線性特征方面優于其他模型。Kamolthip等[35]在長短期記憶網絡(LSTM)架構中融入UMIDAS模型方案,用于預測泰國宏觀經濟變量的變化率。實驗證明,LSTM-UMIDAS模型在處理混頻數據后,能夠對時間序列進行長期依賴信息學習,并在6個月內的預測表現顯著優于采樣對齊后的LSTM模型。盡管混頻數據預測模型在處理原始混頻數據方面表現出了顯著優勢,但目前還沒有學者成功將其應用于產業風險預測。因此,如何將這兩者結合起來,以最大化地利用產業混頻數據信息,成為一個重要的研究課題。
2 模型與方法
2.1 數據集構建
為了確保本文分析所依據數據的可靠性,本文篩選并采用了多個權威數據源,包括但不限于國家統計局官方網站(https://www.stats.gov.cn)、中國統計年鑒系列、中國工業統計年鑒、以及中國汽車工業協會的專業資料庫(https://www.caam.org.cn),輔以CEIC 數據統計網站(https://www.ceicdata.com.cn)的深度數據,時間跨度廣泛覆蓋了從2012年1月至2023年12月的豐富信息。在數據甄選過程中,若同一指標存在不同頻率的記錄,本文優先采納高頻數據,以期在提升數據時效性的同時,確保其精度的最大化。這些數據集涵蓋了季度、月度及年度等多種時間粒度,特別聚焦于月度產業風險指數的精準預測
鑒于產業風險領域的特定數據資源相對有限,為全面驗證模型效能,本文創造性地引人了來自UCIrvine機器學習庫的一項實驗數據集作為補充。該數據集專為構建低能耗建筑中電氣能耗預測的多變量回歸模型而設計,時間跨度橫跨約4.5個月,采樣頻率高達每10分鐘1次,總計包含19735個觀測點及29項詳盡特征,如通過無線傳感器網絡實時監測的房屋溫濕度條件等。為貼合本文研究需求,本文挑選了其中10個關鍵特征,并創新性地將記錄頻率調整為每30分鐘1次,從而構建了一個包含10分鐘與30分鐘兩種采樣頻率的混合數據集,其中,以每10分鐘記錄的電能消耗數據作為核心預測目標。
針對上述兩個數據集,本文采取了嚴謹的數據預處理流程:(1)利用前向填充技術,有效填補了各時間序列中的缺失值,確保數據的完整性;(2)通過z-score標準化處理,消除了不同量綱對數據分析的影響,提升了數據的可比性;(3)遵循科學的7:3比例原則,精準劃分了訓練集與測試集,為后續模型的構建與驗證奠定了堅實的基礎
2.2 模型介紹
本文提出的MF-TF-DAN模型結構如圖1所示。作為一種混頻時序深度學習模型,該模型以混合頻率的原始數據作為輸入,輸出頻率等同預測目標的采樣頻率,但是模型的架構不會隨著輸出頻率變化而變化。

(1)模型根據預測目標的時序特性確定最佳的滯后階數,并結合采樣頻率選擇適當的滑動窗口長度。在初始化滑動窗口時,模型設定了不同采樣頻率下窗口內數據的長度;(2)利用一組GRU網絡分別學習各采樣頻率數據的時序依賴信息,并生成相應的隱藏層特征和嵌入向量;(3)通過一組CNN網絡對每個采樣頻率的GRU輸出的隱藏層特征進行自適應提取或擴展[36],以確保所有CNN網絡的輸出結果長度保持一致。為此,設置了相同數量的卷積核。經過GRU和CNN網絡處理,成功提取并融合了不同采樣頻率數據的時序依賴特征信息;(4)本文引入雙重注意力機制,從融合后的特征中學習時間和特征上的注意力向量,以獲取時間上下文向量和特征上下文向量;(5)模型利用時間和特征上下文向量以及混頻數據的嵌入特征進行注意力計算,并通過全連接層輸出模型的預測結果。綜上所述,MF-TF-DAN模型由兩個核心部分組成:第一部分是對滑動窗口內的原始混頻數據進行時序特征提取與特征融合;第二部分是雙重注意力機制,用于自適應地學習數據的時間信息和特征信息。
2.2.1時序特征提取與特征融合
本文將混頻數據預測視為一種多源時序預測問題,即同一種采樣頻率的多種數據采自同一數據源,而不同采樣頻率的數據采自不同數據源。假設原始數據里有 V 種采樣頻率,則模型輸入由V 個時間序列組成,可以表示為 X={X1,…,XV}∈ RNxK。第v種頻率對應的時間序列用X={
來表示, xvi 表示一條第 v 種頻率下采集到的序列, nv 表示維度,即第 v 種采樣頻率下的每條數據的長度, kv 表示第 v 種采樣頻率下有多少條數據,
, N=max{n1,…,nV} 。為了對MF-TF-DAN模型進行更深入的介紹,本節將分析模型核心組件的設計細節。
2.2.2 窗口滑動
為了更好地捕捉混頻數據的動態性和時序性,本文使用滑動窗口方法對原始時間序列進行切片處理來為模型劃分出輸入數據。傳統滑動窗口的大小一般由兩個參數決定,(1)最佳滯后階數,代表窗口長度,表示為 p ;(2)原始時間序列的維度,代表窗口寬度?;瑒哟翱谝?個單位時間間隔的步長向前滑動。由于MF-TF-DAN模型用于混頻數據預測,不能直接應用傳統滑動窗口,因此做了以下調整:
由于本文自的是基于混頻數據預測高頻信息,因此滑動步長選擇高頻預測自標的單位時間間隔。結合預測目標序列的采樣頻率和時間間隔使用網格搜索方法遍歷多個滯后值 p 的組合來選擇最佳的滯后值。由于滑動步長選擇高頻單位時間間隔,所以不同時刻滑動窗口內的低頻數據數目可能會不同,為避免此情況,模型在初始化滑動窗口時先確定各序列在窗口內的數據長度,當窗口內數據長度減少時會填充窗口以外的數據來保持一致性。
2.2.3 時序特征提取
本文使用一組GatedRecurrentUnit(GRU)網絡來提取混頻數據的時序特征[37]。尤其是對于要解決的產業風險預測問題,面對這種數據量較少的情況,GRU面臨比LSTM小很多的過擬合風險。GRU建模過程公式:

其中 zt 和 rt 分別表示更新率和重置率, Wz 和
表示更新門和重置門的權重,是可學習參數。σ(?) 為激活函數。重置率與上一時刻輸出值 ht-1 進行計算,和當前時刻的輸人 xt 一起通過tanh 函數得到候補狀態
。用狀態
和更新率進行計算,遺忘 ht-1 的部分信息,記憶
的部分信息,得到內部隱藏狀態 ht 。MF-TF-DAN 模型分配了不同的GRU網絡來對不同采樣頻率的時間序列進行獨立編碼,即使用特定的GRU函數學習它所對應采樣頻率數據的時序特征,網絡結構如圖2所示。
時序特征提取模塊的輸出內容有兩部分,網絡傳遞過程中的隱藏層特征編碼矩陣 Ht={Ht1,… Htv,…,HtV} 以及混頻數據最后一個時間步的隱藏狀
h h h
Htν (2 F F F F F
Xν Liii Time
態 ht 。其中
, mv 表示第 v 種頻率對應GRU網絡中隱藏層特征的維度,lv 表示第 v 種頻率的輸入數據在一個滑動窗口內的長度。 ht 的公式化表現為:

2.2.4 特征融合
經過時序特征提取后,模型獲得了各個GRU網絡輸出的隱特征編碼矩陣和最終的嵌入向量。然而,由于不同GRU網絡對應的數據序列長度和維度存在差異,導致如何同時處理這些信息以學習不同頻率數據之間的依賴關系成為了一個挑戰。為了解決這一問題,本文選擇使用CNN網絡來自適應地調整各采樣頻率下的數據序列的時序特征,從而實現混頻數據特征層信息的融合。
CNN 的核心結構包括卷積層和池化層[38],卷積層能夠有效提取或擴展數據特征,而池化層則有助于減少數據大小和維度。在MF-TF-DAN模型中,主要利用了CNN的卷積操作來完成混頻數據特征的融合。一維卷積操作在時序數據中是一種常見的特征提取方法,它通過在每個位置上對輸人序列的局部窗口與卷積核或濾波器進行點積運算,并移動卷積核或濾波器來遍歷整個輸人序列,以此來捕捉序列中的空間和局部特征。延續上一節的思路,模型為每個瀕率的時間序列分配具有相同數量的卷積核的CNN網絡,并用它們來處理相對應的各GRU網絡輸出。其結構如圖3所示。
用 C 表示一個CNN網絡的卷積核數量,則第v 種頻率數據對應CNN網絡的卷積核集合可表示為 Cv={C1v,…,Ccv} , Ccv∈R1×(lv-1) 。使用 Rtv 來表示第 v 個頻率數據對應的CNN網絡的輸出,其計算公式為:

Rtv={Htv*C1v,…,Htv*CCv}={r1v,…,rCv}
其中
表示卷積操作, Rtv∈Rm×C ,
,Rt={Rt1,…,Rtv,…,RtV} 。經卷積處理后,混頻數據時間特征的維度被一致調整為 c ,使得它們可以被集成到同一個編碼矩陣中,從而實現了特征層信息融合。
2.2.5雙重注意力機制
注意力機制可以提高模型對輸人信息的理解和處理能力,通過分配不同程度的注意力使模型動態地關注輸入的不同部分,削弱冗余信息和噪音,從而增強模型的表征能力和泛化能力。應用到時序分析領域,注意力機制往往用來根據輸入序列每個時間步的重要性來動態地調整注意力[39]然而,在進行多變量時序預測時,僅靠這種設置會忽略各個變量之間的重要度關系。因此,本文在傳統時間維度上的注意力機制基礎上增添了特征維度上的注意力機制,這種雙重注意力機制可以幫助混頻數據預測模型改善對時間和特征兩個維度的綜合識別能力,進而提高對目標序列的預測能力。
(1)時間注意力機制
本文引人Soft-Attention機制來為模型進行時間維度上的注意力計算[40],如圖4所示,軟注意力屬于全局注意,它基于融合后編碼矩陣的所有隱藏狀態,為序列中所有的時間步上的隱向量計算注意力權重,從而優化時間維度上的注意力資源配置。

Soft-Attention機制產生上下文相關向量的計算過程如下:



其中 eir 表示 ri 和嵌入向量 ht 的相關度,經過softmax處理后得到 αir ,表示時間注意力, sr 表示時間上下文向量。
(2)特征注意力機制
在許多情況下,多變量時序預測中不同特征之間的相關性也會有所不同,這種相互性主要表現為稀疏性和交互性[41]。部分輸入特征之間的相關性可能是稀疏的,這意味著只有少數特征之間具有顯著的相互作用,數據中存在的信息量不均勻,部分特征對于模型預測任務可能比其他特征更加重要;另外,部分輸入特征之間可能存在復雜關系或相互作用,這種交互可能是非線性的,難以用一般的線性模型來捕獲。通過引入特征注意力,模型可以在處理輸入數據時自適應地對當前任務更重要的特征分配更多注意力,并且可以考慮到特征之間的交互關系,從而更好地提取數據中的特征。本文引人Multi-Representational Attention機制來為模型進行特征維度上的注意力計算[40],如圖5所示。特征上下文相關向量的計算公式如下:
eja=f(ht,aj)=ajWaht


其中, aj 表示融合編碼矩陣中特征維度上的向量, eja 表示特征向量 aj 與嵌入向量 ht 的相關度,經過softmax處理后得到 αja ,表示特征注意力, sa 表示特征上下文向量。

尤其在產業風險預測中,引入時間和特征雙重注意力機制至關重要。產業風險涉及多種指標,其重要性不一,不同類型和頻率指標之間也可能存在內容覆蓋、互相作用等復雜關系,通過動態調整模型對各種指標的注意力,能夠提高模型對于關鍵特征的捕捉能力,從而提升風險預測的準確性和魯棒性;另外,這些產業風險指標又具有隨時間變化的長期依賴關系,通過調整模型對不同時間點的注意力,可以更準確地捕捉到產業風險隨時間的演變趨勢。
2.2.6 模型輸出
在對混頻數據進行預測時,本文選擇使用多步預測方法。相較于單步預測方法,多步預測可以在一次預測中同時預測多個時間步的值,能夠減少計算成本并簡化模型架構,同時捕捉到數據中更長期的時序依賴。模型輸出層通過一個全連接網絡結合 sa 、 sr 、 ht 3個向量進行目標序列的預
測,輸出值計算公式為:

其中 W?Y 、
、 Ws 、 WH 為可學習參數,
為下一時間步的目標序列預測值。
2.3 實驗設計
2.3.1 實驗設置
對于上述兩個數據集,為了測試模型短期、中期、長期的預測效果,采用多步預測方法分別對預測步數為1、3、12的目標數據時序進行預測。MF-TF-DAN模型需要進行參數調節的超參數包括滑動窗口大?。╓indow_size)、批量大?。˙atch_size)、GRU隱藏單元數目(Units)、卷積核數目(Filters)、學習率(Learning_rate)、暫退法(Dropout),采用網格搜索方法來確定最優參數。實驗中對MF-TF-DAN模型超參數的選擇方案如表1所示,其中黑體數字表示最優選取值。模型采用Adam優化器算法,激活函數為ReLU函數,損失函數為RMSE。

本文實驗使用的設備配置為:Windows11操作系統,處理器為Intel(R)Core(TM)i7-12700H,GPU型號為NVIDIAGeForceRTX3050。實驗模型編程語言為Python3.10,在Anaconda4.14.0虛擬環境以及Pycharm2022.2.3上進行開發,模型開發基于Pytorch1.12.1框架,使用的Cuda 版本為11.7,實驗具體開發運行環境配置如表2所示。
2.3.2 評價指標
為驗證提出模型的預測效果,本文參考過去相關研究中的誤差評價測度,選擇采用均方根誤差(RootMean Squared Error,RMSE)和平均絕對誤差(MeanAbsoluteError,MAE)來作為評價指標。RMSE和MAPE用于反映預測值和實際值之間的誤差大小,RMSE和MAPE越小則誤差越小。

3 結果分析
3.1 對比實驗分析
為驗證MF-TF-DAN模型在混頻數據預測上的有效性,在產業風險數據集和電氣能源數據集上進行了對比實驗,對比模型包括RUMIDAS、MF-VAR、GRU、LSTM-RUMIDAS4種模型。其中RU-MIDAS和MF-VAR模型是傳統混頻數據處理模型中利用低頻數據預測高頻目標的兩個主流模型。GRU是一個單層的GRU網絡,混頻數據在輸人GRU網絡之前通過上采樣方法轉換為相同高等頻率數據,采用的上采樣方法為前向填充。LSTM-RUMIDAS是LSTM-UMIDAS模型的變體,它先利用RUMIDAS對齊頻率,之后利用LSTM網絡捕捉數據之間的非線性關系,實現了在處理混頻數據后對時間序列進行長期依賴信息的學習。在對比實驗中,GRU和LSTM-RUMIDAS選擇與MF-TF-DAN模型相同的超參數調優策略以確保公平比較。
本文分別基于預測步數為1、3、12的預測實驗,圖6展示了MF-TF-DAN模型在不同預測步數下基于產業風險數據集的實驗結果,圖7展示了MF-TF-DAN模型在不同預測步數下基于電氣能源數據集的實驗結果。MF-TF-DAN模型和4種對比模型在產業風險數據集上的實驗結果如表3所示,可視化結果如圖8所示,在電氣能源數據集上的實驗結果如表4所示,可視化結果如圖9所示。


通過對比實驗結果可知,相較于其他模型,MF-TF-DAN模型在混頻數據預測中表現出更為優異的效果。(1)對于兩個數據集,經過數據上采樣處理后的單層GRU網絡的預測精度明顯不如其他模型,這驗證了直接基于原始混頻數據進行建模方案的優越性;(2)觀察到在產業風險數據集中,RUMIDAS和MF-VAR模型的表現相較于在電氣能源數據集中較弱,主要原因在于產業風險數據集中的各輸入特征之間存在較明顯的共線性問題。部分變量信息的重疊或相似性影響了模型的評估效果。此外,隨著預測步數的增加,RU-
MIDAS和MF-VAR模型的預測精度下降更加顯著,可能是因為它們基于線性假設,無法很好地捕捉數據中的非線性關系和長期依賴性,因此在中長期預測任務中存在一定的局限性。
另外,LSTM-RUMIDAS模型整體表現優于RUMIDAS模型,這在一定程度上反映了深度學習模型在捕捉非線性關系方面的優勢,從而提升了模型的預測精度??傮w來看,LSTM-RUMIDAS和MF-TF-DAN模型均優于RUMIDAS和MF-VAR模型。其中一個原因是多維時間序列數據集包含了多種不同頻率的變量以及復雜的時空關系,這些特點為深度學習模型提供了豐富的建模機會,使得模型能夠更好地適應數據的復雜性,進而取得更好的預測效果。尤其是在電氣能源數據集中,LSTM-RUMIDAS模型和MF-TF-DAN模型的預測效果更佳,主要原因是該數據集較大,能夠更充分地利用深度學習的優勢,并為其提供充足的訓練樣本,從而提高了預測的準確性和泛化能力[42]。通過對比實驗結果可知,相較于其他模型,MF-TF-DAN模型在混頻數據預測中表現出更為優異的效果。(1)對于兩個數據集,經過數據上采樣處理后的單層GRU網絡的預測精度明顯不如其他模型,這驗證了直接基于原始混頻數據進行建模方案的優越性;(2)觀察到在產業風險數據集中,RUMIDAS和MF-VAR模型的表現相較于在電氣能源數據集中較弱,主要原因在于產業風險數據集中的各輸入特征之間存在較明顯的共線性問題。部分變量信息的重疊或相似性影響了模型的評估效果。此外,隨著預測步數的增加,RUMIDAS和MF-VAR模型的預測精度下降更加顯著,可能是因為它們基于線性假設,無法很好地捕捉數據中的非線性關系和長期依賴性,因此在中長期預測任務中存在一定的局限性。
另外,LSTM-RUMIDAS模型整體表現優于RUMIDAS模型,這在一定程度上反映了深度學習模型在捕捉非線性關系方面的優勢,從而提升了模型的預測精度??傮w來看,LSTM-RUMIDAS和MF-TF-DAN模型均優于RUMIDAS和MF-VAR模型。其中一個原因是多維時間序列數據集包含了多種不同頻率的變量以及復雜的時空關系,這些特點為深度學習模型提供了豐富的建模機會,使得模型能夠更好地適應數據的復雜性,進而取得更好的預測效果。尤其是在電氣能源數據集中,LSTM-RUMIDAS模型和MF-TF-DAN模型的預測效果更佳,主要原因是該數據集較大,能夠更充分地利用深度學習的優勢,并為其提供充足的訓練樣本,從而提高了預測的準確性和泛化能力。
3.2 消融實驗
為驗證MF-TF-DAN模型各個組件的有效性,本文在產業風險數據集和電氣能源數據集上進行了消融實驗。消融實驗中使用的3個對比模型分別是在MF-TF-DAN模型的基礎上移除CNN特征融合模塊、移除時間注意力機制和移除特征注意力機制。其中,移除CNN特征融合模塊的模型需要對數據進行上采樣處理。MF-TF-DAN模型在產業風險數據集和電氣能源數據集上的消融實驗結果分別如表5和表6所示。
從消融實驗結果可以看出,CNN特征融合模塊、時間注意力機制和特征注意力機制均有助于提升模型的預測效果,移除任何一個組件都會導致模型性能的下降。具體來說,移除CNN層會使MF-TF-DAN模型失去混頻數據的特征融合能力,必須依賴提前進行的數據同頻化處理,這對模型性能的影響最為顯著。另外,特征注意力機制和時間注意力機制對MF-TF-DAN模型都有貢獻,但它們在不同數據集中表現出不同的重要性。
在產業風險數據集中,由于各輸入特征之間存在較強的相關性,并可能有復雜的關系或相互作用,移除特征注意力機制會對模型性能產生較大的負面影響。而在電氣能源數據集中,各輸入特征之間的獨立性較強,時間注意力機制的作用更為突出。因此,基于原始混頻數據建模,并通過GRU等深度學習模型捕捉數據中的非線性關系和長期依賴關系,在混頻數據預測任務中取得了較好的效果。引入時間和特征雙重注意力機制以及CNN特征融合模塊進一步提升了模型的預測精度和泛化能力。
4討論與結語
4.1 不足與展望
在對混頻時序深度學習預測模型MF-TF-DAN的深入探索中,本文所依托的兩個數據集雖具一定代表性,卻也不可避免地面臨若干局限性。
(1)產業風險數據集規模相對有限,這一現狀難以充分發揮深度學習模型在處理復雜數據關系上的潛在優勢,限制了模型效能的全面展現。此外,作為對比基準的傳統混頻數據預測模型,由于輸人特征之間可能存在潛在的共線性問題,導致其性能遇到瓶頸,這進一步凸顯了數據質量對模型性能的關鍵影響;另外,電氣能源數據集雖然經過設計以模擬真實場景,但其本質仍為仿真數據,缺乏實際應用中的復雜多變性和不確定性,這在一定程度上削弱了實驗結果的說服力和普適性。因此,未來的研究應致力于將MF-TF-DAN模型應用于更加多元和廣泛的真實世界數據集,通過豐富的實驗案例全面評估其有效性與適用性,確保模型在復雜多變的現實環境中依然能夠保持穩健的性能。
(2)受限于當前數據獲取能力,本文的研究主要聚焦于中國汽車制造業的月度數據分析,未能觸及更高頻率(如周度、日度)的數據分析,這在一定程度上限制了模型捕捉快速市場動態變化的能力。為彌補這一不足,后續研究應積極探索創新的數據收集與處理方法,力求將數據樣本范圍擴展至更高時間分辨率,從而提升模型的訓練效率,增強泛化能力,并產出更為實時和精準的產業風險預測結果。
(3)本文在產業風險預測領域的研究主要集中于中國汽車制造業這一單一案例,盡管具備深入分析,但在一定程度上限制了模型跨行業應用潛力的評估。因此,未來的研究方向應著眼于構建多元化的產業研究框架,涵蓋不同行業和不同經濟背景下的廣泛實證分析,以全面驗證MF-TF-DAN模型在不同產業環境中的適應性與泛化能力,為產業風險管理的智能化轉型提供更加堅實可靠的理論支撐與實踐指導。
4.2結語
隨著經濟全球化的加速推進和現代產業的蓬勃發展,產業風險預測正面臨著前所未有的嚴苛要求和復雜挑戰。為有效應對這些挑戰,本文創新性地構建了一種基于GRU-CNN混合神經網絡與雙重注意力機制的混頻時序深度學習模型——MF-TF-DAN,并成功將其應用于產業風險預測領域。MF-TF-DAN模型巧妙融合了不同頻率數據的優勢,通過一組設計的GRU網絡,深入學習并捕捉各頻率數據的時序特征,生成高質量的原始數據編碼矩陣。隨后,模型利用一組高效的CNN網絡,在特征層面上自動完成混頻數據特征的精準融合,實現了信息的深度整合與優化。尤為重要的是,模型引入了雙重注意力機制,從時間和特征兩個維度對經過GRU和CNN層提取的信息進行重要性評估。通過精細的注意力計算,模型進一步突出了關鍵信息,有效提升了預測結果的準確性和魯棒性。為了全面驗證MF-TF-DAN模型的性能,本文在產業風險數據集和電氣能源數據集上進行了廣泛的實驗,包括不同預測步長(1、3、12步)的模型對比實驗和消融實驗。實驗結果表明,MF-TF-DAN模型在混頻數據預測任務中表現出了顯著的優越性,其預測效果明顯優于其他對比模型。
這一成果不僅驗證了模型設計的科學性和有效性,也為產業風險預測領域提供了新的思路和方法。通過構建基于混頻數據的預測模型,本文成功將高頻數據的時效性優勢與低頻數據的穩定性特點相結合,有效克服了單一頻率數據在預測中的局限性,顯著提高了汽車產業風險預測的精度和時效性。這一突破性的進展為企業高層管理者提供了更加精準、全面的風險預警信息,有助于他們更加科學合理地制定戰略決策,以應對市場變化帶來的各種挑戰。綜上所述,MF-TF-DAN模型在產業風險預測領域的應用具有重要的理論價值和實踐意義。它不僅是深度學習技術在金融風險管理領域的一次成功嘗試,也為未來混頻數據預測模型的研究和發展提供了新的方向。
參考文獻
[1]BoodhunN,JayabalanMJC,SystemsI.RiskPredictioninLifeInsuranceIndustryUsing SupervisedLearningAlgorithms[J].Com-plexamp;Intelligent Systems,2018,4(2):145~154.
[2]PengY,WangG,KouG,etal.AnEmpirical StudyofClassifica-tionAlgorithmEvaluationforFinancialRiskPrediction[J].AppliedSoft Computing,2011,11(2):2906~2915.
[3]龔強,張一林,林毅夫.產業結構、風險特性與最優金融結構[J].經濟研究,2014,49(4):4~16.
[4]北京大學課題組,黃璜.平臺驅動的數字政府:能力、轉型與現代化.電子政務[J].2020,(7):2~30.
[5]劉洋,呂樹月,黎若珺.社交機器人在信息行為研究中的概念、任務及應用[J].農業圖書情報學報,2024,36(3):4~20.
[6]范小群,譚冰.新能源汽車產業政策風險研究[J].時代汽車,2021,(23):133~135.
[7]LiuY,ZengQ,YangH,etal.Stock Price Movement Predic-tion from Financial News with Deep Learning and KnowledgeGraph Embedding[C]. Proceedings of the Knowledge Manage-ment and Acquisition for Intelligent Systems:15th Pacific RimKnowledge Acquisition Workshop,2018,(8):102~113.
[8]《中國公路學報》編輯部.中國汽車工程學術研究綜述·2017[J].中國公路學報,2017,30(6):1~197.
[9]LiuY,HuangF,MaL,etal.Credit Scoring Prediction Levera-ging Interpretable Ensemble Learning[J].Journal of Forecasting,2024,43(2):286~308.
[10]劉洋,張雯,胡毅,等.基于多模態深度學習的酒店股票預測[J].數據分析與知識發現,2023,7(5):21~32.
[11]劉漢,劉金全.中國宏觀經濟總量的實時預報與短期預測——基于混頻數據預測模型的實證研究[J].經濟研究,2011,46(3): 4~17.
[12]Lyócsa S,Molnár P,Vyrost T.Stock Market Volatility Fore-casting:Do We Need High-frequency Data?[J]. InternationalJournal of Forecasting,2021,37(3):1092~1110.
[13]Liu Y,Zeng Q,Li B,et al. Anticipating Financial Distress ofHigh-tech Startupsin the European Union:A MachineLearningApproach for Imbalanced Samples[J].2022,41(6):1131~1155.
[14]Moradi R,Cofre-Martel S,Droguett EL,etal. Integration ofDeep Learning and Bayesian Networks for Condition and OperationRisk Monitoring of Complex Engineering Systems[J].ReliabilityEngineering System Safety 2022, 222:108433.
[15]LeCun Y,Bengio Y,Hinton G. Dep Learning[J].Nature,2015,521(7553):436~444.
[16]Paltrinieri N,ComfortL,Reniers G.Learning About Risk:Ma-chine Learning for Risk Assessment[J]. Safety Science,2019,118: 475~486.
[17]劉洋,段宇杰,張鑫,等.今天你上“小紅書”了嗎?在線社區用戶信息分享的主題提取與動機分析[J].圖書情報知識,2024,41(4):110~120,145.
[18]Theodossiou PT.Predicting Shifts in theMeanof aMultivariateTime Series Process:An Application in Predicting Business Fail-ures [J]. Journal of the American Statistical Asociation,1993,88(422):441~449.
[19]于立勇,詹捷輝.基于Logistic回歸分析的違約概率預測研究[J].財經研究,2004,(9):15~23.
[20]丁世飛,齊丙娟,譚紅艷.支持向量機理論與算法研究綜述[J].電子科技大學學報,2011,40(1):2~10.
[21]Hao M,Wang Y,Huang W,et al.Food Safety Risk Assess-ment Method Based on SVM Optimization Model[C].Procee-dings of the 2O22 7th International Conference on Multimedia Sys-temsand Signal Processing,2022,(10):52~56.
[22]劉瀟雅,王應明.基于C4.5算法優化SVM的個人信用評
估模型[J].計算機系統應用,2019,28(7):133~138.
[23]尹海寧.基于Logistic 回歸和隨機森林構建急性心肌梗死患者不良心血管事件風險預測模型[D].鎮江:江蘇大學,2023.
[24]潘翱,賴健瓊.基于改進灰色預測模型的交通事故預測模型研究[J].計算機時代,2022,(5):33~38.
[25]Sturgeon T,Van Biesebroeck J,GerefiG.Value Chains,Net-worksand Clusters:Reframing the Global Automotive Industry[J].Journal of Economic Geography,2008,8(3):297~321.
[26]Plantec Q,Deval M A,Hooge S,et al. Big Data as an Explo-ration Trigger or Problem-solving Patch:Designand IntegrationofAI-embedded Systems in the Automotive Industry[J].Techno-vation,2023,124:102763.
[27]Deiva GA,Kalpana P.Supply Chain Risk Identification:AReal-time Data-mining Approach[J]. Industrial managementamp;data systems,2022,122(5):1333~1354.
[28]Schorfheide F,Song D.Real-time Forecasting with a Mixed-fre-quency VAR [J]. Journal of Business Economic Statistics 2015,33(3):366~380.
[29]GhyselsE,Kvedaras V,Zemlys V.Mixed Frequency DataSampling Regression Models:The R Package Midasr[J].Jour-nal of Statistical Software,2016,72(4):1~35.
[30]Ghysels E.Macroeconomics and the Reality of Mixed FrequencyData[J]. Journal of Econometrics,2016,193(2):294~314.
[31]Bekierman J,Gribisch B.A Mixed Frequency Stochastic Vola-tilityModel forIntradayStockMarketReturns[J].Journalof Fi-nancial Econometrics,2021,19(3):496~530.
[32]劉洪,王丹陽,高躍偉.穩態隨機先驗下MF-VAR預測模型及其應用[J].統計與決策,2023,39(5):22~26.
[33]Foroni C,Marcelino M,Schumacher C.Unrestricted MixedData Sampling(MIDAS): MIDAS Regressions with UnrestrictedLag Polynomials[J]. Journal of theRoyal Statistical Society,2015,178(1):57~82.
[34]Xu Q,Zhuo X,Jiang C,et al.An Artificial Neural Network forMixed Frequency Data [J]. Expert Systems with Applications,2019,118:127~139.
[35]Kamolthip S. Macroeconomic Forecasting with LSTM and MixedFrequency Time Series Data [R]. Pier Discussion Papers,2021:13777.
[36]Gu J,Wang Z,Kuen J,et al. Recent Advances in Convolutio-nal Neural Networks[J].Patern Recognition,2018,77:354~377.
[37]ChungJ,GulcehreC,ChoK,etal.Empirical EvaluationofGated Recurrent Neural Networks on Sequence Nodeling [R].2014:3555.
「38]Alzubaidi L. Zhang I.Humaidi A J.et al.Review of Deep Lear-
ning:Concepts,CNNArchitectures,Challenges,Applications,Fu-tureDirections[J].Journal ofBigData,2O21,8(1):1~74.
[39]TaoC,Gao S,Shang M ,etal.GetThePointofMyUttera-nce!Learning Towards Effective Responses with Multi-Head Atten-tionMechanism [C].Proceedings of the 27th International JointConference on Artificial Intelligence,2018,(7):4418~4424.
[40]Niu Z,ZhongG,YuH.AReviewon theAttentionMechanismof Deep Learning[J].Neurocomputing,2021,452:48~62.
[41]Shih SY,SunFK,LeeHY.Temporal Pattern Attention for Mul-tivariate Time SeriesForecasting[J].Machine Learning,2019,108:1421~1441.
[42]劉洋,丁星辰,馬莉莉,等.基于多維度圖卷積網絡的旅游評論有用性識別[J].數據分析與知識發現,2023,7(8):95~104.
[Abstract)Asacore link inmodernindustrialeconomic management,industrialrisk prediction playsan ieplaceablerole in ensuringcordinatedeconomicdevelopent,optiingindustrialstructurendsientificallfoulatingindustrialdeveloppolicies.This paperproposesaninnovativesolution-Mixed-FrequencyTemporalFusionDual Atention Network(MF-TF-DAN). Whatis particularlycriticalisthattheF-TF-DANmodelinnovativelyintroducsadualatention mechanism,whichstartsfrom thetwodimensionsof timeandfeatures todeeplymineandevaluatetheimportanceof theinformationprocessdbyGRUandCNN. Thispaperconductedcomprehensiveandin-depthexperimentalverificationonteindustrialriskdataset,includingmodelcoparisonexperimentsandablationexperimentswithdiferentpredictionstepsizes.ExperimentalresultsshowthattheMF-TF-DAN modelperformssignifcantlybeterthanothercomparisonmodelsinthemixingdatapredictiontask.Thisresultnotonlyprovesthe scientificandefectivenessofthemodeldesign,butalsobringsnewbreakthroughsinthefieldofindustrialriskpredictionThis modelprovides industrymanagerswithunprecedentedacurateriskwaringcapabilities,alowingmanagerstohaveadeperinsight intomarketchanges,identifyandevaluatepotentialrisksinadvance,andtherebyformulatemorescientficandreasonablecorpo rate strategies and market response strategies.
[Key words]industrial risk;automobile industry;deep learning;time series;mixed frequencydata;sliding windows;electrical energy;dual attention mechanism
[Jelclassification]L62;O14(責任編輯:楊婧)