薛 茹
(西北大學現代學院,陜西 西安 710130)
在大數據時代,隨著不斷的發展和創新,政務信息化和大數據的處理越來越多。 經濟分析系統能夠快速獲得經濟發展的動態,為經濟提供可靠的數字依據。目前,國內大數據下經濟系統設計的成功案例不多,如熊贏新等[1]、白獻陽等[2]分別對湖北省宏觀經濟大數據倉庫項目、貴州省政府數據開放協同機制進行了探索,李軍等[3]、崔樹紅等[4]在智慧政務和“數字政府”框架下對大數據共享的實現與應用進行了研究。 這些研究主要是針對數據共享方面的研究,可以實現部門的互聯、信息資源的共享、業務的協同,而通過構建經濟分析系統,可以對數據進行全面分析,通過數據進行決策,采用數據進行創新,可以為政府部門、企業以及各行各業提供快速、準確、全面的經濟信息。 大數據分析系統能夠形成進行實時監測和智能預測的經濟分析系統體系。
在確定好相應來源數據后,通過匯聚各種數據,對數據進行采集與加工處理,數據采集與加工處理主要提供數據抽取、數據轉換、數據加載功能,負責與前端數據源進行交互,采集和處理數據庫、協議、文本等數據項[5],通過大數據平臺首先把數據加工、整合,將數據存儲到數據庫中,進行數據的分析與展示。 在經濟分析系統中,系統模塊主要包括數據快報、數據分析、企業跟蹤、關聯分析、綜合報表和經濟預測模塊,系統框架如圖1 所示。 經濟分析系統可以提供餅圖、柱狀圖、走勢圖、曲線圖等多種圖形展示。 數據快報功能模塊,可以快速提供所需數據,通過這些數據隨時能夠查看經濟的運轉情況。 數據分析功能模塊具有強大的數據匯總能力和多角度的數據分析能力,支持趨勢、構成、同比、環比、對比、排名、預警KPI 等多種分析能力。企業跟蹤模塊能夠對確定的目標進行跟蹤與分析,支持對各種經濟運行目標的設定和跟蹤,以全面跟蹤目標完成狀態和對本期目標完成情況提前進行預測。 關聯分析模塊提供強大的數據分析預測功能,支持如回歸分析、灰色關聯等常用的數據挖掘算法。 綜合評價模塊功能提供強大的自定義分析查詢功能,可根據需要自行組合、選擇查詢條件,形成分析報表。 經濟預測模塊通過時間序列、灰色預測等方法進行數據的預測分析。

圖1 系統框架
在經濟分析系統中,以企業為例,數據快報模塊主要包括快報企業完成的情況、增加的情況和累計增加的情況。 數據分析模塊通過對企業運行監測分析后,形成趨勢分析、構成分析、對比分析和排名分析。 趨勢分析主要分析指定指標在指定時間段內的走勢情況;構成分析是分析指定指標在指定時間段內的構成情況,反映某一領域為整個行業的經濟拉動點;對比分析指定指標在一段時間段內產業分類隨時間對比情況;排名分析則是分析指定指標在一段時間段內的企業排名及其變化情況。
企業的目標跟蹤模塊用于對各種經濟運行目標設定和跟蹤,可以提前預測跟蹤目標完成狀態和完成情況。 不但可以設置各種經濟運行目標,而且能夠跟蹤各種經濟運行目標完成狀態。
關聯分析模塊中采用回歸分析和灰色關聯分析的數據挖掘算法進行數據分析。 采用視圖的方式來展現,可以分為數據視圖、模型視圖、檢驗視圖和預測視圖。 數據視圖主要用于選定初始樣本數據,提供樣本數據編輯功能和趨勢圖。 模型視圖是用于顯示模型計算結果,提供模型選擇功能。 檢驗視圖主要檢驗前一步樣本數據計算得到的回歸模型,提供顯著性水平和查看詳細檢驗結果功能。 預測視圖是用于對指標的未來趨勢進行預測,提供自變量值設置功能。
綜合評價模塊使用降維方法分析多個指標的綜合狀況,得出這些指標的得分排名和綜合得分排名。 采用主成分分析和因子分析的方法,以視圖形式來呈現,主成分分析視圖用于選定初始樣本數據,提供樣本數據編輯功能。 因子分析視圖提供因子數量設置功能,用于顯示因子分析結果。
經濟預測模塊根據時間序列和灰色預測的方法來預測分析,時間序列是從長期趨勢、隨機因素方面分析指標變化規律與趨勢,最終得到分析綜合結果,并在此基礎上進行預測。 灰色預測是用灰色模型分析,通過指標隨時間變化規律與趨勢,得到預果。 經濟預測模塊不但提供隨機數據獲取和隨機模型分析功能,而且對經濟指標的未來趨勢進行預測,提供預測期數和顯示因素設置功能。
經濟分析系統設計中最為重要的是關聯分析所采用的數據挖掘算法,主要包括回歸分析和灰色關聯分析。 回歸分析的基本思路是對多維空間中存在的樣本數據,用特征的線性組合去擬合多維空間中點的分布和軌跡[6]。 回歸方式包括一元回歸、多元回歸。 回歸目的可以尋找變量間的相關程度,也可以給出變量間的相關模型。
經濟分析系統中的回歸分析是以指定自變量指標和指定因變量指標在指定時間范圍內、指定主要口徑和次要口徑、指定時間顆粒度的歷史數據為樣本數據,分析自變量指標對因變量指標的貢獻或影響,得出模型后,可給出一個自變量指標值來預測因變量指標值。圖2 表示的是回歸分析中一元回歸數據視圖,通過對樣本數據的自累加或自累減,提供出樣本數據編輯功能和趨勢圖,分析結果包含原始數據、散點圖和統計描述。 圖3 表示的是回歸分析中的一元回歸模型視圖,顯示出模型回歸方程的計算公式、擬合度和標準誤差,模型結果顯示出回歸描述圖。

圖2 回歸分析中一元回歸數據視

圖3 回歸分析中一元回歸模型視
灰色關聯分析是一種多因素統計分析方法,它是以各因素的樣本數據為依據用灰色關聯度來描述因素間關系的強弱、大小和秩序。 若樣本數據反映出的兩因素變化的態勢基本一致,也就是同步變化程度高,則它們之間的關聯度較大;反之,則認為關聯度較小。 因此,可用灰色關聯分析法來衡量某區域各個指標之間的關聯程度[7]。
經濟分析系統進行數據分析時的影響因子錯綜復雜,難以用精確的模型進行定量研究,而灰色關聯分析是根據因子間幾何形狀的相似程度來衡量各因子關聯度的方法,因子間幾何形狀越相似,其關聯程度就越大,發展變化趨勢也越接近[8]。 無論樣本量多少以及樣本有無規律,灰色關聯分析法都能夠適用,為經濟分析系統影響因素的定量分析提供了比較好的途徑,關聯度計算時首先可以確定出比較和參考的序列,然后將選擇的序列建立關聯系數矩陣,接著計算出關聯系數,得出關系系數圖,最后得到關聯度[9]。
經濟分析系統中的灰色關聯分析通過樣本數據,具體分析了工業增加率、產銷率、工業增加值、工業總產值、工業銷售產值和GDP 在數量上多個指標間的關聯程度,從而得出這些指標的灰色關聯系數圖、關聯系數矩陣,如圖4 所示。

圖4 灰色關聯的關系系數圖和關聯系數矩陣
在大數據時代,本研究借助經濟分析系統,通過進行數據分析,可以針對大數據進行經濟分析和預測,特別在關聯分析的數據挖掘方面做出有益的探索。 本文運用回歸分析、灰色關聯的數據挖掘算法,可以挖掘出關聯性強的數據關系,能夠進行有效的數據分析,并作出可靠的經濟預測,提高預測的精準度,為政府部門或企業進行調控、精準施策提供有用的參考,具有一定的價值。