邵正澤
摘 要 文章針對日常經濟數據的特點,結合人工神經網絡對大數據的處理能力,研究了數據的智能化處理技術。以農村快遞業務數據分析為例,預測得到農村經濟發展的程度,從而驗證了分析方法的有效性。最后對智能化數據處理技術存在的問題進行了探討與對策分析。
關鍵詞 數據;智能化處理;經濟;人工神經網絡
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2018)225-0136-02
隨著社會的不斷進步,諸多行業都引入了計算機技術和互聯網技術。與之而來的,便是大量的數據。在許多行業的運行中,數據起著至關重要的作用。高效率地處理數據是行業發展的需要,也是社會進步的標志。然而,隨著數據量與日俱增,傳統的智能數據處理方式逐漸顯現出了不足之處,如無法處理非線性信息,抽象信息等。而人工神經網絡正是基于上述問題發展而來的智能信息數據處理技術,該技術可以有效滿足人們在生產生活中對數據處理的需求,并已在諸多領域得到應用。
經濟數據的分析,正在對行政管理和經濟政策的制定起著重要作用。通過分析一個地區的經濟水平,有關部門可以評估當地經濟的發展形勢,并依據分析結果進行決策。傳統的經濟學統計方法,因為其算法及思路的局限性,難以對經濟形勢做出較為準確的分析。本文利用人工神經網絡利于處理不完整的、模糊的、不確定的、無規律的數據的優勢,通過對人工神經網絡結構及其算法進行深入分析,并將某農村的快遞量與當地的經濟狀況建立聯系,通過人工神經網絡的智能處理,得到的結果為有關部門提供決策依據。
1 數據智能化處理技術
1.1 概況
在當今時代,隨著數據量的不斷擴大,傳統的智能數據分析法越來越難以滿足人們對數據處理的需求。但一些經典的方法依然可以沿用:首先是決策樹。它基于信息論基礎,輸出的數據易于為人理解,但其面對復雜的數據時有所欠缺。其次是相關規則,它通常用于解決龐大數據量的分析,人們常用它來削減搜索空間。第三種是遺傳算法。它利用生物學上的相關理念進行問題搜索,運用生物進化等理念構造適應函數,并引入選擇、復制、交配和突變等情形以達到優化數據的目的。第四種是粗糙集。它可以將未知的、不準確的數據用已知的、準確的數據來模糊刻畫,從而達到分析數據的目的。最后是人工神經網絡,是通過借助大量處理器構造成類似人腦的神經網絡,實現對數據的處理目的。
本文正式基于對人工神經網絡的研究與應用現狀,通過結合人工神經網絡在大數據處理中的優勢,探討其在經濟數據處理中的應用,下面將對人工神經網絡數據處理技術進行深入分析總結。
1.2 基于人工神經網絡的數據處理技術
人工神經網絡最早于1943年由心理學家W.S.McCulloch和數理邏輯學家W.Pitts提出。人工神經網絡技術是基于現代神經科學的研究成果,通過各單元的信息交流,模擬大腦神經突觸的方式進行數據處理。作為當今智能數據處理的主要技術之一,已經在信息科學、心理學、認知科學、醫學等理論學科以及控制、交通、氣象監測等實踐領域被廣泛應用。其建構基礎是類似于人腦中的神經元處理單元,在不同領域的應用中,處理單元可以表示為不同的對象,例如某個特定的數據、字母、概念、或者一些有意義的抽象模式。處理單元通常可以分為3類:輸入單元、隱含單元和輸出單元,一般結構如圖1所示。輸入單元負責向人工神經網絡輸入數據,輸出單元負責向操作者傳送處理后的數據,真正的數據處理由隱含單元實現。各個單元之間的連接強度可以通過連接權值反應,操作者增加或減少某條通路上的權值便可以達到優化神經網絡的數據處理目的,其中圖2是一個典型節點處理模型。
人工神經網絡采用了與傳統數據處理方法完全不同的思路,克服了傳統的基于邏輯符號的人工智能處理系統在處理非線性信息,非直接化信息方面的不足,具有自適應、自學習等特點,也具有聯想存儲及高效尋找優化解的能力。
2 經濟數據處理案例分析
2.1 案例背景介紹
近年來,隨著電商業務的不斷蓬勃發展,生活在農村的百姓也逐漸習慣網上購物,農村地區快遞與物流業持續繁榮,互聯網經濟在農村整體經濟的占比持續提升。
判斷一個村的經濟發展情況需要對一系列經濟指標進行綜合判斷,但這種方法耗時耗力且需要一定的統計周期,并不利于管理者快速決策。快遞與物流業務數據雖然只是農村經濟發展各項指標中的很小一部分,但通過數據挖掘建模,可以在大概率上預測成功農村發展的水平,為高效管理決策做支持。
2.2 數據分析模型
2.2.1 數據來源
由于鄉村經濟發展和快遞物流數據難以完全獲得,且本文只是為了證明通過數據挖掘技術可以高效預測農村經濟發展水平,即挖掘技術在經濟決策中的可行性,因此分析模型共模擬了村莊的快遞、物流和經濟發展水平信息,如圖3所示。
圖3為對1 000個農村數據的散點圖展示,橫軸為快遞業務量(件/月),縱軸為物流業務量(噸/月),大的散點代表經濟發達的村莊,小的散點代表經濟欠發達的村莊,從圖中可以大致看出,快遞業務和物流業務越發達的地區,農村經濟發展越好
2.2.2 數據處理
運用統計軟件來進行數據讀取,剔除異常值后,進行數據建模。隨機選取70%的數據定義為訓練集,30%為測試集。用訓練集來做BP神經網絡模型,再用測試集進行效果驗證,通過調整參數,選取混淆矩陣中預測準確率最高的模型,最終選取的參數為:隱藏節點數為3,權值的衰減參數為0.05,迭代次數為10 000次。
2.3 處理結果分析
訓練集、測試集的混淆矩陣如圖4所示。訓練集中分類準確率為81%,測試集中分類的準確率為77%,表明如果已知農村快遞量和物流量,我們有77%的把握預測對該農村經濟發展的程度。
3 智能數據處理技術存在的問題及對策
3.1 存在問題分析
對于數據本身而言,在某些行業運用智能數據處理技術處理數據往往會遇到非常大的困難。許多行業的數據積累在數據標準規范上缺乏預先定義可廣泛適用的描述,在數據的分類上也會有不完全的現象,甚至出現分類出錯的問題,使智能處理數據技術遠不能達到其預期作用。
對于本文所提到的人工神經網絡而言,因其采用了與傳統數據處理方法完全不同的思路,克服了傳統的基于邏輯符號的人工智能處理系統在處理非線性信息和非直接化信息方面的不足,人們更希望將它用于處理回歸估計型的問題。目前在國內,人工神經網絡回歸型結構研究還很少。在建立人工神經網絡時,人們更加注重的是規則對于計算機的可理解性,這會犧牲一定的預測結果保真性。在不斷錄入數據的同時,需要對整個人工神經網絡進行不斷訓練,從而使預測結果盡可能準確,這個過程會耗費大量的人力物力。
3.2 相關解決措施
在提高數據質量上,需要人們在某些數據質量欠佳的行業整合異構數據源,如在多個數據源擁有者之間建立具有一致性的協議,并提供相應的接口;加強數據質量監督,系統地記錄并跟蹤數據質量,如增加對數據的溯源、處理歷史、演化及更新等方面的標準研究;促進數據的開放共享,建立一些大數據公共資源庫,通過多方的數據處理而得到平均結果,從而提高人工神經網絡預測的準確度。
在完善人工神經網絡上,需要相關機構在回歸估計問題領域對人工神經網絡進行研究,提出解決方案,提高人工神經網絡的普適性;在輸入人工神經網絡處理規則時,人們需要在保真性與可理解性之間尋找平衡點,使人工神經網絡在可以理解并計算的同時提供最大限度準確的結果;在處理不斷錄入的數據時,如果人工神經網絡可以具備增量學習能力,其便可以不斷完善自身,不必再耗費人力物力完善。
4 結論
通過本文實例研究,發現利用人工神經網絡模型,可以通過少量的局部經濟指標參數預測全局經濟指標,相比傳統統計方法,人工神經網絡模型預測速度更快,且計算精度并未降低,較傳統的統計學分析方法消耗的人力物力更少。因此,相比傳統統計方法,采用人工神經網絡模型處理經濟數據、輔助經濟決策,是更為科學合理的選擇。
參考文獻
[1]朱大奇,史慧.人工神經網絡原理及應用[M].北京:科學出版社,2006.
[2]李騫,郭慧玲. 經濟預測與分析的智能數據挖掘[J].煤炭技術,2011,30(10):223-225.
[3]徐坤.OLAP在宏觀經濟智能決策支持系統中的研究與應用[D].南昌:南昌大學,2012.
[4]徐緒松,吳健謀,胡則成.金融數據分析智能信息處理技術[J].科技進步與對策,2000,17(6):95-96.
[5]畢春杰.數據挖掘技術在經濟統計中的應用探究[J].經濟視野,2013(19).