摘要:根據(jù)農(nóng)業(yè)價格指數(shù)構(gòu)建了農(nóng)產(chǎn)品價格數(shù)據(jù)倉庫,充分利用長期積累的大量反映價格指標的歷史和現(xiàn)在數(shù)據(jù)資源,并結(jié)合徑向基函數(shù)(RBF)人工神經(jīng)網(wǎng)絡建模,揭示農(nóng)產(chǎn)品價格與畜牧業(yè)、林業(yè)與漁業(yè)等相關(guān)因素價格的動態(tài)關(guān)系模型。結(jié)果表明該模型能夠很好地預測以白菜為例的農(nóng)產(chǎn)品價格,實現(xiàn)農(nóng)產(chǎn)品區(qū)域供求平衡,并為政府和農(nóng)戶提供結(jié)構(gòu)調(diào)整的依據(jù)。
關(guān)鍵詞:農(nóng)產(chǎn)品;數(shù)據(jù)倉庫;價格預測;RBF神經(jīng)網(wǎng)絡。
中圖分類號:F323.7;TP368.1文獻標識碼:A文章編號:0439-8114(2011)14-2976-03
Design and Implementation of Produce Price Forecast System
LI Yan1,LIU Jun2
(1.College of Computer Science and Technology,Shandong University of Technology, Zibo 255049,Shandong,China;
2.Department of Computer and Information Technology, Nanyang Normal University, Nanyang 473061,Henan,China)
Abstract: Farm produce price data warehouse was established according to the agriculture price indices. The dynamic relationship model of farm produce price with stock rising, forestry and fishery was built based on the numerous accumulated history and present data resources which could reveal the price indices combining with RBF neural network modeling. The result proved that the model could simulate and forecast the price trend of cabbage correctly, providing an important method for the accurate forecast of agricultural product market information.
Key words: agricultural products; data warehouse; price forecast; RBF neural network
在我國目前以市場為先導的情況下,農(nóng)業(yè)產(chǎn)品市場將面臨著越來越嚴酷的競爭形勢。為此,地方政府和農(nóng)戶必須在制定明確的農(nóng)業(yè)產(chǎn)品指標計劃的前提下,根據(jù)現(xiàn)實資源的狀況,組織農(nóng)業(yè)生產(chǎn)。農(nóng)產(chǎn)品價格數(shù)據(jù)對于指導農(nóng)產(chǎn)品生產(chǎn)以及調(diào)整農(nóng)業(yè)結(jié)構(gòu)具有重要意義,因此使用農(nóng)產(chǎn)品的歷史價格數(shù)據(jù)對未來價格趨勢進行有效地預測顯得尤為重要。農(nóng)產(chǎn)品價格與畜牧業(yè)、林業(yè)與漁業(yè)等相關(guān)因素之間存在著復雜的線性、非線性關(guān)系和交互作用,自變量和因變量是純粹的離散數(shù)據(jù),無法用數(shù)學公式來表示。
因此,必須找到一種適應這種自變量和因變量的特性、反映它們之間關(guān)系的模型,將給農(nóng)業(yè)管理部門和農(nóng)戶提供有效的價格預測和決策支持。針對上述問題,本研究提出構(gòu)建農(nóng)業(yè)信息數(shù)據(jù)倉庫,并結(jié)合徑向基函數(shù)(Radial basis function,RBF)人工神經(jīng)網(wǎng)絡建模對農(nóng)產(chǎn)品價格進行預測。
1構(gòu)建農(nóng)產(chǎn)品數(shù)據(jù)倉庫
構(gòu)建農(nóng)產(chǎn)品信息數(shù)據(jù)倉庫主要涉及數(shù)據(jù)的清理和集成,它是數(shù)據(jù)挖掘的一個重要的預處理步驟,即農(nóng)產(chǎn)品價格預測提供數(shù)據(jù)環(huán)境[2]。
數(shù)據(jù)模型是數(shù)據(jù)倉庫設(shè)計的基礎(chǔ)。數(shù)據(jù)模型是對現(xiàn)實世界進行抽象的工具,抽象的程度不同,就形成了不同抽象級別層次上的數(shù)據(jù)模型。在數(shù)據(jù)倉庫設(shè)計中存在三層數(shù)據(jù)模型如圖1所示,即概念模型、邏輯模型和物理模型。但數(shù)據(jù)倉庫的數(shù)據(jù)模型與操作型數(shù)據(jù)庫數(shù)據(jù)模型有一定的區(qū)別,主要表現(xiàn)在:數(shù)據(jù)倉庫中的數(shù)據(jù)模型不包括純操作型的數(shù)據(jù);數(shù)據(jù)倉庫中的數(shù)據(jù)模型擴充了碼結(jié)構(gòu),增加了時間屬性作為碼的一部分;數(shù)據(jù)倉庫中的數(shù)據(jù)模型增加了導出數(shù)據(jù)。這三點差別是數(shù)據(jù)倉庫作為面向數(shù)據(jù)分析處理所要求的。
1.1概念模型設(shè)計
概念模型是決策信息由具體到抽象的第一步,它是一個為決策目標設(shè)計系統(tǒng)和收集信息而服務的概念性工具,它是由客觀世界到計算機實現(xiàn)的中間層次。
1.1.1決策需求分析農(nóng)產(chǎn)品價格預測系統(tǒng)是以農(nóng)產(chǎn)品歷史和現(xiàn)在的市場數(shù)據(jù)為基礎(chǔ),通過分析它們之間的相關(guān)關(guān)系,建立數(shù)學模型,并通過一定的定性分析,實現(xiàn)農(nóng)產(chǎn)品價格預測的最佳值。因此,建立農(nóng)產(chǎn)品數(shù)據(jù)倉庫的目的是為決策支持系統(tǒng)提供數(shù)據(jù),具體地說,就是為數(shù)據(jù)挖掘提供分析數(shù)據(jù)。
1.1.2支持決策的數(shù)據(jù)需求分析數(shù)據(jù)倉庫的開發(fā)過程如圖1所示,所研究的農(nóng)產(chǎn)品價格預測系統(tǒng)是以數(shù)據(jù)為驅(qū)動的。數(shù)據(jù)倉庫是面向主題的,針對農(nóng)產(chǎn)品價格預測系統(tǒng)的要求,支持決策的數(shù)據(jù)需求分析主要從不同的角度為農(nóng)業(yè)人員提供農(nóng)業(yè)產(chǎn)品的生產(chǎn)、銷售、庫存的信息,使管理者全面、及時、準確地掌握成本、價格、市場需求等基礎(chǔ)數(shù)據(jù)。
1.2邏輯模型設(shè)計
邏輯模型是概念模型和物理模型之間的橋梁。農(nóng)產(chǎn)品數(shù)據(jù)倉庫是建立在關(guān)系數(shù)據(jù)庫的基礎(chǔ)上,所以,數(shù)據(jù)倉庫設(shè)計過程所采用的邏輯模型主要是關(guān)系模型。根據(jù)農(nóng)產(chǎn)品數(shù)據(jù)倉庫的需求,數(shù)據(jù)倉庫模型采用星型架構(gòu)。星型架構(gòu)包括兩個邏輯實體:事實數(shù)據(jù)表、維度表。農(nóng)產(chǎn)品價格事實數(shù)據(jù)表與維度表之間的星型架構(gòu)數(shù)據(jù)模型如圖2所示。
1.2.1事實數(shù)據(jù)表每個數(shù)據(jù)倉庫或數(shù)據(jù)集市都包括一個或多個事實數(shù)據(jù)表。星型架構(gòu)的中心是一個事實數(shù)據(jù)表,用以捕獲衡量單位業(yè)務運作的數(shù)據(jù)。事實數(shù)據(jù)表中包含的數(shù)據(jù)隨著時間的推移會變得十分龐大,是數(shù)據(jù)分析的中心。
1.2.2維度表與指標事實數(shù)據(jù)表相比,維度表是一個小得多的實體,維度表包含描述事實數(shù)據(jù)表中的事實記錄的特性。
1.3物理模型設(shè)計
物理模型是邏輯模型在數(shù)據(jù)倉庫中的實現(xiàn)模式,是邏輯模型的軟件實現(xiàn)過程。
1.3.1數(shù)據(jù)倉庫實現(xiàn)平臺研究采用的是Microsoft公司的SQL-Server2000。SQL-Server2000具有強大的后臺支持功能,是理想的C/S結(jié)構(gòu)的后臺開發(fā)工具。
1.3.2數(shù)據(jù)結(jié)構(gòu)類型數(shù)據(jù)結(jié)構(gòu)合理與否將直接影響到數(shù)據(jù)倉庫的工作效率。數(shù)據(jù)倉庫中的數(shù)據(jù)結(jié)構(gòu)有兩方面的含義:一是數(shù)據(jù)表設(shè)計中的字段屬性設(shè)置(數(shù)據(jù)屬性、長度、空值等),合理的字段屬性設(shè)置將會提高數(shù)據(jù)倉庫的操作速度和性能;另一個是數(shù)據(jù)倉庫中數(shù)據(jù)的非規(guī)范化處理,如:填加字段、細節(jié)數(shù)據(jù)的概化等。
1.3.3數(shù)據(jù)存放位置合理的存放位置對提高數(shù)據(jù)倉庫操作性是至關(guān)重要的。數(shù)據(jù)倉庫的存放原則主要有:把共享的數(shù)據(jù)表存放在服務器上;從數(shù)據(jù)安全的角度出發(fā),把整個企業(yè)的細節(jié)數(shù)據(jù)存放在客戶機或服務器上;不要把經(jīng)常連接的表放在同一設(shè)備上;不要把數(shù)據(jù)表和索引放在同一個設(shè)備上。
2基于RBF神經(jīng)網(wǎng)絡的農(nóng)產(chǎn)品價格預測
2.1RBF神經(jīng)網(wǎng)絡
RBF神經(jīng)網(wǎng)絡是由Moody和Darken于20世紀80年代末提出的,網(wǎng)絡中的神經(jīng)元是分層排列的,每個神經(jīng)元只與前一層神經(jīng)元相連,共分為三層(圖3)。它是由三部分組成的前饋式網(wǎng)絡:第一部分是輸入層,由信號源節(jié)點組成;第二部分是隱含層,一般采用高斯函數(shù)作為其節(jié)點的基函數(shù);第三部分是輸出層,神經(jīng)元采用線性傳遞函數(shù)。RBF神經(jīng)網(wǎng)絡模擬了人腦中局部調(diào)整、相互覆蓋接受域的神經(jīng)網(wǎng)絡結(jié)構(gòu),因此具有較強的局部逼近特性。
2.2RBF神經(jīng)網(wǎng)絡在農(nóng)產(chǎn)品價格預測中的應用
2.2.1模型建立選取某市2007~2009年共3年的農(nóng)產(chǎn)品市場價格數(shù)據(jù)作為訓練樣,2008年下半年月報表數(shù)據(jù)如表1所示,進行自適應RBF神經(jīng)網(wǎng)絡訓練。所謂自適應RBF網(wǎng)絡是指:最初RBF網(wǎng)絡只有一個隱神經(jīng)元,每訓練一次,網(wǎng)絡就增加一個隱神經(jīng)元,直到滿足訓練誤差要求為止。這樣就能夠產(chǎn)生一個最小化的RBF網(wǎng)絡。利用Matlab軟件編程對網(wǎng)絡進行訓練,經(jīng)過訓練,網(wǎng)絡誤差將達到理想要求即網(wǎng)絡總誤差不大于0.005。
2.2.2RBF預測檢驗利用訓練好的網(wǎng)絡對2009年上半年白菜價格進行預測檢驗,將這6個月的實際農(nóng)產(chǎn)品數(shù)據(jù)輸入網(wǎng)絡,得到預測值(見表2)。由預測結(jié)果可知,采用RBF神經(jīng)網(wǎng)絡模型預測白菜價格,其誤差均小于0.3%,這充分說明RBF網(wǎng)絡模型具有較高的預測精度,模型的泛化能力較好,可用于農(nóng)產(chǎn)品價格的預測。
3結(jié)論
提出了構(gòu)建農(nóng)產(chǎn)品數(shù)據(jù)倉庫,并將RBF神經(jīng)網(wǎng)絡模型應用到農(nóng)產(chǎn)品價格預測中。采用RBF神經(jīng)網(wǎng)絡模型對農(nóng)業(yè)領(lǐng)域中的產(chǎn)品價格數(shù)據(jù)進行短期預測并取得了良好的預測效果。試驗表明該模型可以為農(nóng)產(chǎn)品生產(chǎn)與流通提供重要的數(shù)據(jù)指導。應當指出的是,影響一個地區(qū)的農(nóng)產(chǎn)品價格的因素很多,諸如供求、當?shù)厥杖胨健嬍沉晳T、天氣變化、國家宏觀經(jīng)濟調(diào)控及相關(guān)政策的影響等,這些因素將對未來時期農(nóng)產(chǎn)品的價格趨勢造成很大影響,因此建議對已經(jīng)建立模型,通過數(shù)據(jù)倉庫的更新數(shù)據(jù)來修正RBF模型,從而使模型具有更好的預測性。
參考文獻:
[1] 范雋,雷英杰. 基于RBF神經(jīng)網(wǎng)絡的空戰(zhàn)威脅評估[J]. 微計算機信息,2008(21):203-204.
[2] 國涓,李會敏. 我國農(nóng)產(chǎn)品價格波動的影響趨勢分析[J]. 沈陽農(nóng)業(yè)大學學報(社會科學版),2007,9(2):144-147.
[3] 林建永,趙瑾璐. 農(nóng)產(chǎn)品價格波動的非典型因素探析[J]. 理論探索,2009(5):73-75.
[4] 徐蘭芳. 數(shù)據(jù)倉庫的訪問控制策略研究[J]. 計算機應用與軟件,2007,24(12):34-35,59.
[5] 梁佳,劉東英. 中國農(nóng)產(chǎn)品流通體制變革的動因與趨勢[J]. 中國農(nóng)學通報,2010,26(20):417-422.
注:本文中所涉及到的圖表、注解、公式等內(nèi)容請以PDF格式閱讀原文