杭曉亞, 柳敘豐 , 趙澤昆
(1. 山東科技大學土木工程與建筑學院,山東青島 266590; 2. 中儲發展股份有限公司青島分公司,山東青島 266590; 3. 山東科技大學測繪科學與工程學院,山東青島 266590)
·經營與管理·
基于GA-BP神經網絡的青島房價預測
杭曉亞1, 柳敘豐2, 趙澤昆3
(1. 山東科技大學土木工程與建筑學院,山東青島 266590; 2. 中儲發展股份有限公司青島分公司,山東青島 266590; 3. 山東科技大學測繪科學與工程學院,山東青島 266590)
通過市場調查和專家咨詢,選取2000年~2013年青島市的平均房價及其主要影響因子作為研究數據。鑒于BP神經網絡具有收斂速度慢、易陷入局部極小值的缺陷,充分利用遺傳算法(GA)的優點,以matlab軟件為工具,對BP神經網絡進行優化處理,建立GA-BP神經網絡預測模型,對青島市房價做出預測。研究表明,與一般的BP神經網絡預測模型相比,經GA優化后的BP神經網絡預測模型具有收斂速度快、預測精度高等優點。
BP神經網絡; 遺傳算法; matlab; 房價預測
BP神經網絡是一種基于誤差反向傳播的多層前饋神經網絡,由輸入層、隱含層、輸出層組成,相鄰兩層的神經元處于全連接狀態,而同層神經元之間相互獨立。該網絡的主要特點是信號前向傳播和誤差反向傳播[1]。在前向傳播中,輸入信號從輸入層經隱含層逐層處理,直至輸出層。每一層的神經元狀態只影響下一層神經元狀態。如果輸出層得不到期望輸出,則轉入反向傳播,根據預測誤差調整網絡權值和閥值,使預測值不斷逼近期望值[2-3]。單隱層的BP神經網絡可以映射所有連續函數,其網絡結構如圖1所示。

圖1 單隱層BP神經網絡結構
1.1 數據處理
本文選取2000年~2013年青島市生產總值、人口數量(戶籍人口)、職工平均工資、城市居民可支配收入、房地產開發投資額、商品房銷售面積、施工面積為輸入指標[4],平均房價為輸出指標。數據主要來源于國家統計局和青島市統計信息網(表1)。
實驗采用單隱層BP神經網絡模型和滾動預測方式,即用前兩年的影響指標來預測第三年的房價。按此方法,共有12組輸入數據,14個輸入層神經元節點,選取前9組數據為訓練樣本,后3組為測試樣本。
1.2 參數值確定
采用動量梯度下降算法訓練BP神經網絡,訓練函數為traingdm。動量項系數mc=0.9,學習率lr=0.01,目標誤差goal=0.001,訓練次數epochs=10 000,每50次顯示一次結果,即show=50,初始權值和閥值為系統默認值。
實驗選取tansig函數和purelin函數作為隱含層和輸出層的傳遞函數,輸入層節點數為14,輸出層節點數為1,隱節點數用試湊法確定。試湊法的基本原理是保持樣本集和參數值不變,逐漸增加隱節點數,提取誤差最小時對應的節點數作為實驗值。試湊步驟開始前,先用隱節點數經驗公式確定節點取值范圍,常用的經驗公式為[5]:
其中:m為隱節點數;n為輸入層節點數;l為輸出層節點數;α取1~10。由此可得實驗中隱節點數取值范圍為5~14。訓練次數為4 000時,對訓練樣本的訓練結果見表2。
由表2可知,hiddennum=13時mse最小,故本文選取13作為BP神經網絡隱節點數。
2.1 遺傳算法優化處理
(1)種群初始化。個體編碼采用實數編碼,編碼長度:
L=n×m+m+m×l+l
其中:n為輸入層節點數;m為隱節點數;l為輸出層節點數。
(2)適應度函數。用訓練后的BP神經網絡對系統進行預測輸出,將預測輸出與期望輸出之間的誤差絕對值之和作為個體適應度值:

表1 2000年~2013年青島房價及影響因素

表2 不同隱節點數訓練誤差
其中:m為輸出層節點數;yi為神經網絡第i個節點的期望輸出;oi為第i個節點的預測輸出;k為系數。
(3)選擇操作。采用輪盤賭法[6],個體i對應的選擇概率:

(4)交叉操作。采用實數交叉法,第k個染色體ak和第l個染色體al在j位的交叉操作為:
其中:b為[0,1]內的隨機數。
(5)變異操作。對個體i的第j個基因aij進行變異:

循環(1)~(5)的操作,直到滿足擬定的收斂條件。
2.2 參數值確定
取種群規模M=50,進化次數maxgen=100,交叉概率pc=0.5,變異概率pm=0.02。
3.1 計算結果對比
計算結果見圖2、圖3、表3、表4。

圖2 訓練樣本預測輸出

圖3 測試樣本預測輸出

年份實際值/(元·m-2)預測值/(元·m-2)BPGA-BP絕對誤差/(元·m-2)BPGA-BP相對誤差/%BPGA-BP20022186.002159.602165.7026.4020.301.2080.92920032406.002427.902429.6021.9023.600.9100.98120042965.493049.803017.4084.3151.912.8431.75020053744.083590.103665.10153.9878.984.1132.10920064249.064351.904301.80102.8452.742.4201.24120075200.555142.305168.3058.2532.251.1200.62020085094.005073.605080.2020.4013.800.4000.27120095576.005587.705577.7011.701.700.2100.03020106576.006594.806574.8018.801.200.2860.018平均相對誤差/%BPGA-BP1.5010.883

表4 測試樣本計算結果
由上述圖表可知,GA-BP神經網絡對訓練樣本、預測樣本的預測輸出精度均高于BP神經網絡的輸出精度。
3.2 收斂速度對比
圖4、圖5顯示,目標誤差goal=0.001時,BP神經網絡經9 016次迭代達到誤差標準,收斂于0.000 999 98;GA-BP神經網絡經4 827次迭代達到誤差標準,收斂于0.000 999 87。顯然,GA-BP神經網絡較一般BP神經網絡收斂速度快。

圖4 BP神經網絡訓練誤差曲線

圖5 GA-BP神經網絡訓練誤差曲線
綜上述,遺傳算法可以提高BP神經網絡的預測精度和收斂速度。以2012年和2013年的數據為輸入樣本,用訓練好的GA-BP神經網絡對青島市2014年的平均房價進行預測,預測值為9 082.45 元/m2。
本文通過遺傳算法實現了對BP神經網絡結構和性能參數的同步優化,建立了基于GA-BP神經網絡的青島市房價預測模型。對比BP神經網絡和GA-BP神經網絡的仿真結果發現,經遺傳算法優化后的BP神經網絡模型在降低計算誤差的同時,減少了達到目標誤差時的迭代次數。實驗表明,GA-BP神經網絡有效避免了BP神經網絡易陷入局部極小值的盲目性,同時提高了計算效率,適用于對房價預測等非線性問題的研究。此外,對房價的預測有助于房地產開發商和購房消費者進行理性決策。
[1]LiangguangMo,ZhengXie.AnImprovedBPNeuralNetworkbasedonIPSOandItsApplication[J].JournalofComputers, 2013(5): 1267-1272.
[2] 陳豐. 基于BP神經網絡的建筑工程前期階段成本估算方法[J]. 建筑經濟, 2012(12): 89-91.
[3] 史佳, 冀巨海. 基于BP神經網絡的黃河中下游人口預測研究[J]. 科技管理研究, 2014,30(6): 245-250.
[4] 姜永增. 房價影響因素的實證分析——以青島市為例[J]. 價值工程, 2011, 30(28): 319-320.
[5] 韓力群. 人工神經網絡理論、設計及應用[M]. 北京: 化學工業出版社, 2007.
[6] 李松, 劉力軍, 解永樂. 遺傳算法優化BP神經網絡的短時交通流混沌預測[J]. 控制與決策, 2011(10): 1581-1585.
F293.352
A
杭曉亞(1991~),女,碩士研究生,研究方向:房地產經營與管理、工程項目管理; 柳敘豐(1989~),男,研究方向:物流項目管理、BP神經網絡; 趙澤昆(1990~),男,碩士研究生,研究方向:大地測量、matlab仿真。
[定稿日期]2015-06-30