王飛 王學明 王新一
摘要分析了各種房地產應用軟件,將數據挖掘技木引入房地產預警系統設計中,結合數據倉庫和決策支持系統,建立了基于粗糙集數據預處理的支持向量機預警模型,運用3σ警界控制原理確定各狀態區間,劃分出不同的警度,并提出了房地產市場預警預報系統的完整解決方案,最后,結合銀川市的實際情況,構建了銀川市房地產預警系統指標體系。
關鍵詞房地產,數據挖掘,粗糙集理論,支持向量機
中圖分類號TP392文獻標志碼A 文章編號:1006-8228(2012)01-24-03
O引言
近幾年來,計算機技術的飛速發展,為房地產預警與計算機技術的結合提供了前所未有的發展機遇和技術支持。數據倉庫、數據挖掘技術以其強大的決策支持功能和良好的發展前景而受到越來越多的關注。進入21世紀,隨著我國經濟體制改革和商品經濟的發展,房地產業正在迅速崛起。為了全面、及時、準確地掌握房地產市場運行狀況,加強對房地產市場的監測和調控,避免房地產幣場非常態波動的出現,必須盡快建立房地產預警系統,實現對房地產市場的預警和對房地產投資、消費的引導,為政府制定房地產政策,保證房地產經濟健康、持續、穩定的發展提供重要的手段和決策依據。
1研究思路
本文先采用定性與定量相結合的分析方法選取兩個在房地產行業最具代表性的指標,再利用粗糙集對選定的指標進行數據預處理和指標約簡,最終確定影響房地產行業發展的重要指標并建立房地產預警指標體系。分布式系統、數據倉庫技術和數據挖掘技術的發展給以上問題的解決帶來了新的契機。
我們從建立房地產經濟的各類經濟統計指標,以及宏觀經濟中與房地產相關性較強的經濟統計指標的數據倉庫入手,充分利用房地產預警理論和方法的研究成果,建立各種預測、預警模型,并引入基于粗糙集數據預處理的支持向量機預警模型的,組成模型庫管理系統。同時,結合銀川幣的實際情況,采集銀川市不同時期的歷史數據,建立存貯非量化預警信息和相關知識的輔助信息庫作為補充,并運用3σ警界控制原理對各狀態的區間進行確定,劃分出不同的警度。最后根據警限值將預測值轉化為警度并進行預報。用戶可交互地為預警系統的定量分析補充定性分析的信息。
2房地產預警預報系統設計
2.1系統總體設計
房地產預警系統,簡單地說,就是能夠事先發出房地產警告信號的系統。房地產預警預報在本質上是以管理信息系統為基礎,兼有決策支持系統功能的計算機預警預報信息系統。房地產預警系統是構建在分布式系統構建之上,隨著數據的挖掘和時間變化而調整信息的,其數據的傳遞都是由系統的多方用戶即各房地產相關部門、決策者等交互完成。系統總體結構如圖1所示。整個系統從硬件的角度來看,每個應用程序由客戶端和服務器通過因特網或局域網連接來實現其功能。從軟件設計的角度看,整個系統采用分布式的表示層、功能層、資源層的三層結構。表示層位于客戶端,功能層是整個應用程序中最為重要的一層,對應于一個或多個用戶界面,是整個系統的價值的體現,資源層由幾個相關信息數據倉庫、房地產市場信息知識庫和模型庫組成,一般存放于服務器上。表示層主要是及時響應用戶發來的請求,驗證每個用戶請求的權限,并將所請求的最終數據返傳給客尸端。

2.2數據倉庫整體設計
基于數據倉庫的房地產預警系統以數據倉庫技術為核心,以聯機分析技術和數據挖掘技術為基礎,把原始數據系統開發的主要內容是匯集和整理成不同的數據庫群體,通過合理、全面的數據管理,再利用粗糙集對選定的指標進行數據預處理和指標約簡,使最終用戶可對獲得數據作直接處理,用以進行數據分析。預警預報所需數據要能反映基本數據所體現的整體趨向或隨時間變化而表現出來的變化趨勢,因此必須對基本數據進行分類、析取、歸納、加工等處理才能得到這些數據。這些數據構成數據倉庫的數據源,通過建立提取器,將來自數據原的、影響數據倉庫的數據定期的轉化為數據倉庫模式。當數據源中數據發生變化時,集成對數據進行過濾、轉化和綜合,并和其他數據合并,把新的數據集成到數據倉庫中。
為了建立一個質量過關的數據倉庫需要做好以下幾個工作。(1)數據倉庫設計。主要任務是數據倉庫環境的定義和設置,(2)數據抽取。從外部數據源定期提取數據并變換數據,對所獲得的源數據進行一些必要的加工處理,使其符合數據倉庫中數據庫可以有組織和存儲管理的數據格式和語義規范。(3)數據管理。數據的維護和分配,支持數據處理和應用。各種數據的存儲分發及分布到多個不同的數據庫服務器。數據的轉儲、恢復和維護,安全性檢測和定義等。
2.3數據挖掘
從信息源獲取信息,并將它們組織集成到數據倉庫,其目的在于對數據倉庫中的數據進行分析和綜合,我們采用了數據挖掘等第三方工具,對目前已有的信息進行挖掘,以加強系統預警功能。數據挖掘是在數據倉庫的基礎上進行知識發現。概括起來,它具有以下特點(1)需要對大量數據進行處理,(2)對模糊查詢要求,可以尋找用戶可能感興趣的信息,(3)它把大量的原始數據轉換成有價值的知識,用于描述過去的趨勢和預測未來的趨勢,(4)能迅速響應數據量陜速增長。
2.4需求分析
房地產預警的—般流程如圖2所示。系統開發的主要內容是建立數據庫數據倉庫,利用數據挖掘模型,選取最能代表房地產經濟發展的指標。預測是房地產預警的核心。房地產預警系統運行流程的實施步驟大致可歸納為(1)確定房地產預警監測的對象;(2)尋找警情產生的根原,(3)選定警兆指標,(4)確定警限(5)核算綜合預警指數,(6)劃分警級,(7)預報警度。其中明確警情是預警的前提,也是房地產預警研究的基礎,尋找警源,分析警兆,確定警限是對引起警情的各類因素作出定性和定量分析,而預報警度則是預警的目標。

3銀川市房地產預警實證分析
伴隨著西部大開發政策的逐步實施,銀川作為最適宜居住的城市之一,在城幣環境、幣政配套的不斷完善、房地產市場需求不斷走高及商品房綜合品質提升等因素影響下,房地產幣場呈現出了房價開始逐漸走高,商品房投資額增幅加大,內部結構不平衡等發展偏熱的跡象。
3.1方法論
(1)評價無非就是對指標運行處于正常、基本正常、異常等何種狀態等作出判斷。這種判斷應該基于成熟的定量分析工具同經驗分析的結合。本文用警界控制原理對各狀態的區間進行確定,采用兩倍標準差作為房地產預警系統指標是否異常(過熱或過冷)的依據。同時,選擇偏離均值一倍到兩倍的區間作為預警指標偏熱與偏冷區間,在均值正負一倍標準差內的區間為正常區間。
(2)粗糙集理論與支持向量機模型。粗糙集理論是由波蘭科學家z Pawlak自1982年研究信息系統邏輯特性時發展起來的理論。粗集理論是一種處理模糊與不確定知識的數學算法,它能有效地分析和處理各種不精確、不一致和不完整的信息,并從中發現隱含的知識,揭示潛在的規律。SVM算法的實質
是采用智能算法求解一個具有線性約束的二次凸規劃問題,因此該算法的解一定是惟一的、全局的和最優的。我們采用支持向量機建立房地產預測模型,對房地產幣場的未來供需形勢進行預測。
3.2樣本數據的收集和選取
基于專家意見及銀川市房地產市場的具體特征,本文擬使用以下16個指標作為房地產幣場預警的初始指標體系,這16個指標分別為房屋空置面積、房屋竣工面積、空置率、商品房銷售額、商品房交易面積、人均住宅面積、房屋出租面積、全社會住宅投資、全社會固定資產投資、土地開發投資、商品房建設投資、房地產價格、土地交易價格指數、房地產增加值、國內生產總值、物價指數。
房地產業的波動是外部因素沖擊和內部機制傳導的綜合結果。我們結合銀川市房地產業的具體數據,運用基于粗集的屬性歸約方法對不同時期的歷史數據進行預處理,采用粗糙集數據預處理的支持向量機預警模型,然后運用警界控制原理對各狀態的區間進行確定,并以此劃分出不同的警度,最后根據警限值將預測值轉化為警度并進行預報。通過分析得出銀川市房地產綜合預警指數如圖3所示:

4綜合分析
由上圖可判斷,銀川市房地產市場的發展大致分為三個階段,即偏冷運行階段、正常運行階段,偏熱運行階段。綜合看銀川市房地產發展是基本正常的、房價是穩中上升的。但從2003年起銀川房地產出現了波動,2005年起銀川市房地產發展處于“偏熱”的狀況,并呈現持續上升的趨勢,而之前的時間處于平衡狀態在未來幾年市場運行很可能亮紅燈,會有房地產泡沫產生的危險,因此,需結合市場與政府調控的雙向機制保持銀川房地產市場健康、有序的發展。
在近十年里我國房地產行業呈現發展過熱的狀況,房價上漲過快,給人民的生活帶來了沉重的負擔,在對國民經濟造成巨大影響的同時,也對整個社會的穩定發展帶來了不少負面影響。以保障國民經濟持續、快速發展為出發點對房地產預警進行研究,更好地對未來的房地產市場運行和發展形勢做出準確判斷,并對房地產市場現有狀況是過熱或過冷的失衡原因快捷地發出警報,可以幫助相關部門及時調整相應的產業發展政策以保持其供需平衡,推動我國房地產行業持續、穩定、健康的發展。因此進行房地產行業形勢預警研究具有重要的理論價值和社會意義。
針對銀川市房地產市場的警情狀況和市場特點,為抑制房價上漲過快,穩定房地產市場所應采取的一些措施包括一,制定相關的土地政策,改變商品住宅供應結構,堅持以住房為主的土地供應,嚴格控制土地價格和土地囤積,從嚴查處土地違法行為,二,加強二級市場、租賃市場的建設,搞好城市規劃管理,合理配置住房資源,加快建立并完善預警預報系統,三,政府結合市場進行相應的調控,嚴格把守貸款申請等金融工作,限制炒房,使房地產開發行業提高固定資產投資項目資本金比例、首付款比例。
本文研究得出的結論較多為宏觀數字,對未來幾年的房地產市場供需形勢也僅能從總體上做出判斷,不能夠準確市場的突發事件作出很準確的反應和預測,因此在以后的研究中,我們將盡量多研究短期房地產市場發展狀況的預警。此外,本文對國家宏觀調控方面的房地產行業市場的政策性指標因素考慮不多,影響房地產行業市場走勢的重要政策性指標在后續的國家宏觀調控中肯定會出現,因此在之后的研究中要不斷完善指標體系,提高對房地產行業市場狀況預測的準確性。