朱兵
江蘇先河房地產資產評估測繪造價咨詢有限公司
摘要:數據時代的來臨加快我國整體經濟的快速發展。大數據顛覆了人們對吃、穿、行的思考方式與習慣。而在“住”的方面,房地產一直以來都和金融業有著千絲萬縷的聯系,房地產大數據對于金融業來說有著至關重要的意義。依托于房地產大數據的自動股價平臺可以為銀行等金融機構帶來決策性的意義,降低自身持有抵押品的風險。
關鍵詞:房地產大數據;自動估價系統
我國整體經濟的快速發展使得我國快速進入互聯網數據時代。數據是房地產估價師進行價值評估的核心要素,大數據時代的到來,不僅為房地產行業提供了海量數據,更重要的是對于數據估價處理方式的改變。
一、中國房地產大數據存在的問題分析
目前,中國對房地產大數據的管理是匱乏的,沒有專門的機構來整理記錄房地產大數據,房地產大數據仍處于雜亂無章的狀態,具有真實性低、規范性差等特點,這給房地產大數據的應用造成了巨大的困難。網絡中的掛牌和出售數據需經過去重、清洗后才能在日常實際生活中投付使用。本項目在清洗與去重中采用了時間與空間相結合的方法,并在數據中根據不同屬性采用了取極值的操作,去重率在80%以上。
二、相關理論基礎
(1)特征價格理論,特征價格理論將房地產視為一種產品,房地產的某一方面特征代表了該商品的一個效用,房地產價格就是由每個特征所帶來的效用總和組成。本質上這些房地產的特征相應的代表了房地產市場的一個方面,而這些特征的不同組合即構成了不同的房地產。換言之,房地產價格就可以通過確定房產特征的價格及數量來間接獲得。(2)BP神經網絡理論,人工神經網絡(ArtiifeialNeuralNe飾orks,ANN)主要由大量與自然神經細胞類似的人工神經元互聯而成的模仿人腦行為特征的網絡算法數學模型。其工作過程具有循環特征,并同時具備自學習和自適應的能力,通過預先提供的特征(輸人項)與預測項(輸出項)數據,充分學習、掌握兩者之間的內在關系,使新輸人的特征來推算出我們想要的結果。BP(aBckrP叩agatio動網絡是一種多層前饋網絡,是目前應用最廣泛的神經網絡模型之一。它按誤差逆傳播訓練,能學習和存貯大量的特征與結果的映射關系,而無需事前揭示描述這種映射關系。通過最速下降法反向傳播來不斷調整網絡的權值和閩值,使網絡的誤差平方和最小。通過動態迭代搜索一組權向量,使網絡誤差函數達到最小值,從而完成信息提取和記憶過程。
三、通過網絡爬蟲抓取地產大數據
研究中,獲取數據的方法主要為網絡爬取。網絡爬蟲,又被稱為網頁蜘蛛、網絡機器人,是一種按照一定的規則,自動地抓取萬維網信息的程序或者腳本。另外,一些不常使用的名字還有螞蟻、自動索引、模擬程序或者蠕蟲。在各種以數據作為設計運行基礎的實驗中,數據重要性是不言而喻的。不僅需要數據作為各種模型的基本計算和訓練依據,產生更多、更準確的特征來構建和模擬構建效用相當的仿真模型,通過這些模型對新產生的數據進行預估和處理,從而提高模型的利用效果。隨著網絡的迅速發展,互聯網成為大量信息的載體,如何有效地找到自己需要的信息,并加以提取和利用即成為一個巨大的挑戰。定向抓取相關網頁資源的聚焦爬蟲可以幫助研究者解決這一問題。聚焦爬蟲是一個自動下載網頁的程序,可根據既定的抓取目標,有選擇地訪問互聯網上的網頁與相關的鏈接,獲取所需要的信息。與通用爬蟲(generalpurposewebcrawler)不同,聚焦爬蟲并不追求大范圍的覆蓋,而將目標定為抓取與某一特定主題內容相關的網頁,為面向主題的用戶查詢準備數據資源。
四、信息數據服務的方向與趨勢
房地產業已成為當今中國經濟的支柱產業之一,與我們的工作生活緊密相關,因此,房地產信息數據服務具有廣泛的市場需求。隨著我國金融、房地產、政府管理等方面的不斷發展,突破創新,對于信息數據的需求不斷提高,房地產數據公司所面對的客戶會越來越多。對于不同客戶的需求,房地產相關信息數據需不斷分類細化,以滿足不同客戶的關注點。當前國內各房地產數據平臺所擁有和能提供的信息數據產品都較為單一、產品同質化,主要集中在房地產樓盤庫、價格走勢、掛牌交易信息等,信息數據的服務領域、廣度和深度都有較大的發展空間。首先,房地產信息數據的服務領域可以有以下幾方面:①數據研究與分析:包括價格指數、價格趨勢等研究與分析;②ft價服務:為估價機構和估價師提供交易實例、房地產基本狀況、數據研究與分析成果等;③經紀服務:通過交易信息等為房地產經紀人提供服務;④抵押風險控制服務:為金融機構提供房地產基本狀況、交易情況、趨勢分析等風險控制參考數據;資產管理服務:通過房地產基本信息、交易量與成交價格等進行物業評級,、變現能力分析等。其次,在數據的廣度方面可提高的地方有:①增加非住宅房地產的信息數據:目前大多數據公司的信息數據還以公寓住宅為主,鮮少有非住宅的信息,考慮房地產數據的完整性,應增加非住宅的信息;②房地產租賃數據:房地產租賃和房地產買賣都是房地產市場的重要組成部分,但目前租賃市場的信息卻相對欠缺,而租賃數據對于經營性物業的招商運營是非常有價值的;③土地信息數據:目前大多數房地產信息數據還是以房屋信息為主,土地狀況信息較少,而土地的用途管制、權益、開發狀況等對于房地產的價值至關重要,是非常必要的。最后,在數據的深度方面需要完善現有信息數據的完整性,對現有數據進行精細化的處理,探索打通房地產全生命周期這一鏈條,將零碎、獨立的信息數據進行串聯,提升數據的利用價值。
五、自動估價系統的實現
在數據日漸開放、并已全面進入大數據時代的背景下,審時度勢的實踐者可以利用自動估價技術對中國的房地產估價和經紀行業帶來變革。事實證明,AVM并沒有使估價機構丟失了原有的業務而受到威脅,反而使其可通過利用AVM技術為客戶提供更加豐富全面的估價服務,同時也保證了自己的收益,創造了良好的客戶關系。大數據是房地產估價方法的基礎。房地產估價方法包括比較法、收益法、成本法、假設開發法。例如,比較法中交易實例的搜集、房地產狀況調整,收益法中的資本化率的確定,全部需要大數據。本項目實質為一個垂直搜索模型,通過輸入房屋的具體地址信息,評估房子的價格,展示房子的屬性。基于房地產大數據的自動估價可以為房地產實現更為精確的自動估價,可以解決各級信貸審批人員缺乏便捷全面的房地產綜合全景信息工具的問題。自動估價在提供房地產自動估價、人工估價和價格走勢等多維度分析的同時,還可呈現相關的樓盤綜合信息、市場動態和周邊設施配置,可以有效地提高信貸審批業務的工作效率。
六、結語:
房地產行業產業鏈長、生產周期長、不確定因素多、涉及內容廣、產品地域性強、文化背景差異大等,導致新技術應用相對困難。一方面,應該支持參與政府大數據產業發展規劃,大力推進政府部門數據共享,積極響應與推動公共數據資源開放,實現資源整合。另一方面,提升自身獲取數據的方法與途徑,企業與企業之間形成戰略合作,企業利用自己的資源庫,開展科研工作,利用自身的數據庫與大學、科研機構等共同合作,開發與豐富房地產大數據。房地產大數據資源的核心是開放和共享。
參考文獻:
[1]維克多·邁爾-舍恩伯格,肯尼思·庫克耶.大數據時代—生活、工作與思維的大變革[M].盛楊燕,周濤,譯.杭州:浙江人民出版社,2013.
[2]金宗澤,馮亞麗,紀博,等.大數據分析中的關聯挖掘[J].計算機與數字工程,2014,42(10):1924-1928.
[3]羅剛,王振東.自己動手寫網絡爬蟲[M].北京:清華大學出版社,2010.