徐碩
幫你決策該租房or買房。

假如有人問你,在北京什么時候買房最合適,你一定會覺得肯定是以前房價還沒猛漲的時候。對大部分北漂一族而言,租房還是買房的先決條件,就是得先有錢。
但諸葛找房的CEO蘇偉杰可不這么認為。
他利用大數據統計了2016年5月北京各區在售二手房售價及整租房源租金價格。售價租金比反映了房產銷售價值與其實際使用價值的比較關系,該值越大則表明在該區域買房相較于租房付出的代價越高。相反,在其他條件一致的情況下,該比值越低說明該區域相較于租房更適宜買房。
盡管售價租金比只是房產大數據里輔助用戶決策的信息之一,但諸葛找房可以對每套房子在全網多個渠道的數據進行搜索處理。
什么樣的搜索引擎有價值?
蘇偉杰表示,自2014年下半年開始,房多多和愛屋吉屋進入房產行業,加上搜房、安居客端口漲價事件,使得整個行業的中介費跌宕起伏。越來越多的經紀公司開始做自己的網站,也有更多的互聯網創業公司進入到房產行業。“這是房源的數據化進程,也只有當入口變得越來越多,流量成本變得越來越高的時候,搜索引擎才會有價值。”
隨著入口變得越來越多,對搜索引擎而言,需要處理的數據的離散程度也會變高。目前諸葛找房已經擁有市面上最大的掛牌房源數據,基本上涵蓋了線上房源的90%以上,用戶可以找到全城90%以上的真實在租在售房源,以及每套房子多渠道掛牌價格的實時變動。
蘇偉杰表示,開放搜索引擎使得用戶可以自己進行選擇,甚至可以直接聯系房東進行交易,“但對于二手房的購買,大部分人還是會選擇一些服務好的經紀公司,比如鏈家、我愛我家等等”。
但蘇偉杰告訴創業邦(微信搜索:ichuangyebang),由于整個房產行業的數據結構很薄弱,建立自己的房產數據結構化標準就變得尤為重要,主要包括:
1.半監督式管理。由于數據量龐大,所以95%的工作由機器來完成,人工部分主要是通過修正問題以及提供錯誤的樣本供機器進行學習。
2.不斷進行流式計算。當有新的房源進入或者有問題被修正后,所有的數據都需要回爐重新接受重組和分析。
3.修正算法,優化數據庫,增加房產方面的知識,強化機器的數據處理能力。
如何保障房源真實有效
經過一年多的產品打磨,今年6月諸葛找房App正式上線,4個月的時間累積用戶30多萬,日活達到5000左右。
通過大量的調研及回訪,蘇偉杰發現,即便是經紀公司,也沒有人想要發布假房源,但基于端口的收費機制造成了信息的嚴重泡沫化,使得經紀人和經紀公司不得不發布假房源來吸引客戶。
通常情況下,端口的收費分為包月或包季,每個月在300?800元,每個端口可以發布30?50套房子。但如果經紀人手中只有一套房源,那他就不得不通過改標題、改價格、改描述來發布,以至于會有很多的重復房源。比如后現代城的房屋總數為5000戶,但在信息平臺上的在售及在租房源卻超過15000套。
為了規避這種現象,讓用戶可以過濾掉重復、虛假房源,諸葛找房與經紀公司合作,收集全網的房源數據并進行后期的分析及處理,以確保房源真實有效:
1.將數據不斷回爐
流式計算回爐過程,清晰線上數據,將錯誤率控制在5%左右。比如某套房子同時委托了很多家中介公司,其中一家中介公司對這個房子做了下架、交易等處理,那么在諸葛找房的平臺上,該房源在所有關聯中介公司的信息也會一起下架。每天的更新次數達十億次左右。
2.經紀人認領房源
目前諸葛找房已開通經紀人端口,經紀人通過認證(確認身份)后即可在平臺上認領房源,所有房源均是已經處理過的房源。并且,平臺暫不開放發布房源的環節,以便確保現有數據的準確率能達到較高水平。
3.建立處罰機制
當經紀人知道某套房源已成交、下架,但還繼續認領,平臺會對經紀人進行處罰,如凍結賬戶等等。
與經紀公司合作但不介入交易環節
不同于房多多、搜房這些有能力有野心切入到整個房產交易環節的公司,蘇偉杰告訴創業邦(微信搜索:ichuangyebang),由于團隊的核心成員大部分來自百度搜索和大數據團隊,諸葛找房在數據分析、搜索能力上占有很大的優勢,但在房產交易方面并不擅長。“只有把數據這個地方做精做專注,才有可能提供一個更有價值的產品給用戶、經紀公司和經紀人。”
蘇偉杰也表示,開放的經紀人端口將快速提升經紀人的效率,使得獲客成本下降。如諸葛小AI人工智能,對于服務密集的行業來說,AI可以快速提高人力的效率。
目前行業里有100萬?150萬經紀人,如果他們的工作能用AI來代替一部分,如幫助用戶匹配房源,計算某套房子用公積金能貸到多少錢等等,工作效率就會得到提高。
盡管不介入房產交易環節,但在保證房源真實性的前提下,諸葛找房可以通過搜索引擎與端口結合的方式對經紀公司收取一定費用。蘇偉杰表示,平臺初期會有一些免費的功能供經紀人使用,后期將會收取少量的服務費。
目前,諸葛找房已經開通北京、上海、廣州等6個城市的業務,預計年底將在全國開通16個城市。