文/黃海

企業信息化是提升企業核心競爭力的重要途徑。隨著云計算、大數據、移動互聯網等技術的蓬勃發展,企業信息化進入轉型升級的階段,逐漸由流程驅動轉向數字驅動。2020年初的新冠肺炎疫情對企業的復工造成了不小的影響,遠程協同辦公的需求在客觀上倒逼企業加速完善信息化系統。
對房地產咨詢公司而言,開展房地產估價、房地產經紀、信息咨詢等業務有著廣泛的數據需求;同時,各個業務部門在長期發展中積累了大量的數據,有效整合與利用公司內外部業務相關數據,挖掘更多的潛在價值,是房地產咨詢公司推進信息化的重點。企業要實現數據價值與核心業務的深度融合,首要任務是建立一套完善的數據標準體系。
目前,在房地產及相關領域,政府有關部門建立了各種數據標準,如《房地產市場信息系統技術規范》《房地產市場基礎信息數據標準》《不動產登記數據庫標準(試行)》《土地利用規劃數據庫標準》等。各個行業組織也在積極推進行業數據標準建設,如房地產經紀行業自律發展組織“中房經聯”發布了《房地產房源數據庫標準行業建議版1.0版》,部分從業人員對房地產行業整體或細分業務領域的數據標準建設進行了有益的探索。
然而,企業數據標準建設的出發點與政府、行業組織不同,其數據標準的范圍應該主要集中在業務的核心數據部分,而不是將房地產領域所有數據悉數納入考慮范圍。本文以筆者的從業經歷為例,對構建數據標準的思路與邏輯進行論述,以期為同行開展數據標準建設工作提供參考。
設定“標準”的意義是為了在一定范圍內獲得最佳秩序,而在企業范圍內構建數據秩序,首先需要研究其產生與使用數據的特征。
不同于政府與行業組織,公司的數據圍繞業務產生。房地產咨詢公司市場定位各異,如一些偏重商辦物業、一些偏重居住物業,因而產生的數據也不盡相同,會集中在個別細分領域。所以,在數據標準構建初期,企業需要聚焦當前或近期開展的業務領域,沒有必要將房地產行業內大量的數據對象都納入研究范圍。
公司開展的業務種類繁多,數據需求也不盡相同,這往往導致數據的內涵會有較大差異。例如,同樣是搜集某寫字樓的數據,抵押評估業務更關注產權單元信息,而市場定位咨詢業務更關注現狀信息。此外,隨著政策制度調整、市場環境變化以及公司的不斷發展,業務類型也在更新迭代,這使同步產生的數據內涵不斷變化。因此,企業在構建數據標準時,應考慮標準對多類型業務的適應性,避免因為業務類型調整而導致數據與標準脫節。
單個業務項目的對象多數為單一對象,如評估業務多數為某套房屋,規劃業務多數為某個村鎮。公司在承接業務時,空間上也存在隨機性,這使業務產生的數據在執業空間范圍內零散分布。如何使零散分布的數據在廣大的空間范圍產生有序、易識別的聯系,也應是構建數據標準的重點關注內容。
考慮到上述的數據特征,數據標準可以按照以下思路構建:
根據涉及業務與數據生產實際情況設定較為通用的數據基礎對象。將業務數據與基礎對象匹配,不匹配的數據再基于基礎對象生成次級對象。為所有對象分級構建屬性,具體包括界定屬性、通用描述屬性、業務主題屬性。特別強調地理空間屬性的建設。
數據標準的構建也應參照數據庫三范式,對數據標準進行規范化處理,使結構更加合理,并消除數據內部異常,盡量減少數據冗余,以便于數據維護過程中進行新增、刪除與更新操作。
第一范式:數據表中的每一列(屬性),必須是不可拆分的最小單元。
第二范式:在滿足第一范式的基礎上,表中的所有列都必需依賴于主鍵。
第三范式:在滿足第一范式、第二范式的基礎上,任何非主屬性不依賴于其他非主屬性。
1. 設定通用的數據基礎對象。在房地產咨詢公司開展的業務中,房地產是核心,它既有具象的實體,也有抽象的產權。考慮到企業雖然無法全面、持續地了解房地產權屬與實體的對應關系,但實體對象是長期客觀存在的,企業可以直接進行探知與了解,筆者選擇從實體開始設定。首先設定兩個基礎對象,即土地與自然棟。土地指地球表面的特定區域,自然棟指土地上獨立的、有固定界限的建筑物與構筑物。
對于建筑物,業務往往關注它的實物特征,而房屋的建筑實物特征在自然棟內表現得并不均勻,這種現象在辦公樓、商場等物業類型中尤其普遍。為了更好地描述實物特征差異,筆者對自然棟進行邏輯拆分,在只考慮實物特征差異的前提下,將自然棟劃分為連續、內部勻質的自然子棟。
隨著項目的推進,通常會獲得一些房地產的產權數據,對于這些可以明確實體與產權對應關系的自然子棟,便可對其繼續進行邏輯拆分。根據最小產權劃分在自然子棟內對原則進行拆分,同時保證實體的連續性,由此形成產權子棟。同樣,對于可以明確產權的土地,便可以形成產權宗地(圖1)。

圖1 邏輯圖
2. 將業務數據與基礎對象匹配。完成基礎對象設定后,將業務中產生的各項數據與基礎對象進行匹配。對于不能直接匹配的對象,可以通過基礎對象組合成次級對象,再進行匹配。如此,則可保證所有數據在一個邏輯體系下運作,使各個數據項形成有序的邏輯聯系。例如,自然棟可以組合成住宅小區,產權子棟可以組合成邏輯棟(圖2)。

圖2 關系圖
3. 為各對象分級構建屬性。為各個數據對象分級構建屬性,可將屬性分為三類:界定屬性、通用描述屬性、業務主題屬性。首先,構建界定屬性。界定屬性描述的是數據對象最基礎的特征,通過這些屬性的組合來區分對象內的每一條記錄。其次是構建通用描述屬性,此類屬性是對各項業務的數據需求進行歸納,用于描述比較常用的對象特征。最后是構建業務主題屬性,這類屬性由各個項目團隊根據業務需求加以補充,自行構建。

表1 自然棟數據標準
以自然棟的屬性表為例(表1),首先通過底面投影、實際總樓層、建筑物狀態區分唯一的自然棟。隨后,通過歸納各類涉及自然棟的數據需求,羅列涵蓋名稱、地址、主體結構、建筑總面積等通用描述屬性,并在實際業務中自行補充業務主題屬性。
4.強調建設地理空間屬性。房地產有兩項顯著特征:其一是其位置相對固定,不可移動;其二是客觀排他,在同樣的空間、時間上不可能出現其他的房地產。因此,筆者在構建各對象的屬性時,特別強調地理空間屬性的建設,將其作為各對象的核心差異特征。例如,自然棟關注建筑的底面投影、商辦綜合體關注管理范圍邊界等。如此,則可借助地圖引擎對數據對象中每條記錄的空間位置加以直觀顯示(圖3)。

圖3 空間圖
數據標準構建的成功與否取決于其能否落地實施,本文提供了一種以業務價值為導向的數據標準構建思路。在該思路中,首要任務是設定基礎對象,其他所有對象都在其上進行構建。在完成數據與對象對匹配后,所有數據即可形成邏輯聯系(圖4)。在此基礎上,根據業務實際需求可以對次級對象、業務主題屬性等進行動態調整與擴展,確保數據標準能夠滿足當前業務需要,甚至滿足未來業務發展的需要。

圖4 邏輯關系
此外,筆者在數據標準中強調使用地理空間屬性。地理空間屬性可以使數據在地圖上具象化,實現通過地圖直觀地查詢數據,了解數據與數據之間的空間關系(見圖5)。量化的地理空間屬性也可直接用來進行區位條件的運算。

圖5 具象圖
圍繞業務需求進行數據標準構建,可以使公司進行數據整合與數據共享,進而有效減少數據重復建設的工作,提高工作效率,從而為公司業務創新提供有力支撐。