文/馬海濤(四平市不動產登記中心)
對不動產登記數據進行整合,就是全面收集不同時期、不同來源的數據資源,嚴格按照數據庫標準對其進行處理、轉換,而后形成與不動產登記要求相一致的數據信息。整個整合過程具有復雜性、系統性特點,需要經過數據抽取、數據轉換、數據入庫等一系列環節。
近年來,隨著不動產統一登記工作在全國各地穩步推進,原本分散在不同部門的不動產登記數據也全部移交到不動產登記部門,如何將數量龐大、異構特征明顯的不動產登記數據進行科學整合,成為不動產登記部門需要深入探索和研究的重要課題。而想要滿足這一需求,不僅需要國家建立標準統一的數據庫,還要不斷優化數據整合技術流程,從而保證數據信息準確、完整,為不動產登記工作開展提供合理依據。
不動產登記業務覆蓋范圍較廣,包括林業、農業、國土資源、房管、海洋等多個領域。結合工作現狀來看,雖然不同領域的登記業務類型不盡相同,但均已形成了相應的登記方法。并且無論哪種不動產,登記程序都基本一致,均涉及初始登記、變更登記、注銷登記三個環節[1]。
當前,我國各地區不動產統一登記工作正在有條不紊推進,并且林業、農業、國土等部門在不動產登記方面也進一步加大了信息化建設力度,在提高工作效率和工作質量的同時,也積累了大量數據信息,主要分為空間數據和屬性數據兩種。其中空間數據包括界址點、界址線、宗地圖等土地登記數據,以及自然幢、房產分戶圖等房屋登記數據。屬性數據包括權利類型、宗地坐落、權利人、面積等土地登記數據,以及自然狀況、權利狀況、限制信息等房屋登記數據。
隨著科學技術的不斷進步,不動產登記信息化建設水平也越來越高,尤其在土地、房屋登記和管理方面,已經基本實現了基于信息化系統開展相關工作的目標。但反觀林權、海域以及草原登記和管理工作,則信息化水平相對落后,為數據整合帶來一系列難度和挑戰[2]。
上文提到,我國不動產登記工作覆蓋范圍較廣,包括農業、林業、國土資源等多個部門,由于不同部門管理體系不盡相同、數據系統存在差異,導致基礎數據存在多元異構性特征。主要體現在數據來源不同、更新途徑和管理方式不一致等方面,導致不動產登記部門在數據整合時很難找到數據中存在的規律性,為整合工作開展帶來巨大挑戰。
所謂不動產,主要是指林木、房屋、土地等固定于土地,并且無法移動的、具有獨立使用價值的實物。
在登記過程中,集體土地所有權、森林所有權、土地承包經營權、宅基地使用權等權利要嚴格按照相關條例開展登記工作,正是因為權利登記較多,所以形成的數據規模也較大。另外,不動產權利并非一成不變的,而是隨著分割、轉移等實際情況不斷變化,這也使得登記數據大幅度增長,不僅增加了數據整合工作量,還加大了數據整合難度。
不動產登記數據除了數量龐大外,還具有結構復雜的特點,其中既包括空間數據,還包括非空間數據。所謂空間數據,就是指界址點、宗地、權屬界線等數據資源[3];非空間數據則是指權利信息、權利人信息、登記檔案信息等數據資源。這兩種數據之間聯系密切,需要頻繁交換,但由于數據更新速度較快,并且邏輯結構復雜,所以對數據整合技術也提出較高要求,如果整合不當,容易導致數據失真或損壞,無法保證不動產數據整合的有效性。
由于我國不同地區經濟建設狀況不盡相同,所以不動產登記數據質量也存在差異。從整體上來看,東部地區不動產數據質量較高,中部地區數據質量則相對較低,這是因為東部地區信息化建設起步較早,已經經過了多輪技術改革,在土地、房屋登記數據管理方面基本實現了數據庫管理目標,所以數據資源較為完整,并且時效性較強[4]。而反觀中部地區,由于經濟發展相對落后,所以信息化建設投入力度相對較小,導致不動產數據質量不高,而數據質量的高低也直接決定了數據整合的難易程度。
所謂數據倉庫技術,就是對數據進行抽取、清洗、轉換的關鍵技術,其中數據抽取是在分析數據基礎上,構建科學合理的抽取規則,將符合規則的數據資源提取出來,并對數據進行科學分類,該工作一般需要通過人工操作完成。
數據轉換工作則相對復雜,包括格式轉換、數據轉換、原數據分割等,例如:提取房屋登記數據中的樓盤信息。數據清洗則是將抽取和轉換的數據進行處理,去除無效數據,保證數據滿足數據庫標準要求。
將不動產登記的空間和非空間數據聯系在一起,使宗地和不動產單元基于宗地編碼相互聯系,使不動產和不動產權利基于不動產編碼相互聯系,使不動產權利和登記過程基于業務編碼相互聯系,最后形成準確、及時、完整的空間和非空間數據[5]。
質量檢驗技術是基于國家出臺的一系列規范、標準發展而來的,主要用來分析不動產登記數據質量。當前,我國已經針對不同部門的測繪質量要求制定了相應的數據質量檢測規程,在實際工作中需要嚴格按照規程操作。常見數據檢測方法包括交互檢查、人工檢查等。完成檢查工作后,需要將合格的數據錄入數據庫,并對不合格數據進行修改。
為了進一步加快不動產登記數據整合速度,我國出臺了各種數據整合標準和規范,包括《不動產登記數據庫標準》《不動產登記數據整合建庫技術規范》等,為數據整合工作開展提供了便利。結合實踐來看,不動產數據整合通常需要經過資料收集、數據分析、單元編碼生成、數據入庫等環節,現從兩個方面入手對數據整合技術流程進行優化,其一是擴大資料收集范圍[6]。除了對不動產登記基礎資料進行收集外,還要對民政部地名、天地圖等相關資料進行收集,并將其作為數據整合的主要依據;其二是合理利用外部數據。外部數據既能夠完善不動產登記原始數據,還能夠在數據整合過程中發揮橋梁作用,便于工作人員找到數據之間存在的關聯性以及數據發展的規律性,這對于提高數據整合效率和質量而言意義重大。具體來說:
不動產登記數據整合工作具有復雜性、系統性特點,涉及資料收集、數據分析、數據整合、質檢入庫等多個環節。在數據整合過程中,工作人員需要遵循歷史繼承性基本原則,將不動產登記存量數據作為基礎,在保留房管、國土資源等部門調查成果的基礎上,按空間信息和屬性信息對調查成果進行科學梳理,并通過自然幢號、宗地編號關鍵詞,構建不同數據之間的關聯關系,而后將不動產登記檔案和登記簿用原有業務號進行關聯,嚴格按照不動產登記數據技術標準建立數據庫,將相關數據信息錄入庫中,并生成不動產單元編碼,最后對數據質量進行檢查,將檢查合格的數據全部導入不動產登記數據庫中[7]。
1.收集不動產登記資料,形成原數據清單
收集國土資源、林業、海域等部門的測繪數據、登記數據等不動產存量登記數據。當前,我國各地區已經針對不動產登記數據構建了相對完備的數據庫,所以不動產登記部門還要重視收集電子數據、數據庫標準等相關資料。針對具備部分電子數據和電子檔案的部門,既要收集電子資料,也要收集紙質資料;針對信息化建設不足、沒有電子檔案和電子數據的部門,需要全面收集紙質資料;針對已經全面建成電子數據庫的部門,不動產登記部門需要將其與不動產登記數據庫標準進行對比,并建立轉換關系,使不動產數據在得到完善和補充的基礎上,能夠快速轉換為符合不動產登記數據庫標準要求的數據[8];針對沒有建立數據庫的部門,要從紙質檔案中提取數據并錄入不動產登記數據庫,從而為后期數據分析、數據整合奠定基礎。
2.對相關規范進行科學梳理
對相關規范進行科學梳理是不動產登記數據整合的關鍵環節,該環節的主要工作,是結合不動產登記的最小單元,對收集到的各類數據進行整理、完善,使數據充分滿足不動產登記要求。主要步驟為以下幾個方面:第一,按照土地、房產、林地等不動產登記數據庫標準,對登記數據進行檢查,判斷當前數據是否存在缺失、損壞、邏輯不嚴謹等一系列問題;第二,通過查閱檔案或外業核查等方式,補足缺失的數據,對數據邏輯關系進行重構,而后形成與數據庫標準相一致的數據資源。第三,對不同部門、不同種類的不動產登記數據進行對比分析,通過建立映射關系、標準統一等方式,對數據進行處理,使其形成語義、類型、數量單位相一致的原始數據庫。具體來說,就是將分散到各部門的數據資源進行收集后,需要結合《不動產登記數據庫標準》相關條例,對登記數據進行全面分析,明確數據資源是否符合轉換要求,而后對數據資源進行科學整理,以此來完善不動產登記數據。針對土地登記數據,需要通過建立地籍區和地籍子區方式編制宗地編碼,針對房產登記,需要通過建立樓盤表、自然幢等方式形成基礎資料。
在此基礎上,遵循規范性、完整性、一致性基本原則,對數據進行處理,通過清洗數據,將無效數據去除,而后對數據進行規范化梳理,使數據的語義、類型以及空間和屬性一致,并通過外業調查、資料查閱等方式將缺漏的數據補足。與此同時,還要整理不動產登記數據的空間信息和屬性信息,并通過自然幢號、宗地編號等關鍵詞構建彼此的聯系,最后形成空間和屬性一體的不動產登記原始數據庫。
3.不動產登記數據的抽取和轉換
對不動產登記數據進行抽取和轉換,是數據整合的重要前提。在實施過程中需要嚴格按照《不動產登記數據庫標準》相關要求操作,將權利人信息、業務信息、權利信息等屬性信息,以及建筑物、地籍區、地籍子區、地形數據等空間信息從原始數據庫中抽取出來,而后構建不動產登記數據庫。在此基礎上,還要從天地圖數據、民政部門數據、國土資源數據中將街道、行政區劃、構筑物名稱等數據抽取出來,而后構建不動產外部數據集。
4.不動產登記數據整合及關聯
不動產登記數據的整合和關聯能夠直接影響數據最終整合效果,該環節的主要目標是利用外部數據集,通過信息關聯等手段,為各種類型的不動產登記數據庫建立關聯關系,而后形成結構完整、空間相同、邏輯嚴謹的數據資源。具體可以從以下幾個方面入手:
(1)對空間數據進行整合?;谑占降牟粍赢a登記空間數據,按照相關規范對地籍區、總結、建筑物等空間數據進行統一編碼。而后對房屋自然幢、構筑物等空間信息進行統一編碼。在此基礎上,分析不動產空間位置的相同性,利用空間疊加手段將空間信息與地籍區、地籍子區等疊加到一起,從而實現空間數據整合目標。除此之外,還要對不動產的登記單元進行合理劃分,而后形成不動產的單元代碼[9]。
(2)對屬性數據進行整合。在完成空間數據整合工作后,不動產登記部門可以通過反向賦值手段,將生成的不動產單元編碼賦到屬性數據中,包括土地登記、房產登記等數據。而后對屬性數據進行嚴格校核,形成不動產單元編碼與屬性數據相關的信息轉換對照表,在此基礎上,將不動產屬性數據關聯起來,最終形成健全、完備的不動產登記屬性數據庫。
(3)對檔案數據進行整合。將不動產登記原檔案管理數據中的各種關鍵詞,與屬性數據庫中與之相對應的關系,生成全新的檔案管理關鍵詞單元編碼,要注意對原關鍵詞進行保留,并形成完善的檔案數據庫。
5.不動產登記數據檢查及入庫
不動產登記數據在入庫前,要對其質量進行嚴格檢查,確保合格后即可入庫。數據檢查的關鍵一般體現在兩個方面,其一是對圖形數據進行檢查,其二是對屬性數據進行檢查。其中圖形檢查必須要保證數據精度、結構邏輯符合相關要求,檢查內容包括圖盤完整性、空間要素一致性、原始數據及代碼一致性等方面;屬性檢查必須要保證數據完整、結構完整、邏輯縝密,主要檢查內容有屬性、數據表內容及結構。常見檢查方式包括外業核查、內業核查以及二者相結合核查方式。其中內業核查就是對不動產登記原始數據和檔案進行整合,并采用與之相對應的方式完成檢查工作;外業核查就是通過實地測繪、調查等方式,判斷整合后的數據是否邏輯嚴謹、結構完整、層次清晰、內容全面。完成不動產數據質量檢查工作后,需要將合格的數據錄入數據庫,而后形成集權利信息、空間信息、業務信息等多種信息于一體的數據庫。而針對質檢沒有通過的數據,需要結合原始檔案對其進行全面核查,并對數據進行逐一修正,最后再次提交質檢。
綜上所述,不動產數據整合工作具有系統性、復雜性特點,整合水平能夠直接影響不動產登記工作的質量和效率。尤其針對源數據庫中部分限制信息的遷移,如果數據整合不到位,會增加不動產登記工作的風險隱患。為了提高數據整合水平,需要加大人力、物力、財力投入力度,并制定切實可行的整合技術流程,為數據規范處理、快速入庫奠定良好基礎。在此基礎上,還要使用外業調查、檔案核實等方式,確保數據庫中的不動產數據規范、準確、完整,從而為不動產登記工作提供準確依據。