朱貴方
(沈陽市勘察測繪研究院有限公司,遼寧 沈陽 110000)
2015年3月1日起施行的《不動產登記暫行條例》中,明確規定了不動產統一登記工作的范圍和依據,標志著不動產登記工作將進入全面明晰產權、有效保護權益、維護交易安全、提高交易效率的新階段。沈陽市于2016年10月組織開展了不動產中土地和房屋的數據整合工作,其中數據質量檢查是提交成果數據之前必不可少的步驟,也是保證后續有效利用的關鍵點。
為了保證所整理的成果數據的準確性并能夠達到數據庫[1]和編碼[2]要求,數據檢查從兩個方面進行,一是數據與檔案的一致性檢查,其一般采用全面概查和重點抽查兩種模式[3]對整理的數據利用作業方案進行檢查,檔案情況各異,大部分需采用人工檢查;一是成果數據空屬合法性檢查,其一般采用人機交互的檢查方式[4]。本文以土地和房屋數據為例,提出了成果數據空屬合法性質量檢查方案,根據各項檢查內容開發了相應的檢查工具,更快速有效地達到入庫要求。
不動產數據整理過程中,由于數據來源多種多樣,勢必造成數據中存在一些空間錯誤,同時由于土地、房屋屬性較多,在進行人工錄入過程中也會造成錯誤,為了滿足數據入庫要求和后續應用需求,并避免數據在空間和屬性上出現錯誤,對常見問題制定了檢查方案并根據需求編制了檢查工具。
在進行數據入庫之前需對宗地、自然幢、邏輯幢作相應的數據檢查,包括空間數據檢查、屬性數據檢查和空屬一致性檢查。
沈陽市宗地和房屋數據包括宗地、自然幢、邏輯幢,宗地除了共用宗之外,正常在空間關系上不存在相互重疊情況,但由于宗地檔案測繪成果不足[5],重疊情況時有發生;沈陽市根據自身檔案情況和數據管理模式,自然幢、邏輯幢均有其相對應的空間和屬性數據。邏輯幢是邏輯關系的反映,在空間關系上會存在相互重疊屬于正常情況,但自然幢是一座獨立的、包括不同結構和不同層次的房屋,在空間關系上不存在相互重疊的情況。
(1)數據自身檢查
宗地、自然幢、邏輯幢數據自身檢查包括最小銳角、最小面積、重疊、交叉和多部件檢查。
①最小銳角檢查
通過計算各個折點之間的夾角,給定閾值判斷夾角節點是否刪除。∠A、∠B、∠C關系如右圖1所示,其計算公式為:

圖1 A、B、C關系圖
②最小面積檢查
計算各個房屋面和宗地面的面積,然后篩選出小于閾值且有相同屬性的數據直接刪除,其中為了避免誤刪,對于小于閾值但屬性唯一的通過人機交互的方式判斷是否刪除。
③重疊對象檢查
重疊檢查是指一個區域不能與同一圖層的另一個區域疊置。不動產數據檢查中不能重疊要素包括宗地、自然幢和邏輯幢。此項檢查需結合屬性,圖形和屬性均相同的要素,通過“自動修復”中的“重疊對象修復”可直接刪掉;圖形相同屬性不相同的需要人工判斷是整理過程中屬性錄入錯誤、圖形落錯還是無誤后進行修改。
④多部件檢查
多部件檢查是指一個圖層中的要素不能具有一個以上的構成部分,任何具有超過一個構成部分的要素都是會報錯的。通過此步檢查可以將較難發現的多部件要素檢查出來,然后進行人機交互處理。多部件要素其折點有多個部分組成,折點多的部分一般為要素主體所在,如圖2所示,所以可以通過判斷各部分折點個數編寫自動修復工具,但其需人為干預確認是否符合以上原則。

圖2 多部件情況截圖
(2)數據空間邏輯檢查
數據自身檢查并修改無誤后,需進行“房落地”“幢落宗”正確性檢查,“房落地”是指自然幢、邏輯幢的空間位置是否正確;“幢落宗”是指宗地和房屋數據整合是否正確。以上兩者的正確性通過數據的空間邏輯檢查可進行判斷。
不動產數據檢查中的空間邏輯檢查主要是指從空間位置上判斷各個要素層之間的空間關系,其判斷原則為宗地包含自然幢,自然幢包含邏輯幢。只有空間關系上正確,才能通過各要素的屬性信息進一步判斷“房落地”“幢落宗”的正確性。
(1)字段檢查
根據《不動產登記數據庫標準(試行)》[1],制訂字段檢查項,確保整理數據的屬性字段與數據庫中字段相對應。對于檢查出的缺失字段及時查找原因進行補充。
(2)編碼合法性檢查
對整合完成后的宗地、自然幢和邏輯幢進行編碼,宗地統一代碼編制規則[2]如圖3所示,自然幢、邏輯幢編碼規則[2]如圖4所示。

圖3 宗地統一代碼編碼規則

圖4 自然幢、邏輯幢編制規則
宗地統一代碼采用五層19位層次碼結構,按層次分別表示縣級行政區劃、地籍區、地籍子區、土地所有權類型、宗地號:第一層次為縣級行政區劃,代碼為6位;第二層次為地籍區,代碼為3位,用阿拉伯數字表示;第三層次為地籍子區,代碼為3位,用阿拉伯數字表示;第四層次為土地權屬類型,代碼為2位,第一位表示土地所有權類型,用G、J、Z表示,第二位表示宗地特征碼;第五層次為宗地號,代碼為5位,用00001-99999表示。
自然幢、邏輯幢編碼編制采用三層24位層次碼結構,按層次分別表示宗地統一編碼、特征碼、房屋幢號:第一層次為宗地統一編碼(ZDTYBM),代碼為19位;第二層次為宗地內定著物特征碼,代碼為1位,用F、L、Q、W表示。“F”表示房屋等建筑物、構筑物,“L”表示森林或林木,“Q”表示其他類型的定著物,“W”表示無定著物;第三層次為房屋的幢號,代碼為8位,用阿拉伯數字表示,碼值為0001~9999。
根據編碼規則制定編碼合法性檢查規則[6],首先判斷編碼長度是否正確;其次根據行政區、地籍區、地籍子區、宗地、自然幢和邏輯幢的空間包含關系判斷相應的編碼層數是否正確;再判斷權屬性質、宗地特征碼和宗地內定著物特征碼是否符合字典要求;最后判斷宗地流水編碼和房屋幢號在同一包含面內是否唯一。
房地屬性一致性檢查之前需對房屋空屬、宗地空屬和房地空屬進行整合[7],空屬整合方法如下。
通過空間位置進行圖屬合一,可以直接調用ArcGIS自帶的“空間關聯”工具,其中“連接要素的字段映射”時選擇需要連接的字段,并將合并規則改為“連接”,添加所需的分隔符,即可將目標要素中需連接的屬性字段添加到連接要素中。
在進行圖屬連接時,可以用Oracle數據庫的SQL語句進行連接,需用到SQL語句如下:
select[關聯字段],[合并字段]=((select[需合并字段]+';' from 目標要素 as b where a.[關聯字段]=b.[關聯字段] order by [需合并字段] for xml path(''))) from 連接要素 as a group by [關聯字段];
宗地和房產數據整理[8~10]是同步進行的,整理過程中房屋方面需要將邏輯幢的屬性根據空間位置整合到自然幢中,如圖5所示,宗地方面需要將宗地的屬性信息與宗地的空間圖形整合為包含圖屬的宗地數據;房地數據整理完成后,需要將宗地的屬性根據與自然幢的空間位置關系整理到邏輯幢的相應屬性中,用于判別房地屬性一致性。
為了保證數據的現勢性,整理過程中數據均從中間數據庫中下載,其空間和屬性是分離的。由于宗地數據存在各種變更的情況,其空間圖形與屬性之間存在一對多的關系,為保證兩者可以對應上,在宗地的空間圖形中添加屬性信息時,需利用SQL語句將同一宗地的多個屬性信息統一賦值給空間圖形,如圖6所示。

圖5 自然幢、邏輯幢空間位置圖屬合一

圖6 宗地SQL語句圖屬合一
利用整理后的最終宗地和房產數據進行房地空屬整合,其中房地空間邏輯檢查采用上述的包含檢查,檢查規則為宗地包含自然幢,對于檢查出的跨宗情況,與登記中心和各分局溝通后形成統一處理方案,進行人機交互處理;房地屬性檢查采用“房地空屬整合”方法或“宗地空屬整合”方法均可,將宗地權利人、土地證號等信息整合至房屋數據圖層。
由于原房地管理方式不同,在進行數據整合時需采用基于語義的模糊匹配方式進行整合。將宗地和房屋的權利人信息生成語義字典,通過字典的相似度來進行房地屬性信息整合,當然數據整合過程中還是需要人為干預來保證正確率。
通過對各個檢查項的詳細分析,利用AE綜合編制了一個檢查小工具,方便作業員使用。檢查界面截圖如圖7所示,檢查過程中的修復界面如圖8所示。

圖7 檢查工具界面

圖8 檢查過程修復界面
以上數據檢查項,除了部分有明確檢查條件的檢查項外,其余均需進行人機交互修改,通過檢查工具檢查到問題數據,根據實際情況人為判斷取舍或修改。
自動修復主要包括最小銳角修復、最小面積修復、重復對象修復。對最小銳角造成的圖形變形,直接刪除此最小銳角對應的折點;刪除最小面積且與其有相同屬性的數據;刪除空間和屬性均相同的數據。
由于檢查的數據都是進行整理后的宗地和房屋成果數據,在進行自動修改時設置的閾值相對都很小。以防將整理的成果被錯刪,檢查內容中大部分還是需要人為干預判斷修改。
在沈陽市不動產數據質量檢查過程中,檢查工具在發現問題和進行宗地房屋數據整合上發揮了重要作用,避免了數據空屬的非法性。但由于宗地和房屋數據的特殊性,智能化程度不高,大部分數據檢查出問題后均需要根據數據實際情況進行人為干預修改,智能化修改功能在后續的工作中還需進一步改進。