焦道振,曾 銘,高照忠,廖樂林
(1. 廣東省地質測繪院,廣東 廣州 510080; 2. 肇慶市自然資源局,廣東 肇慶 526040; 3. 廣東工貿職業技術學院,廣東 廣州 510510)
不動產數據整合是不動產統一登記中一項極為重要的數據建設工作,是一項關乎國計民生的基礎性工作。數據質量的好壞直接影響到不動產登記效率和地方政府不動產精細化管理,影響到地區的經濟統計和宏觀調控政策方略。自2007年3月,第十屆全國人大第五次會議通過《物權法》以來,不動產統一登記制度逐步建立,國家從法律、制度等方面入手,明確了全國土地、房屋、林地、海域等不動產統一登記職責,并基本做到登記機構、登記簿冊、登記依據和信息平臺“四統一”。但由于登記機構、地方做法、歷史遺留問題等諸多原因,造成了不動產數據數據存儲格式多樣,數據質量差異明顯。不動產數據整合需要對不動產數據分散存放、格式不一、存儲介質不同等進行統一梳理、規范,依據不動產登記數據庫標準進行整合[1],建設不動產登記信息數據庫[2]。選擇合適的數據整合處理工具,可以快速篩選出有缺陷的數據,有側重地進行數據處理,大大提高不動產數據成果質量和數據整合效率。
通過調研摸底,不動產登記信息主要有Oracle、SQL Server、Excel、MDB等類型,空間數據主要有DWG、SHP、MDB、GDB、TIF、坐標串文本文件等格式。因而,不動產數據整合需要采用支持眾多數據格式的ETL工具,對不動產資料進行分析、轉換、處理、檢查、更新、輸出等操作,通過與同類軟件的對比,選擇FME作為數據處理軟件。FME是一個支持多源異構數據融合[3]的ETL工具,支持的數據格式覆蓋GIS、CAD、柵格、數據庫等,超過300種,涵蓋了不動產數據現有的類型和格式,常用于處理地理信息數據[4]。此外,FME內置大量轉換器,可以完成絕大部分常規數據處理,是一種較為理想的不動產數據整合與建庫工具[5]。
本文采用FME和VSFTP[6]相結合的方式實現團隊數據整理步驟的相互協作[7],整個工作環境部署在同一個與外網物理隔離的局域網內,作業模式如圖1所示。
FME處理模板制作完成后,部署于服務器端,可供數據整合人員、質檢人員按需運行,也可以部署定時任務,由服務器自動執行數據檢查和處理;將不合格的數據輸出到指定位置,由各作業小組自行下載并繼續處理,直至完成后再通過作業組質檢上傳至服務器,最后由數據整合人員或質檢人員執行FME數據處理模板,如此迭代,使數據不斷趨于完善。
依據《不動產登記數據整合建庫技術規范(試行)》的相關規定,不動產數據整合建庫分為工作準備、規范化整理、整合關聯、數據入庫4個階段。但在實際的不動產數據整合與建庫過程中,這幾個階段并不是孤立的,而是不斷地處理、更新、質檢,再處理、更新、質檢,不斷迭代以致數據趨于完善。基于以上操作,不動產數據整合建庫工作有資料收集、轉入中間庫、規范化整理、檢查及分類、核檔及補錄、外業調查測繪、整合關聯、成果驗收等環節,作業流程設計如圖2所示。
資料收集人員負責與業主方溝通,收集整理不動產資料,并將收集到的資料提交給規范化整理人員。
規范化整理的工作人員通過FME,將不動產信息從收集到的資料中抽取、轉換導入中間庫,轉換進入中間庫時,對每一條數據編制唯一的標識碼,字段為BSM。中間庫可使用任意支持SQL處理或存放空間數據的數據格式,如Access、GDB或Oracle等。
規范化整理的工作人員對數據進行分析,依據不動產相關處理辦法對能批量處理的信息進行批量處理,如字段值規范化、不允許為空的字段填入規定的缺省值等。
質檢人員對中間庫數據進行檢查,分類導出不合格數據,導出不合格數據時帶出BSM字段,并新增3個附加字段(修訂更新標識:XDGXBS,修訂處理人:XDCLR,修訂處理時間:XDCLSJ)。
數據修復整理人員對不合格數據進行核檔、人工修復、補錄、刪除冗余等操作,處理后在修訂更新標識處標記該記錄是新增、更新或邏輯刪除,并注明處理人、更新時間,成果交規范化整理人員,迭代轉換進中間庫、數據整理、質檢輸出不合格數據過程。
各類數據通過FME進行關聯整合[8],導出無法關聯的數據,供數據修復整理人員核檔補錄或供外業補充調查、測繪人員補充測繪數據。
外業補充調查、測繪人員對無圖的信息進行補充調查測繪[9],依據導出信息的檔案號核查檔案。檔案中有坐標信息則以檔案中的坐標直接成圖,對少量缺地形的區域采用傾斜攝影測量補充自然幢基底圖等要素[10],并進行現場調查測繪,獲取大致圖斑,注明為預權籍調查圖斑,供將來正式權籍調查定位使用。外業組成果交規范化整理人員,迭代轉換進中間庫、數據整理、質檢輸出不合格數據過程。
檢查分類及整合關聯過程輸出的不合格數據所占的比例達到質量控制所允許的范圍時,可通過FME轉換輸出指定格式的整合成果。
在數據整合過程中,每個重要工作環節都需要設置質量風險控制點[11],以保證不動產數據整合成果的質量,在目前技術條件下,部分環節的質檢只能通過人工方式核查(如核對檔案),電子數據的規則性檢查,如數據比對、合格性檢查、關聯分析、冗余檢查等,都可以通過運行FME模板自動化進行,并輸出不合格數據,如果使用人工處理,則耗時耗力,無法達到快速響應的目的。
數據屬性檢查主要是對登記信息的屬性或圖層中的屬性進行檢查[12],包括數據是否為空、值是否在字典范圍內、值是否在有效值范圍內等。這些是必填字段,如權利人的必填字段有:不動產單元號、業務號、權利類型、權屬狀態、權利人名稱、不動產權證號、國籍、權利人類型、權利比例、證件號等;建設用地、宅基地使用權的必填字段有:不動產單元號、業務號、權利類型、權屬狀態、宗地代碼、登記類型、不動產權證號、使用權面積等。在FME中,有針對屬性值進行判斷的轉換器,包括TestFilter、AttributeFilter、AttributeValidator等。使用FME進行不動產數據質檢時,將不滿足檢查條件的數據分流到待處理數據,并輸出這些數據,提交給核檔及補錄人員依據檔案補錄或修正數據。
如宗地代碼不是19位的數據一定是需要提取出來進行處理的數據,可以通過TestFilter轉換器將這些數據提取出來。通過FME的TestFilter轉換器,將宗地代碼不是19位的數據提取出來,供數據整合人員處理落圖,其他不合格數據的復查,也可作類似的處理。
根據自然幢基底圖斑,找出對應的宗地代碼,即實現圖上落宗,可使用FME進行批量落宗,考慮到自然幢會有跨宗的情況,圖上落宗算法需要作一部分調整,以免自然幢落在兩宗地。算法如下:計算自然幢內部點,將此內部點與宗地圖斑疊加,得到帶宗地代碼的內部點,再以此內部的宗地代碼更新自然幢所在的宗地代碼。
DWG數據的擴展屬性主要存放在實體的xData里面,一般以xData的AppName來進行數據組織,FME支持讀取DWG文件的擴展數據,卻不支持AppName定位讀取。因此,需要在CAD中先對DWG文件的屬性進行歸整[13],形成固定順序的xData屬性信息,再通過FME進行轉換入庫。
可以使用FME的統計轉換器排不動產單元號,以排自然幢不動產單元號為例,指定宗內排自然幢不動產單元號的最小值(也可以通過遍歷宗地最大自然幢號加1得到,但這種算法耗時),排宗地自然幢的序號,并以此序號得到自然幢的不動產單元號,若以自然幢坐落排序,在對自然幢有規律編制坐落時,自然幢號也將是有規律的排號。
中間庫成果處理達標合格后,可以自動輸出指定格式的最終成果,以輸出與系統對接成果為例,FME以對接數據模板輸出整合成果,由于權利人等表是由多類權利人合并成的一張表,故標識碼需要重新排列,算法(部分)如圖3所示。
定義好數據標準并配置好處理模型后,輸出FME格式的處理模板文件[14],并在需要時使用命令行執行數據處理任務。Windows下直接執行批處理文件,或使用計劃任務按需要執行數據處理任務;Linux下可編寫Shell腳本人工執行或使用crond執行定時任務。
研究區為南方某區縣,原落宗落圖率約為65%,以FME作為數據處理工具建立團隊協作機制,通過內外業相結合的方式,快速反應,更新數據,以50余人的團隊,歷時兩個月左右,完成該區縣絕大部分不動產數據的落圖落宗。通過團隊協助數據整合,該地區數據整合落宗落圖關聯率均達到90%以上。
這些數據更新進入業務系統后,該區縣不動產登記速度明顯加快[15],基本緩和了該地區不動產登記流程不暢的問題。
本文在FME和VSFTP的輔助下建立了一種高效安全的不動產數據整合作業模式。FME數據處理模板可以快速整合各作業小組成果,并輸出不合格數據,供作業小組迭代更新,寶貴的人力資源則集中于核對檔案、不動產信息修復與補錄、外業補充調查測繪等實質性不動產數據整合工作之上, 從而提高了不動產數據整合的工作效率和成果質量。