薛春璐,郭 琳,馬紅旺,盧 萌,裴志遠
(1.農業農村部規劃設計研究院農業資源監測站/農業農村部耕地利用遙感重點實驗室,北京 100121; 2.中國農業科學院農業信息研究所,北京 100081; 3.易智瑞(中國)信息技術有限公司,北京 100028)
數據成果匯交是行業數據共享的前提,是推動科學數據可持續發展的動力,是行業大數據應用的支撐。各類科技行業都在實際工作中進行過數據匯交的嘗試,如極地考察科學研究工作[1]、中醫藥科學[2]、水利科學[3-4]、生態科學[5]等。農業科學共享數據已有匯交管理流程[6],但匯交數據的規范性尚需完善。農村土地承包經營權確權登記(簡稱“農地確權”[7])成果數據是農業領域大數據構成之一[8],與當前結構化和非結構化農業大數據整合分析,可以針對不同需求,基于大數據分析做出輔助性決策,更加有效地利用當前農業信息資源。
2009年,中國為妥善解決農村承包地四至不清、面積不準等問題[9-12],建立了應用3S技術等現代信息手段[13-17]進行農地確權的工作流程,以實現農村土地承包經營權的空間化和信息化,完善農村土地承包制度,為貫徹落實“三權分置”[18-20]政策提供保障。自提出農地確權工作以來[21],全國陸續開展該項工作的涉農縣超過2700個,部分地區已完成調查工作[22]。隨著全國農地確權工作的進行,各省積極整理農地確權調查工作的數據和資料,并嚴格按照農業部門下發的有關政策[23-25]組織農地確權數據成果匯交工作。雖然中國正在建設有關農業農村大數據信息系統[26-27],但大數據量、大業務量的農地確權成果數據短時間內集中匯交給中國農地數據管理造成了一定壓力。為緩解國家級農地信息平臺建設壓力,提高農地確權匯交工作效率,文章將政策規范信息化,依據《農村土地承包經營權確權登記數據庫成果匯交辦法(試行)》(農辦經[2015]13號,簡稱《匯交辦法》),梳理匯交業務流程,形成系統核心功能,基于GIS平臺[28],研發了農村土地承包經營權確權登記數據成果匯交管理系統。該系統是國家農地信息平臺的咽喉,有序接收全國各縣農地確權成果數據,向上承接“數據質量檢查系統”,向下關聯“數據庫管理系統”,支撐國家級農地確權信息應用平臺建設,支持大數據量成果管理和空間統計分析,對全國各省、市、縣分區數據匯交情況、數據質量、承包地各類農業用途、是否基本農田、權證信息情況、承包方情況等進行空間挖掘,為開展農地大數據應用提供基礎地理信息數據保障,并對省、市級行政區農地確權數據成果匯交管理系統建設提供技術示范。
系統首先滿足政策業務需求,保障大數據量、大業務量的全國農地確權數據庫成果短時間內集中順利匯交,并滿足數據管理系統基本需求。政策需求方面, 2016年6月,《農業部關于做好農村土地承包經營權信息應用平臺建設工作的通知》[29]提出匯交建庫及管理要求:國家級層面到2018年完成不少于1 500個縣級確權成果數據匯交工作, 2019年以后逐步完成剩余縣的匯交工作,在此之前,《匯交辦法》文件規范了以縣級行政區為基本單位的農地確權數據庫成果提交程序、內容、形式以及存儲規則。
業務數據量方面,全國2 700多個行政縣的農地確權成果匯交業務數據量大、業務量大,涉及數據基礎地圖、矢量圖形數據、權證信息數據的存儲,以及時間和空間角度的全國各級行政區農地確權信息的統計與分析。農地確權成果數據類型復雜、數據格式多樣,據農村土地承包經營權信息應用平臺建設方案,全國農地確權數據存儲約3 600TB,估算結果如表1所示,估計影像數據所占數據量比重最大,其次是圖件數據,估計與影像數據量差距很大。
表1 全國農地確權數據存儲量估算

數據種類影像數據權屬數據矢量數據圖件數據合計數據量(TB)3 214.5517.2044.02305.003 580.77占總數量(%)89.770.481.238.52—
在政策需求和大數據量、大業務量需求的前提下,該研究綜合考慮系統穩定性、安全性、易操作性、高效性和可擴展性原則進行研發[30]。
該系統基本功能需求:一是要易于進行以縣為單位的農地確權數據成果匯交業務,實現數據高效審核、錄入; 二是能對數據進行管理和初步挖掘,按時間、空間和指標進行查詢、匯總、統計、分析,為農地大數據研究提供基礎; 三是與農地信息平臺中其他系統對接,關聯“數據質量檢查系統”和“數據庫管理系統”,緩解數據存儲壓力。
確權成果數據涉及空間信息,原始測繪數據的保密性要求數據通過物理隔離方式進行提交,系統應在局域網中進行操作,并支持多用戶操作模式。系統基于ArcGIS平臺和Web服務器[31-32]作為組件層在B/S模式下進行開發[33-35]。系統總體架構如圖1所示,包括數據層、組件層、應用層和交互層[36-39]。系統底層構架數據層采用關系數據庫和空間數據庫對不同類型數據進行組織,以避免農地確權數據在系統運行產生大量信息而影響系統操作。在數據層和組件層的支持下,系統可以完成匯交單元管理、匯交狀態管理、匯交成果管理、匯交數據分析和系統管理的應用。最后在交換層實現與用戶的交互,實現系統功能操作。

圖1 系統總體設計
接口設計為不同功能模塊和系統之間設置通信規則,提高系統運行效率,用來實現系統大量數據高效讀寫、查詢、與農地信息平臺其他系統之間的互聯互通。根據系統前端功能需求來設計后臺操作接口,統一資源定位符、統一數據提交類型、統一用戶操作類型、統一參數信息和返回信息等。系統接口設計內容涉及系統管理接口、匯交預約接口、上傳解析信息接口、數據入庫接口和對接其他系統的接口。
數據庫主要由匯交業務類、匯交數據類、質檢類和系統類信息組成,其具體內容如圖2所示。系統采用關系數據庫和空間數據庫對不同類型數據進行組織。匯交業務類庫表記錄匯交業務進度管理的各種信息,主要用于管理在匯交過程中產生的各種節點事件和流程。匯交數據類庫表記錄匯交上來的匯總表數據,主要用于進行匯交數據的統計、分析和查詢。質檢信息類庫表記錄與質檢系統交換的信息,主要用于統計質檢情況。系統類庫表用于記錄系統內的各種信息,主要支撐系統運行。

圖2 匯交管理系統數據庫表設計結構

圖3 匯交業務流程
系統服務于全國農村土地承包經營權確權登記數據庫成果匯交工作,審查匯交數據、錄入合格數據、記錄匯交數據的質檢結果和統計分析匯交情況,提高數據管理工作效率,關聯數據質檢系統和數據庫管理系統。
依照《匯交辦法》的業務要求,對匯交業務流程進行了設計(圖3)。《匯交辦法》要求以縣級行政區為單位進行數據庫成果匯交。由于數據的涉密性質,必須以物理隔離的方式進行提交。如圖3所示,系統記錄數據匯交時間、提交單位信息,并掃描匯交數據包記錄各類數據存儲量,系統記錄匯交數據基本情況。對數據進行初審,若人工識別出數據不完善,如數據種類不全、數據命名不符合要求等,則退回數據; 如果數據通過人工初審,系統派送質檢任務對其進行數據質量檢查[12],生成質檢報告并反饋給該系統。若數據不合格,數據需重新匯交; 若數據合格,系統錄入匯交數據,輔助數據庫管理系統建設,同時生成數據匯交成功記錄。
2.2.1 匯交預約
該模塊記錄匯交單位與提交人的基本信息,并初檢匯交數據包內各文件是否按照《匯交辦法》進行組織,能掃描并錄入匯交數據包各類文件數據量大小和各類文件總數,并記錄存儲位置。系統數據庫內部存儲全國縣級行政區劃代碼,匯交單元代碼按照行業標準執行[40-41],便于匯交單元快速錄入。匯交預約成功的將進行匯交處理。
2.2.2 匯交處理
按照匯交業務流程處理匯交狀態,與數據質檢系統對接,派發質檢任務,接收質檢結果,對匯交預約失敗和質檢不合格數據進行退回處理,并進行記錄; 錄入質檢合格的匯交數據包,為進行匯交成果分析和數據分析提供基礎。
2.2.3 成果管理
各類匯交業務完成情況可以隨時間在空間上形成特征,為掌握農地確權成果匯交工作在不同時間和區域的進展情況,比較、初步評價和監測各地區確權工作態度和完成質量,系統從時間回溯和空間角度對“匯交進度”、“質檢情況”和“匯交數據量”等方面,采用人機交互模式,基于全國、省、市不同行政級別統計和查詢匯交成果,主要指標有匯交單元數量、匯交進度、匯交率、匯交通過率等,以及各類數據文件數量和數據量大小,并形成各指標的統計圖表和地域空間聚類分析結果。
2.2.4 數據分析
系統采用人機交互模式,在ArcGIS服務器支持下,基于中國行政區對匯交數據進行快速挖掘分析,進一步體現此次農地確權工作獲得的地理信息數據價值。包括承包地各類農業用途、是否基本農田、權證信息情況、承包方情況等。
2.2.5 其他功能
系統與數據質檢系統和數據庫管理系統通過接口實現各系統之間的互聯互通,緩解數據運行壓力,提高總體運行效率。
系統由3種服務器支撐開發,其中Web服務器操作系統為Linux上面的uWSGI,由Microsoft Internet Information Server結合ArcGIS for Server支持系統運行,內存16G,存儲刀片約4PB。數據庫和ArcGIS server服務器系統為windows 2008 r2。數據庫平臺采用對空間數據的支持性好、穩定性高、兼容性好、可運行于多種平臺的Oracle 12c。系統開發前端操作系統為Windows 10。系統采用目前主流的Html、JavaScript、Python3類計算機語言聯合編寫,其中服務器端采用Python語言來完成后臺的請求響應和數據庫操作功能,以*.json文件為后臺和前端數據交互格式。系統前端采用Eclipse支持JavaScript 語言進行系統開發,在瀏覽器中用Html搭建Web界面,實現系統功能。
對系統各項功能進行測試,在各種匯交業務狀態下,系統運行正常,于2016年7月試運行,輔助各省的確權數據成果向國家層面提交,確保匯交單元順利進行預約,并將合格的匯交數據錄入數據庫管理系統,此后系統將不斷針對實際業務需求進行改進。
目前,隨著《關于匯交縣級農村土地承包經營權確權登記數據的通知》(農(經綜)函[2016]207號)的下發,全國各地區依據通知規定的時間陸續提交數據,結果表明,截止2018年4月25日,全國已有25個省(市、區)共1 140個縣申請過數據匯交,約占全國行政縣總量的40.98%,有507個縣完成匯交,匯交進度18.22%,初步統計數據量達2 866TB。自系統導出全國各省匯交業務統計結果如表2所示。
表2 全國各省(市、區)匯交業務情況統計結果(截止2018年4月25日)

區域匯交進度(%)匯交次數(次)完成匯交縣(個)應匯交縣(個)匯交通過率(%)匯交率(%)全國18.221 1405072 78244.4740.98北京0.0000130.000.00天津0.000060.000.00河北0.5611179100.000.56山西58.261166711557.76100.87內蒙古0.00301040.002.88遼寧0.0080800.0010.00吉林0.0000650.000.00黑龍江6.7812811866.6710.17上海0.001090.0011.11江蘇5.563859013.1642.22浙江0.0030900.003.33安徽64.081146610357.89110.68福建0.00180810.0022.22江西6.809471037.4591.26山東81.2916312615577.30105.16河南0.008801530.0057.52湖北15.6327159655.5628.13湖南5.479712877.787.03廣東0.004301150.0037.39廣西0.921111099.0910.09海南50.0012112291.6754.55重慶0.0000380.000.00四川42.071466916447.2689.02貴州15.7966159522.7369.47云南0.00001310.000.00西藏0.0010730.001.37陜西53.21675810986.5761.47甘肅33.3371298740.8581.61青海0.0060340.0017.65寧夏100.00222222100.00100.00新疆0.0000950.000.00 注:港澳臺沒有參與確權工作
據表2統計結果,寧夏匯交進度達到100%,即該省在統計截點已經完成了農地確權匯交工作。北京、天津、吉林、重慶、云南、新疆尚未提交過數據成果。部分地區如上海、西藏、內蒙古、浙江、青海、遼寧、福建、廣東、河南已提交確權成果數據,但尚未完成質檢或未通過質檢,因此沒有完成匯交的縣。河北省目前只完成了一個縣的匯交,其匯交進度為0.56%,但其匯交通過率為100%,說明這個縣僅提交過1次,且1次性通過了質檢,表明數據質量好。山西、山東、安徽的匯交率超過了100%,即匯交次數大于應匯交縣數量,說明有些縣不只提交過1次,存在重復提交或數據退回再次提交的情況。
匯交進度、匯交通過率和匯交率客觀反映各區域確權工作質量。匯交進度是完成匯交縣數量占應匯交縣數量的比重,是反映農地確權工作完成多少的指標,其中完成匯交縣是指數據質量合格的數據成果。匯交通過率是完成匯交縣數量占匯交次數的比重,是對匯交成果數據質量的衡量,其中匯交次數包含重復提交或數據質量不合格被退回再次提交的情況。匯交率是匯交次數占應匯交縣數量的比重,可以反映各地區匯交工作積極性,與匯交進度指標結合進一步反映匯交數據質量。匯交率不會小于匯交進度。對上述3個指標進行統計對比分析(圖4)。

圖4 全國各省匯交情況分析
按照各省匯交進度由大到小排序,圖4結果表明,寧夏、山東、安徽、山西、陜西、海南匯交工作進度過半,表明匯交工作進展快。其中,寧夏3個指標值都是100%,是統計截點時農地確權數據成果匯交工作質量較好的地區。陜西、海南、黑龍江、湖南、湖北、河北等地區匯交通過率相對較高,且高于匯交率,匯交進度與匯交率差距小,表明這些地區數據質量高。上海、西藏、內蒙古、浙江、青海、遼寧、福建、廣東、河南只有匯交率,匯交進度和匯交通過率為0%,表明提交過的數據尚未完成質檢或未通過質檢。結果表明,匯交通過率越大,數據成果質量相對越好。匯交進度與匯交率差距越小,表明數據重復提交次數越少,農地確權成果匯交工作質量越好。
基于匯交情況,利用動態繪制技術,將最新的縣級行政邊界實時更新到系統的GIS 服務器上,實現了對不同時間、不同空間區域的匯交成果分析和確權成果數據挖掘分析、匯交數據情況分析。選取部分系統運行結果進行示例,如圖5所示。

圖5-a 匯交業務成果統計結果(山東省部分城市) 圖5-b 匯交業務成果空間分布(山東省)

圖5-c 全國匯交業務結果統計分析

圖5-d 全國匯交數據量統計分析

圖5-e 基于確權成果數據的承包地利用分析(寧夏)圖5 匯交數據分析實現結果(截止到2018年4月25日)
圖5-a與圖5-b以山東省為例表達匯交業務成果,其中圖5-a為系統界面左側,表達匯交業務統計情況,圖5-b表為系統界面右側,空間上表達了東省西部和中部完成匯交縣數量多,濟南市、濱州市和煙臺市完成匯交縣數量較多,其他地區完成匯交縣數量較少。圖5-c為全國匯交進度情況統計分析,可見匯交工作完成了18.22%,匯交通過率為44.47%,從下排柱狀圖可見各省匯交進度情況。圖5-d為數據量統計分析,可見全國柵格數據量最大,為2 813.06TB,占總數據量的97.47%,其次是圖件數據量,占總數據量的1.69%,其他資料數據量占總數據量的0.65%,矢量數據僅為0.18%,這種比例情況與需求分析中的農村土地承包經營權信息應用平臺建設方案估算比例結果較一致;下排柱狀圖是各省各類數據量的統計分析,鼠標滑過可見其詳細情況,圖中所示為黑龍江省各類數據量。圖5-e是基于已匯交工作的確權成果數據空間分析實現,以寧夏為例分析了承包地塊面積情況,可見定西市承包地面積最大。
系統運行結果可初步掌握全國各地區農地確權成果匯交工作情況,了解農地確權工作完成進展和數據質量,是農地大數據的來源之一。系統根據匯交成果實時分析中國耕地承包經營權情況,促進確權成果服務于現代農業建設,為貫徹“三權分置”政策、培育新型農業經營主體、農業補貼發放、土地經營權抵押、高標準農田建設、耕地質量保護與提升、農業規劃等提供數據支撐。系統有序接收全國各縣農地確權數據成果,為數據庫管理系統分擔數據處理壓力,支撐國家級農地確權信息應用平臺建設,為開展農地大數據應用提供基礎地理信息數據保障。
該研究依據《匯交辦法》及全國農地確權工作需求,在梳理匯交業務流程的前提下,基于GIS平臺和Web服務器,采用B/S模式,研發了“農地確權數據成果匯交管理系統”,實現了農地確權數據庫成果匯交業務信息化和相關數據分析。系統運行結果如下。
(1)實現了政策性業務信息化,以縣為匯交單元的農地確權數據成果匯交業務信息化,包括匯交預約和匯交數據信息錄入,對匯交數據文件包進行掃描并審核,保障匯交數據質量。
(2)實現了各類匯交業務的高效處理,能與數據質檢系統和數據庫管理系統互聯互通,承接數據質檢系統工作結果,支撐中央數據庫管理系統數據準備工作,緩解農地確權數據成果整理工作壓力,提高工作效率。
(3)采用人機交互模式實現了大數據量的農地數據可視化管理、統計與分析,從時間回溯和空間區劃角度,對匯交業務和數據進行計量、空間查詢與統計分析,分析結果為現代農業建設、“三權分置”政策貫徹、農業供給側改革和土地規模化經營策略提供參考依據。
研究基于系統運行結果,僅對一個統計截點的數據進行了簡單分析,多個統計截點的系統運行結果可進一步作對比分析,監測全國各地區農地確權數據成果匯交工作進度和數據質量。由于系統功能上的界定,該系統僅對農地確權數據成果中的匯總表信息和部分權屬信息進行了數據挖掘分析與成果表達,而更深入的數據挖掘,如不同用地等級的承包方式的面積比重、人均和戶均承包地面積、不同年齡段和性別的承包方代表數量及其承包經營面積等將在數據庫管理系統中進一步實現。該系統對各省市匯交管理系統建設具有技術示范與指導意義。系統輔助大數據量的全國農地確權成果匯交工作進行,匯交工作結束之后,所得成果將支撐國家級農地確權信息應用平臺建設,對全國農地確權空間數據庫建設和數據服務提供支撐,為農地大數據應用提供保障。