李淼,田宗彪,陳海鵬,楊緒峰
(國家測繪產品質量檢驗測試中心,北京 100036)
地理國情是重要的基本國情[1],做好重大國情國力的動態監測,是全面了解國情、把握國勢、制定國策的基礎性工作[2]。隨著自然資源監管的融合統一,地理國情監測成果的應用領域隨之擴大,應用層級也隨之提升[3],地理國情監測成果將持續發揮對各類自然資源調查監測的基礎性支撐作用,其成果質量水平將直接影響自然資源調查監測各類統計、分析結果的正確性與可靠性[4]。自然資源調查監測業務對地理國情監測成果提出了更高的要求,因此,基礎性地理國情監測成果的質量提升方法研究是其重要保障。本文分析總結了在自然資源監管融合統一的格局下基礎性地理國情監測成果的質量要求,并結合實際生產中頻發性、關鍵性的典型問題分析質量影響因素,提出了質量提升的方法和措施。
地理國情監測成果主要是利用多源航空航天遙感影像中蘊含的豐富光譜、紋理及時相特征[5],結合各種參考資料和知識,采用交互解譯、外業調查等方法,提取地表覆蓋分布及變化信息,采用數據集、元數據和統計等進行數據表達,具備數學基礎、數據精度和數據現勢性等質量特征[6]。由于我國地域廣袤,各地自然和人文環境差異較大,衛星遙感影像源往往存在傳感器多源差異大等問題,對地表變化信息采集造成不利影響,再加上生產作業過程中存在的各種人為和軟件因素[7],導致地理國情監測數據成果中難免存在各種質量問題,其中時間精度、采集精度、分類精度和屬性精度嚴重影響監測成果的數據質量,在面向自然資源大數據集成和融合的過程中,存在影響政府部門應用統計分析、影響決策正確性的風險[8]。
地理國情監測數據成果要求原始資料數據源、行業資料和成果數據均滿足時點要求[9]。一般采用資料核查分析方法進行檢驗,核實內容包括影像數據源的時相信息、各行業專題資料的現勢性、外業調查工作的時效性以及最終成果的時點。
地理國情監測成果的數學精度主要體現在地表覆蓋數據采集和國情要素數據采集的地物范圍與影像上地物邊界和位置的對應程度。檢查內容包括幾何位移和矢量接邊,一般要求在合格正射影像的基礎上,影像上分界明顯的地表覆蓋分類界線和地理國情要素的邊界以及定位點的采集精度控制在5個像素以內。
地理國情監測成果的分類精度檢查內容主要包括分類正確性和覆蓋完整性2個方面。首先,要求數據成果應完整覆蓋所承擔監測任務區的范圍;其次,要求在沒有明顯分界線的過渡地帶內,地表覆蓋分類數據中的圖斑應至少保證符合上一級類型的歸類要求,分界線明顯的圖斑須嚴格按照歸類要求正確歸類。
地理國情監測成果的屬性精度檢查內容主要包括通用屬性項、專有屬性項的完整性和正確性。要求值域范圍符合枚舉值要求,標識發生變化類型的屬性客觀正確,更新對象與正射影像、外調成果、行業專題資料以及其他參考資料的屬性一致等。
本文結合近年來從事的基礎性地理國情監測數據檢查工作進行分析,梳理歸納常見影響成果質量的問題,主要集中表現為以下幾個方面。
將轉基因煙草葉片用100 mol/L 的eBL處理10 h。提取BnBZL2蛋白,將20 mg蛋白加到12%的SDS-PAGE上進行分離,并轉移至硝酸纖維素膜(100 mA,1 h)。將硝酸纖維素膜在含有1% BSA的PEB緩沖液中封閉處理1 h,然后用抗GFP抗體(Santa cruz biotechnology)探測堿性磷酸酶標記的二抗。15 min后加入底物BCIP/NBT(Invitrogen),停止反應后進行觀察。
數據源使用不正確導致在時間精度、采集精度、分類精度和屬性精度方面產生質量問題。數據源主要包括影像和專業部門的專題資料。在影像保障上,國家層面分批多次下發影像數據,除統一開展的影像資料收集工作外,允許各作業單位發揮自身優勢協同開展影像收集工作;在專題資料收集上,除了國家基礎數據外,還有各省自行收集到的水利、林業、國土、交通、民政、環境等相關部門的專題資料。在數據源使用過程中,需要綜合考慮影像分辨率和時相的要求,并充分利用權威專業部門現勢性好、規范程度高的資料。數據源使用常見以下問題:同一重要區域覆蓋多源影像,未采用高分辨率影像進行數據生產,導致邊界范圍采集精度超限;同一區域具有監測期內不同時相的同類型影像資料,未采用第二季度影像或最新影像進行生產,導致影像現勢性不滿足要求,造成圖斑漏更新;其他各類基礎測繪成果和水利、林業、國土、交通、民政、環境等相關部門的專題資料成果時相性不滿足要求或對專題資料的分析整理不到位,導致要素更新錯誤。
針對數據源使用問題,提出以下2點建議。
①由于影像資料難以一次性收集,且由于客觀原因分批次下發的影像在分辨率、時相方面存在較多差異,在影像資料使用時,應以選擇使用有效信息量更大、更有利于信息提取的影像為原則。為避免作業員在生產過程中使用單景影像發生數據源選擇錯誤的情況,建議作業單位組織專人對影像進行篩選,選擇分辨率和時相更為合適的影像,分批次按不同分辨率進行影像鑲嵌拼接。作業員使用鑲嵌后影像進行生產,保證作業員在作業過程中使用的影像唯一,降低作業員切換影像導致影像源使用錯誤的風險。
②在利用專題資料進行生產時,應對各類資料進行時效性和正確性的篩選、甄別、整理,確保專題資料的可使用性。
1)數據采集超限。采集精度超限的問題主要源自影像使用方面,沒有依據影像進行準確的范圍采集。例如城市地區前期已采用低分辨率影像進行數據更新,但由于影像分辨率低,范圍邊界更新不準確,在補充高分辨率衛星影像數據源的情況下,未依據高分辨率影像進行邊界范圍的調整,導致圖斑邊界和正射影像套和差超限;監測期影像上地物類型和范圍均發生改變,作業過程中只依據新時期影像進行地類編碼的修改,未對圖斑邊界范圍進行修改,導致邊界范圍采集超限。圖1反映的問題為監測期地物發生變化,作業員未根據監測影像更新圖斑編碼和邊界,導致圖斑邊界與正射影像邊界不套和。

圖1 采集精度超限
2)圖斑漏更新。在作業過程中,由于技術路線驗證不充分和對地物更新尺度把握不統一,導致圖斑存在漏更新錯誤。個別作業員習慣將變化區域識別和變化信息采集分為2個獨立的作業過程,變化區域識別過程僅疊加2期影像進行變化范圍的確定,變化信息采集過程中只疊加本底矢量數據、監測期影像和變化范圍圖層,在已識別的變化范圍內進行變化信息的采集,忽略了范圍外的變化,導致地物變化漏更新。遙感影像上同種地物可能具有不同的光譜特征,作業員對某些地物的解譯和更新指標等理解不到位,更新尺度不一致,導致圖斑漏更新。圖斑漏更新直接影響監測數據在更新數據集上的統計分析和使用。圖2反映的問題為種植土地變更為房屋建筑區,未依據監測期影像進行地類更新。

圖2 建筑物漏更新
3)圖層間約束關系錯誤。由于地表覆蓋數據與地理國情要素數據分屬不同作業人員生產,或后續修改過程中未注重2類成果間一致性等原因,容易造成同一生產單元的2類成果之間邏輯一致性出現問題,如道路中心線超出地表覆蓋路面范圍,常年河中心線不在地表覆蓋水面內等。圖3反映的問題為地表覆蓋中水面和國情要素中高水界范圍線未同步更新。

圖3 水面和高水界約束關系錯誤
針對數據更新采集問題,提出以下3點建議。
②加強過程檢查,對影像及元數據制作、變化信息采集等關鍵作業環節進行質量檢查,避免將錯誤帶入下一個生產環節。
③強調作業人員間的聯動更新,同時充分利用已有質檢軟件,對數據的聯動更新問題進行排查。
屬性賦值貫穿于數據采集和編輯整理過程中。生產中為了提高生產效率,對某些屬性項進行軟件自動賦值,軟件在測試驗證不充分的情況下投入使用,勢必導致一些人為和軟件缺陷造成的屬性賦值錯誤,且一旦出現基本都是普遍性錯漏。
1)枚舉值賦值錯誤。數據中存在部分枚舉字段,可以采用人工或自動方式進行填寫。如在地理國情監測數據成果中“變化類型”字段體現變化,應根據圖斑伸縮、新生等情況對字段進行賦值。在生產過程中存在因為個人理解不到位導致的“變化類型”賦值錯誤,也存在由于軟件未經過測試驗證便投入使用而導致的“變化類型”“要素唯一標識碼”等枚舉值字段賦值錯誤。圖4反映的問題是新生型圖斑“變化類型”錯誤賦值為9。

圖4 變化類型錯誤
2)對象屬性與資料/實地不一致。國情要素更新主要依據權威部門的專題資料。由于各省收集的專題資料水平不一致,在專題資料完整性和時相性方面均存在差異,導致在生產中存在2方面問題:①沒有充分利用專題資料信息,可填寫的屬性漏填;②充分依賴專題資料,沒有對專題資料進行分析、整理和檢查,機械的賦值、明顯的錯誤沒有剔除,導致要素對象屬性與實地調查結果不一致。圖5反映的問題為依據專題資料對道路進行了更新,而通過外業照片資料進行核查,發現道路車道數、路寬屬性均與實地不一致。

圖5 道路屬性與實地不一致
3)圖斑類型錯誤。大面積圖斑更新錯誤會直接導致數據成果質量不合格,使數據可信度降低,嚴重影響統計、分析和決策。圖斑類型錯誤主要由3方面原因造成:①由于圖斑切割或合并時誤操作導致原本未發生變化的圖斑錯誤更新;② 2期影像對比無明顯變化,僅通過內業無法確定圖斑分類情況下,未輔以外業調查,僅通過內業判讀對面積較大數據進行了更新;③編輯整理過程中未依據外業調查結果進行圖斑分類編碼的更新。圖6反映的問題為在進行數據更新生產時,對原有圖斑進行切割或合并操作,對圖斑賦屬性時產生人為錯誤,從而導致實際未發生變化的城市道路CC碼賦值錯誤。

圖6 將城市道路錯地表示為草地
針對屬性賦值問題,提出以下3點建議。
①在生產過程中謹慎使用軟件進行賦值,對投入使用的軟件加大前期測試的力度和強度,對重點屬性進行重點測試,并結合質檢問題的持續暴露對軟件進行動態更新,確保自動化賦值的正確性。
②各級檢查工作中加大對大圖斑的排查力度。
③加強內外業的工序銜接,在無充分依據的情況下不對存疑圖斑進行地類更新。對專題資料要合理有效利用,同時根據外業調查結果進行內業成果編輯整理,確保內外業結果一致。
基礎性地理國情監測數據生產是一個人力密集型的生產過程,自動化過程占用生產的小部分,數據生產工序復雜,成果類型繁雜。本文圍繞人員、設備、資料、技術、質量管控機制等方面,提出以問題為導向、全過程質量控制、按要素重要性分級檢查、優化質檢軟件資源配置、以方法預研為方向的多途徑創新質量管控模式,不斷探索提升質量把控成效的新思路,應用于基礎性地理國情監測項目實施過程的關鍵環節。過程關鍵環節及其質量提升措施如圖7所示。

圖7 過程關鍵環節及質量提升措施
監測數據成果的質量控制應堅持以問題為導向,將檢查關注點從數據成果轉移到人員、設備、資料、技術、質量管控機制5個方面,把握關鍵問題,從問題入手,確保各級質檢有的放矢。在檢查過程中,緊盯嚴重影響成果質量的關鍵環節和重要因素,包括以作業員為主導作用的工序所產生的缺陷、自動化過程所用軟件的不可靠性、數據資料收集利用的不充分性、技術路線方法的偏差性以及管理部門質量監管的不到位等。
地理國情監測的質量控制在傳統“兩檢一驗”測繪成果質量檢驗理念的基礎上,遵循從作業單位到承擔單位再到國家層面的分級質量管理,強化全過程質量控制,對影響數據質量的關鍵環節進行過程把控,及時發現并解決生產中出現的質量問題,把質量控制的關注點從結果控制前移至過程控制,充分發揮質檢對生產的保障作用。同時加強技術培訓、督促和糾正技術偏差,及時發現影響監測成果的普遍性、傾向性問題,統一技術標準,保障數據質量符合技術設計要求,為自然資源專項調查等重大國情國力調查監測奠定基礎。
在質量評判環節,根據后期監測成果數據使用的程度不同,將國情要素劃分為極重要要素、重要要素和一般要素,成果出現不合格的較多情況是由極重要要素、重要要素出現錯漏導致。因此,從作業過程出發,結合各級質量控制,突出檢查極重要要素和重要要素,在質檢力度不變的情況下,可有效保障成果質量,將可能出現的質量問題對成果使用造成的影響降至最低。
在現有作業模式中,質檢軟件的使用在質量檢查中成效較高,對檢查效率和成果質量提升具有重大的促進作用。然而,生產單位質檢軟件配置有限,加上各單位質檢人員力量有限,導致質檢軟件的使用只能短期集中于檢查環節。歷年來,國情監測時間緊、任務重,通常在后期集中開展問題整改容易導致出現其他意外錯誤。本文結合多年工作經驗,認為應將質檢軟件使用前置,從生產作業環節就開始投入使用,利用質檢軟件對關鍵質量要素進行自查,可有效避免成果整改的集中化,通過不斷優化質檢資源配置,可大程度提高質檢效率。
隨著地理國情監測和自然資源其他行業調查監測工作的深入開展,多年來獲取的各種影像源、專題資料以及各類數據產品規模不斷擴大[10],從數據量、增長速度、準確度和應用價值來看,標志著監測數據已進入大數據時代[11],這意味著基礎性地理國情監測數據成果的檢測數據將涉及國民經濟的每一個角落,是一種重要的質檢資源。質檢部門要使用好這些共享數據資源,進行質檢方法的科技創新,在互聯網、云模式的技術支持下,探索地理國情大數據的集成共享,構建可集成眾源數據的質檢大數據支撐數據庫,形成可供用戶上傳下載的數據池,包括解譯樣本、專家知識,以及利用大數據深度學習提取的海量變化信息模型,用以輔助質檢,從而提高質檢工作效率,實現質量管控的科學性、公正性、全面性與客觀性。
基礎性地理國情監測是常態化的活動,歷年來取得的成果已在“多規合一”、城市規劃實施監管、環境保護與治理、自然資源管理、空間用途管制等多個方面得到應用。隨著自然資源業務的融合統一,各項業務工作對地理國情信息產品將會提出更多、更高的要求。
本文對基礎性地理國情監測數據質量提升方法進行了論述,分析了出現的主要質量問題及原因;提出了有針對性的質量提升措施,包括以問題為導向的檢查方法、全過程的質量管控方法、優化質檢軟件配置和突出重要檢查項的檢查模式,并對基于大數據的質檢模式進行了初步探索。
本文提出的方法在實際質量控制工作中加以運用,取得了較好的成效,對于基礎性地理國情監測質量控制工作具有一定的指導意義,對過程抽查、成果驗收、成果復核等環節具有一定的參考價值。在接下來的研究中,將圍繞地理國情監測生產技術水平、成果形式多樣化,以及互聯網+大數據等多方面技術的發展,開展基礎性地理國情監測數據成果質量提升方法的深入研究。