宋鐵軍
(1.華北有色工程勘察院有限公司,河北 石家莊 050000;2.河北省礦山地下水安全技術創新中心,河北 石家莊 050000)
元數據是測繪數據重要的組成部分,具有描述數據屬性特征。元數據存儲的信息量較大,包含圖號、坐標、圖幅狀況和誤差,軟件運行過程中所遇到的問題,以及可能解決問題的方法等。元數據的許多數據項信息要先經過獲取圖號,然后再通過函數關系進行獲取。目前,想要高效的完成元數據的測繪,首先需要應用相應的程序提取基礎數據信息,然后對其進行加工處理,降低人工填寫的工作量,提高數據提取和處理的正確率[1]。
在制作元數據的時候,不同的測區有著不同的要求,主要是因為不同測區的元數據其包含數據的種類和個數是不同的。傳統的元數據制作模式,就是應用相應的程序作為輔助,對元數據模板進行加載的模式,這種模式的應用雖然有效解決了數據項不同所帶來的差異問題,但是自動化程度較低,需要以人工填寫單幅信息為主;其次,完成元數據的制作后,后期如果遇到需要修改和調整的問題,需要人工逐個進行,制作速度得不到保證。有些研究者提出將計算機引入進來,應用模板加載數據庫對元數據進行建庫管理,這樣一來,不僅可以實現元數據的批量制作,還可以快速的修改元數據中的數據項,但是應用計算機需要人工對列表文件的圖號進行編輯,數據庫導出后,對其進行修改難度較大。
元數據中的數據類型主要有以下幾種格式:文本格式、Excel格式、mdb數據庫格式及xml格式,根據填寫內容的不同而不同,元數據又分為以下幾種類型:①固定項。所有的元數據信息包含固定數據項,也就是所有測區所擁有的固定不變的數據信息,常見的有產品制作單位、數據出版時間等,針對這部分內容,可以應用元數據模板進行編輯和填寫。②函數關系項。不同測區,這部分數據信息是不相同的,但是可以根據數據所具有的特定信息進行確定。例如圖幅元數據,根據圖號信息可以確定圖廓四角坐標的數值,或者根據圖幅經緯度信息可以確定圖幅分帶信息等。③可變項。可變相數據信息沒有規律可查,不同附圖,可變相之間也沒有任何聯系,可變相主要包含兩種信息:圖幅中誤差、圖幅地形類別。所以這部分信息需要通過人工填寫的方式進行錄入,根據所填寫的信息建立索引文本文件,確定其在程序中的位置,然后應用智能軟件進行批量導入,進一步實現自動填寫的功能[2]。
元數據快速制作其實就是利用計算機編程技術進行數據值的批量填寫。為了實現人工智能化的填寫模式,在制作前期需要根據固定項的實際情況制作模板,解決固定項填寫問題,在后期再增加設置相應的可以批量修改和替換的程序,確保可以滿足元數據批量修改的實際需求。在制作基礎測繪標準圖幅元數據的過程中,首先需要利用相應的程序對每幅圖的圖號信息進行讀取,確定數據項,比如經緯度等信息。在制作衛星整景元數據的過程中,程序首先會完成數據信息的讀入,然后正確的提取衛星傳感器的類型,自動填寫整景元數據獲取時間等信息。可變項的元數據信息具有較強的不確定性,常見的比如圖幅中誤差信息等,在制作的過程中可以根據圖號內容將信息提取到一個文本文件中,然后再通過加載替換完成批量填寫。在填寫數據量的時候,可以應用計算機編程技術自動完成數據量的計算,然后根據設計要求,將其轉換為特定的數據單位。對于標準分幅的圖幅來說,在制作的時候,可以根據圖號信息對周圍圖幅的圖號進行計算。制作元數據的過程中,將需要完成填寫的圖幅數據放在一個操作目錄下,然后應用相應的程序對圖幅的存在方式進行判斷,如果存在圖幅數據,填寫已接;反之填寫自由圖邊[3]。
系統的主要設計功能有:①文件操作部分。將目錄文件名讀取出來,存入Excel表當做一個測區的圖號表。讀取最終成果的Shape文件目錄中的文件名、圖層名,選擇相應的Excel及Access文件。通過目錄索引完成批量處理,應用Directorylnfo控件讀取文件及目錄屬性。②計算部分。該部分內容主要包含對四角坐標的計算、圖幅結合表圖號的計算以及圖幅經緯度的計算等。應用1:1萬地圖分幅編號方法計算圖號,然后按照經緯度差分幅進行排列,確定圖號排列方式,確定圖幅之間的位置關系,完成圖幅名的索引。根據1:1萬地圖分幅編號法則計算經緯度,然后計算四個角經緯度。應用高斯投影分帶計算法對坐標進行計算。③表格數據導入和輸出。就目前來看,數據整理最為高效的方式就是表格數據的導入,目前,大多數據作業都是應用Excel表格完成填寫的,操作起來十分便利,成為數據輸入作業人員的主要工具。Excel表格數據導入過程主要分為兩步:選定文件名,選擇表單名。自動判斷為數據項主要導入方式,在索引判斷下,數據庫字段名和列表相互對應,導入數據,這樣的導入過程不需要提前進行排序,可以瞬間完成數據的導入[4]。
(1)元數據快速制操作流程如圖1所示。

圖1 元數據制作流程
(2)數據準備。圖幅制作完成后,將數據文件整理到一個目標文件中,應用相應的程序,在目錄下建立以圖幅號為名稱的子文件名,然后將相應的文件放置到子文件夾中,數據整理工作完成。
(3)模板拷入。通過相應的程序批量完成固定項的元數據模板的填寫后,將其拷貝到子目錄下,然后對子目錄進行命名,再根據子目錄的名稱批量創建元數據文件。
(4)程序自動處理。指定操作目錄,程序會針對每個圖幅的子目錄完成相應的操作,并且將每一個子目錄下的圖號信息提取出來,根據函數關系完成元數據信息的填寫,然后對所填寫的數據進行計算,程序會自動對圖幅接邊情況進行填寫,極大程度的降低了工作人員數據填寫的工作量。
(5)固定項導入及批量修改。Excel格式的元數據,通過提前設置的替換項,將圖號作為索引,完成批量替換操作和批量修改工作。為了更好的保護元數據,不替換程序默認數據項,完成需要填寫的信息設置工作后,程序會執行相應的替換類操作。
(6)試驗結果。目前,出現了可以批量填寫和修改數據的程序,經過測區驗證,發現數據的填寫和修改效果可以達到元數據批量化操作的基本要求,有效解決了同測繪數據編輯難的問題。截止目前,該程序已經被廣泛的應用到元數據的制作和修改工作中,測繪單位可以根據自身需求,開發生產項目,確保可以更加靈活的為測繪生產進行服務[5]。
軟件系統在初步完成和現在應用的版本有很大的差異,和剛剛完成開發的時候相比,目前的軟件系統的功能有所完善,細節處理得到了明顯的改善,具體來說,主要涉及到以下內容的改善和優化:①Access數據庫表和Excel表名的索引方式有所改變,由原來的固定表索引變為當前的列表索引,實踐證明,列表索引方式更加靈活,可以有效節省索引時間。②數據字段的導入方式也有所改變,由原來的固定位置導入變為當前的自動匹配導入。在以前,程序會根據字段的固定順序將數據從Excel表導入到Access表中。在實際應用中,發現操作起來十分復雜,比如需要針對不同的表格設置不同的數據格式,不同字段,數據修改的方式也有所不同,基于此,經過改進和優化,出現了不分順序,不分表格,只需要根據相同的字段,就可以完成數據導入的方式。結果證明,這種數據導入模式可以適應更多的工作需求。③將數據從Excel表向Access表導入的過程中,修改方式也從單一的修改方式轉變為插入混合方式。在實際使用中,因為數據的增加或缺失,會給操作人員帶來困擾,在軟件中增加設置判斷步驟,對數據的增加或者缺失進行判斷,可以解決操作人員的困惑問題,應用起來省時省力[5-8]。
在制作元數據測試成果的過程中,需要應用到較多的資料,本文根據實際生產經驗,對元數據的數據結構進行了深入的分析和總結,以此為基礎提出了批量制作的思路,旨在實現數據填寫的智能化。該程序精簡了傳統元數據填寫流程,可以實現數據信息的共享,極大程度的提高了生產效率,為元數據的制作提供了全新的思路。