劉飛飛
摘 要:當前,我國科技迎來了突飛猛進的發展,取得了一系列重大突破,大數據作為代表性技術之一,成為很多行業創新的重要驅動力量,這也為我國國土資源方面的改革帶來重大機遇。傳統的國土規劃檔案資料管理手段較為單一,很容易出現數據收集、填寫錯誤等情況,信息共享、傳輸也十分不便。在可視化和數據挖掘下,通過應用自然語言處理光伏識別以及其他技術,能夠擺脫傳統工作模式中存在的弊端,為該工作的順利開展提供可靠保障。基于此,本文對國土規劃數字檔案資源的數據挖掘及可視化進行了分析。
關鍵詞:國土規劃;數字檔案;數據挖掘;可視化
大數據時代,信息體量爆炸式增長,加大了國土規劃數字檔案資源管理工作難度。近些年,在我國經濟發展進入全新階段的背景下,不動產業務數量和規模持續擴增,如果依然采用傳統工作模式,勢必難以滿足當前工作需要,檢索能力不足、數據處理效率低下等問題日益凸顯。為了使該工作更順利地開展,提升檔案資源利用率,充分發揮其價值,可將先進技術應用其中,創新原有工作模式,提升素質檔案資源服務質量,為使用者提供更優質的服務。因此,對國土規劃素質檔案資源的數據挖掘及可視化進行分析具有重要意義。
一、國土規劃數字檔案管理的形成
當前,科學技術得到廣泛應用,自從國土規劃檔案資料管理朝著信息化、現代化方向發展以來,為該工作的發展、創新提供了強有力的保障,也取得了十分理想的效果。
首先,計算機在我國檔案管理中的應用最早開始于21世紀初。利用計算機取代傳統的人工操作,大大提升了工作效率,這也是國土規劃數字檔案管理的基本雛形,為后來技術創新、檔案資源管理方式方法的優化奠定了堅實基礎。
其次,在2007年左右為高速發展階段。隨著我國礦產資源、土木工程土地調查等各行業的迅猛發展,加快了紙質檔案向數字化檔案的發展進程,同時也加大了國土管理部門的工作量。信息體量的爆炸式增長,讓傳統管理辦法的缺陷越來越明顯,如果依然沿用人工管理模式,必然無法滿足工作要求。為此,相關部門充分發揮信息技術的應用優勢,打造了互聯網管控平臺,在數字檔案館、國土規劃數字檔案數據庫等系統的應用下,數據傳輸更加高效便捷,可顯著提升管理水平。不僅如此,當前國家和政府部門對國土資源管理、國土資源規劃也越來越重視,加大了資金、人才等各方面的資源投入,為該工作的順利開展創造了良好條件。
二、國土規劃數字檔案資源的數據挖掘與可視化發展可行性
1.基于技術角度
在信息體量越來越大的今天,利用先進技術推動其朝著現代化、信息化的方向發展是必然趨勢,數據挖掘和可視化技術,將會成為其發展的重要驅動力量。比如,目前應用較為普遍的語義技術,就是數據挖掘可視化技術類型的一種,能夠讓數據變得更加多樣化、層次更為豐富。可在萬維網、互聯網的海量信息中,根據用戶需求來進行深入挖掘。信息可視化能夠挖掘數據背后蘊含的信息,并對其進行分類和分析,各種類型數據都得到妥善處理,包括非數值型、非空間的等,而且,可以將其轉變為交互式的視覺形式,為使用者提供較大便利。隨著我國科學技術的進一步發展,無論是信息可視化技術、數據挖掘還是語義技術,其理論體系正趨于完善,各項技術也在實踐中得到印證和創新,在計算機科學、金融、商業等領域都取得了一定成效。
2.基于資源角度
國土規劃數字檔案資源體量大、種類多,從另一方面說明了我國各類資源十分豐富,如果依然沿用傳統的資源管理方式,根本無法保障工作效率,還容易出現統計失誤、難以及時查詢等多方面問題。在新的時代背景下,國土規劃對地理信息獲取效率、準確性也提出了更高要求,因此,應該聘請專業技術人員,有針對性地對系統和技術進行研發,根據檔案資料管理要求,不斷拓寬檔案管理儲存空間以及數據的廣度和深度。國土規劃數字檔案是以圖片、文字、照片、視頻、音頻等為載體的歷史記錄,可分為以下幾個大類,即:專業檔案、科技檔案、會計檔案、電子檔案、聲像檔案、實物檔案和文書檔案。在數據挖掘和可視化技術應用的過程中,在面對不同類型的檔案時,先進技術的優勢可得到充分發揮,解決了傳統檔案資料管理中存在的局限性。
3.基于思維角度
從以往國土規劃檔案資源管理工作開展的情況來看,很多檔案人員都只將資料進行整理,難以為使用者提供服務,檔案利用率不高,無法發揮檔案資料的真正作用。在大數據時代背景下,國土規劃檔案資源體系要隨著時代發展而不進行調整,要本著“用戶至上,體驗為王”的原則,化被動為主動,在傳統行為上以雙向互動來代替單向交流,打造信息化數據傳輸平臺,加強各部門之間的數據共享。“互聯網+”將會成為未來國土規劃檔案資源管理的必然發展趨勢,有關人員的思維模式、服務理念等都要隨之發生改變,主動適應經濟發展新常態的相關要求,以用戶為核心來升級服務體系,為國土規劃檔案資源管理工作的順利開展奠定堅實基礎。
三、國土規劃數字檔案資源數據挖掘與可視化的挑戰
1.缺失語義數據,信息讀取難度大
就目前情況來看,絕大部分國土規劃數字檔案的格式都是以JPEG圖像為基礎轉換成的PDF文件,信息的真實性和完整性得不到保障,檢索起來難度比較大。想要更快速、更準確地查找信息,需要利用到光符識別技術對電子文檔、數字文件進行特殊處理,從而獲取文本信息。但實際情況是,文本結構信息丟失、識別率不高等問題比較普遍,加大了檔案語義加工和知識組織難度。當前我國的國土規劃數字檔案系統是基于元數據進行文獻搜索和加工的,但是深度不夠,并未注重文獻知識單元之間存在的聯系,信息讀取難度比較大。
2.領域本體復雜,人工構建困難
語義標注、概念、實例定理、語義梳理等都是不可忽視的重點內容。目前,我國不動產登記業務規模不斷擴大,國土規劃數字檔案的覆蓋范圍也越來越廣,房屋征收、土地管理、測繪管理等都是其主要內容。由于國土規劃領域的本體較為復雜,在收集信息或構建本體時,會造成大量資源和資金的消耗。
四、國土規劃數字檔案資源數據挖掘與可視化實現路徑
1.思路與技術路線
技術人員應重點關注基礎工作,例如,深入挖掘國土規劃中的原始數據信息,做好關聯工作,充分發揮空間可視化、信息可視化技術,保證檢索結果的公開化。相關人員要準確把握當前國土規劃數字檔案管理現存的問題以及原因,按照其特點進行問題分類,建立起基于主題分類的典型問題用地案例的形式化描述模型。深入進行數據研究與分析,確保性質不同、來源不同的數據信息能夠在空間參照系上實現統一,利用數字化的方式來描述用地案例,為信息使用者提供高質量服務,加強信息共享和傳輸交流。在系統運行的過程中,有可能出現自動偵測技術使用不當的問題,要分析該問題出現的原因,加強人員培訓,讓檔案資料管理人員、技術人員掌握系統的正確操作方法,并對自動偵測的異常進行合理判斷與修正。在信息技術、大數據技術的應用下,能夠自動識別國土規劃數字檔案中存在的各方面問題,精準判斷問題類和特征,可對其進行正確分類,便于檔案管理人員及時解決,為后續各項工作的順利開展奠定堅實基礎。
從國土規劃數據挖掘來看,目前常用的本體檢索、本體構建、語義組織等多種方式。國土規劃的數據挖掘技術是以上述方式為基礎的,可通過系統中語義抽取模塊等方式來完善國土規劃數字檔案管理的相關資源,提升其應用價值。此外,還應深入挖掘信息資源中有價值的數據,利用可視化基礎,充分體現國土規劃素質的知識化體系,確保能夠通過檢索平臺進行搜索,為使用者提供完善服務,提升檔案資源獲取效率和速度。
2.平臺架構
在設計國土規劃數字檔案資源管理平臺過程中,要明確平臺結構,以及各模塊的主要功能,確保結構層次的科學性與合理性。首先是數據服務層。要收集國土規劃中各方面的數據信息,比如國土空間數據、檔案數據、工作流流轉數據等。檔案數據指的是日常工作中形成的資料信息,可細分為文書類檔案、國土規劃專業類檔案;工作流數據涵蓋了流程定義、流程實例等數據信息;空間數據比較好理解,主要是各類項目的地理數據、工程項目規劃數據、國土空間利用信息等。其次是數據接口層。數據接口層主要起到承上啟下的作用,在數據服務層收集到各方面信息之后,由數據接口層來查找、挖掘和主題詞有關的信息,從而形成完善的信息搜索體系,為下一程序的順利運行奠定堅實基礎。再次是系統服務層,這也是平臺中最關鍵的模塊,是應用服務的集成,包括了知識化管理、檔案數據挖掘這兩個主要系統,功能十分多樣,通過關鍵詞搜索即可得到相應的數據信息,可對圖像、文本等各類信息進行深入挖掘和補充,并通過可視化技術將知識地圖展現出來,在設計過程中要尤為重視。國土規劃檔案數據挖掘系統和知識化管理系統并非獨立的兩個模塊,而是相輔相成的,只有兩者共同作業,才可構建成完整的可視化系統。在該系統中,應用了多方面先進技術,例如,文檔知識數組織,以及將自然語言轉化為規范化語義的自動化映射,能夠直觀展現出國土規劃數字檔案管理的具體流程,讓數據可視化方式更加多樣。最后就是可視化功能層。可以將可視化功能層理解為展示層,前三道程序運行完畢之后,即可將最終得到的檔案文檔、檔案術語等進行可視化展示,為使用者帶來全新的體驗。
3.國土規劃數字檔案資源數據挖掘與可視化功能
(1)檔案文件管理。目前,大部分國土規劃數字檔案資源數據都是PDF格式,部分系統無法識別PDF格式中的相關內容。作為初步的數據處理方式,待其工作完成之后,可為后續文本資源的深入挖掘創造良好條件。檔案文件管理十分重要,具有檔案資料查詢、修改與調整、信息上傳、共享傳輸等多種功能。使用者可參考查詢粒度,在搜索欄直接輸入關鍵詞和相關信息,系統即可自動顯示出包含關鍵詞的所有檔案資料。除了關鍵詞之外,還可輸入國土規劃檔案編號、通過OCR技術處理之后的文本等信息,從而得到檔案的文檔編號、內容、所屬行業、應用范圍、檔案ID等各方面信息。點擊進入之后,即可得到所有和檔案相關的信息,比如關聯地址、發布時間、實施時間、所屬行業、文檔中文名、其他描述等。
(2)國土規劃檔案術語管理。術語管理的主要內容為對術語進行修改、查找、增加和刪除,為使用者提供和術語有關的上下位關系的可視化圖形。例如以“土地初始登記”術語為例,且可視化展示如圖1所示:
(3)國土規劃檔案流程關聯。在了解并掌握了業務流程管理之間的邏輯關系和內在聯系的基礎上,可優化管理流程,建立相應的流程規則庫,能夠以更快的速度發現流程管理中存在的問題,便于第一時間進行處理,最大化發揮可視化的作用與價值,可隨時查找某個節點下的國土規劃檔案資料,并通過相應的技術完成資料傳輸。
(4)國土規劃檔案管理工作本身就具有很強的復雜性、專業性特點,尤其是在先進技術的應用下,對從業人員專業素質提出了更高要求。技術人員和檔案工作者要在崗位中不斷提升個人能力,強化綜合素質,了解數據挖掘和可視化技術的相關原理和理論知識,并將其應用于實踐中。有關部門要定期開展教育培訓,引進先進工作理念和技術方法,保證信息系統功能多樣化的同時,讓從業人員能夠熟練應用,為國土規劃檔案管理的順利開展提供人才保障。
五、結語
總而言之,國土規劃檔案極具現實價值,和城市規劃、土地開發、國土空間利用以及很多行業發展都有著密切聯系。在新時代背景下,如何深度開發國土規劃檔案資源,提升資源利用率,充分發揮數字檔案的價值和作用,是需要思考和關注的重點內容。當前,網絡環境日益開放,數據挖掘和可視化技術的應用,將會成為國土規劃數字檔案資源管理創新與改革的主要方向。尤其是在數據體量日益增加、類型越來越多樣化的情況下,應牢牢把握先進技術的應用優勢。有關部門應加大資金、人才投入力度,重點關注技術和平臺開發,打造出具有生態化系統的開放性檔案管理模式,保證信息化管理系統功能的多樣化,推動我國國土規劃數字檔案管理工作的順利開展。
參考文獻:
[1]莊淑娜,吳亞玲.國土規劃數字檔案資源的數據挖掘與可視化[J].華東紙業,2021
[2]姚詠紅.基于CNKI的“數字檔案建設”可視化分析[J].黑龍江檔案,2021
[3]曲春梅,何紫璇.數字人文環境下檔案文化價值釋放特點與實現方式[J].北京檔案,2021
[4]陳海玉,向 前,萬小玥.數字人文視域下抗戰檔案資源的開發策略與路徑研究[J].山西檔案,2021
[5]魏 歌,吳志杰.數字人文視域下的數字檔案館建設:合理性詮釋與策略探討[J].北京檔案,2021
[6]曾 婷,楊 帆,王 恒.國土規劃數字檔案資源的數據挖掘與可視化[J].蘭臺世界,2019
[7]張 偉,曾 婷.基于用戶需求的國土規劃檔案信息服務與優化[J].蘭臺世界,2016
(作者單位:臨沂市自然資源和規劃局)