周丙鋒 李松旺 田金炎 張麗偉
1(首都師范大學資源環境與旅游學院 北京 100048) 2(首都師范大學北京文化帶研究院 北京 100048)
大運河由三部分構成:京杭、隋唐與浙東大運河,是世界上時空跨度最大的人工運河[1]。 2006年和2012年,京杭大運河和隋唐、浙東大運河分別被列為全國重點文物保護單位。2014年大運河項目成功入選世界文化遺產名錄。 2017年國家領導人對大運河文化帶建設作重要批示。2019年中央印發了《大運河文化保護傳承利用規劃綱要》,明確提出了大運河“互聯網+”建設的意義、要求和可應用的技術和建設方向。
針對不同的應用目的,國內外涌現出分門別類的歷史地理信息系統平臺(HGIS)[2-8]。通過國內外文獻調研發現,國內與大運河有關的歷史地理信息系統平臺已有專家進行了研究和建設[9-10],由于受當時各種條件和技術的制約限制,這些公開的系統大都不是或不完全是基于云計算、“互聯網+”、大數據和人工智能等高新科技,平臺在開放性程度、數據共享廣度、提供服務深度和用戶使用友好舒適度等方面存在一定局限性[11]。
眾多專家學者對大運河歷史文化、河道水系、生態環境、旅游和城鄉區劃等各類資源進行了深度整理和深透挖掘,但國內缺乏比較完善統一的宣傳、推廣和共享平臺,能夠對大運河各類資源和研究成果系統進行全面的、直觀的、全方位的展示和集成,并利用此平臺做進一步研究。
大運河歷史地理信息大數據與服務平臺(以下簡稱“GCHGIS”)建設目的,根據現有的大運河有關的資源和研究內容,以春秋時代吳王夫差開鑿“邗溝”迄今的中國歷史為時間縱軸,構建一套集大運河基礎數據庫、平臺服務和功能服務綜合系統,其中基礎數據庫內容包括大運河文化遺產、河道水系、生態環境、文化和旅游、城鄉區域等要素的數據集,為大運河流域綜合性研究提供基礎數據、平臺和功能等服務。
GCHGIS是以信息、計算機、通信和網絡等技術為基礎,并與現代測繪、GIS、RS、GPS等技術緊密結合,主要功能是實現大運河沿線多源異構歷史地理資源數據采集、存儲、管理、應用、挖掘分析和共享等,目的是為科普、教學、科研、學術交流和政府決策提供支持服務,目前GCHGIS框架構建完成,已經上線試用[12]。本文主要介紹GCHGIS的建設理念、架構設計、實現途徑、主要特色及價值意義。
作為大運河歷史地理信息大數據和服務平臺,除了具有通用大數據平臺和地理信息平臺的特點外,還具有自己獨有的特點。由于大運河地理信息大數據和服務平臺所涉及的空間和時間跨度大,數據采集整理、數據管理與挖掘相對復雜;同時,它服務教學科研對象也非常廣泛,包括文學、教育、歷史、地理、考古、經濟及軍事等各個教學科研領域的學者。作為多學科交叉的平臺,為了更好地服務于各個領域的教學科研者的需求,平臺設計思路和原則必須遵循多元開放共享、實時高效、方便快捷、簡單易用[13-15]。
多元開放共享方面,包括數據、平臺、功能等三個層次的開放共享。數據開放共享方面,在平臺架構下,整合各類歷史資料,如文本、圖片、多媒體、遙感影像、地圖,以及各類研究成果或產品,如大運河沿線夜光遙感數據、大運河文化帶建設成效評價結果等。用戶通過授權和審核,可以獲取或發布相關數據。平臺開放共享方面,用戶以平臺整合的數據為基礎,融合疊加自己的資料數據,利用平臺構建自己的專題,并可以通過平臺公開研究發現與分享研究成果。功能開放共享方面,平臺一些功能,如空間分析模型和數據服務功能,以REST服務方式對外提供服務,以便其他系統對接調用,實現平臺功能開放共享。
實時高效方面,由于GCHGIS部署在云環境下,計算力、存儲空間和基礎網絡等物理資源,以及安全運營保障機制都是由云服務商提供。海量數據的檢索查詢、統計分析和空間分析都能夠保證運算速度、返回運算結果的實效性。
方便快捷、簡單易用方面,系統的設計考慮到用戶的計算機、網絡和軟件方面的限制,系統功能的界面友好,使用方便快捷,操作簡單易用。如盡量多使用鼠標點擊選擇,減少直接鍵盤輸入;平臺門戶和數據中心集成度較高,可以實現一站式數據資源的檢索瀏覽、發布審核、申請授權、收藏下載。基于元數據對數據進行統一組織,不同類型數據支持多種操作,且支持多種數據格式,切換方便。
GCHGIS的架構設計和開發技術應用直接影響到平臺性能和用戶友好體驗。GCHGIS數據來源廣泛,數據形式多樣;全方位開放,數據產生迅速。以上兩點決定了GCHGIS整合的數據體量大,又要保證良好的用戶體驗。所以在建設過程中,充分參考相關系統,并應用了當前最先進的技術,相比目前業內其他相關公開的平臺或系統,有以下三個方面的優勢。
首先,架構先進。GCHGIS運用云服務、大數據和人工智能等當前較先進的技術構建。實現大規模時空數據的存儲、發布、共享、可視化、檢索查詢和統計分析,以及依據數據模型實現多元的空間數據挖掘、知識發現。如利用大運河沿線的夜光遙感數據和行政區劃,分析大運河文化帶的核心區城市發展的空間格局。根據用戶瀏覽數據和使用功能的偏好,應用智能發現和推薦功能,把用戶喜歡的、感興趣的數據資料和功能篩選出來,自動推送呈現給相應的用戶群體,達到千人千面的效果。
其次,兼容性好。瀏覽器兼容方面,平臺前端開發采用Bootstrap開源框架和HTML5標準,兼容不同類型和不同版本的主流瀏覽器,如兼容移動端和PC端瀏覽器。集成第三方服務方面,通過第三方提供的API,方便集成第三方提供的數據和功能服務,如天地圖的數據和功能服務、 CHGIS系統的地名數據服務、中華文明之時空基礎架構中國歷史地圖數據服務等。提供服務方面,為方便其他系統對接調用,平臺以標準的REST服務方式對外提供服務。
最后,數據豐富海量。GCHGIS的多元共享的設計理念決定了數據規模。數據來源包括如下幾個方面:整合的基礎數據以及集成第三方數據服務、用戶產生的專題數據。基礎數據包括多比例尺基礎地理矢量數據(行政區劃、水系、交通等)、衛星和無人機遙感影像數據。如自春秋戰國至今多朝代的大運河水系河道矢量數據,自先秦至清代21個朝代的307幅疆域圖,大運河核心監控區(沿線兩公里緩沖區)范圍內多年的高分遙感影像和SPOT遙感影像,分辨率分別為0.8 m和3 m等。后續不斷建設和集成大運河文化帶核心區、拓展區和輻射區相關的地理數據,不斷整合各類已公開與之相關的信息和研究成果。
在總體設計架構方面,GCHGIS除了具有通用大數據平臺的特點(如高效、可伸縮、實時、可靠、靈活、開放、簡單、易維護)外,還具備時態GIS、WebGIS、云GIS和空間數據挖掘功能。GCHGIS部署在公共云平臺上,在標準規范技術體系和安全與綜合管理體系的支撐下,系統分為五個層次,由下至上依次為基礎設施層、多源數據層、共享服務層、業務應用層、用戶層,如圖1所示。

圖1 平臺總體設計架構
基礎設施層。本層主要涉及物理資源,包括計算力、存儲空間、網絡設施。GCHGIS部署在云環境下,這些物理資源和安全運營保障機制都是由云服務商提供。
數據層。本層在數據標準化的規范下建立關系型數據庫,實現對多源異構數據的集成、存儲和統一管理。主要涉及到三大類數據庫,即基礎地理信息數據庫、資源目錄和元數據庫、研究專題數據庫。基礎地理信息數據庫既包括含行政區劃邊界、河流、道路、地理編碼、歷史地名等矢量地圖,也包括地形地貌、夜光、旅游資源等影像柵格數據,為大運河保護傳承利用提供基礎地理空間數據支撐,可支撐空間定位、地名檢索、影像發布等服務。資源數據庫,包括生態自然資源、遺產文化資源、漕運水利資源等,為大運河的核心數據庫,是大運河保護傳承利用的基礎。專題數據庫包含文化遺產、河道水系、生態環境、文化旅游、城鄉區域、建設成效評價等,也是大運河研究成果數據庫,是大運河向互聯網+大運河拓展的基礎。
服務層,主要是為應用層提供服務和中間件支持。以Web(IIS)服務為主,以API for JavaScript方式集成調用ArcGIS Server/Dojo空間數據及處理服務,以REST API集成調用天地圖基礎地圖數據服務,通過(WMS、REST等)服務接口,將發布或第三方的數據服務集成到系統上來,保持原有的數據及服務系統不變;其中ArcGIS Server/Dojo空間數據及處理服務,主要是支持應用層空間數據的處理和操作,包括空間數據的訪問管理和檢索查詢、元數據的維護、專題的應用挖掘、建設成效的評估評價模型等。
應用層。本層涉及大運河研究和系統管理應用兩個大方面。研究應用包括數據共享和門戶、時空運河、空間數據挖掘、智能推薦和統計分析應用等,主要是為了滿足大運河研究需求。系統應用管理包括數據字典信息管理、用戶管理、日志管理等,主要為了增加平臺的靈活性和安全穩定性。
表現層,用戶主要依靠瀏覽器、移動終端進行系統的訪問,全面參與大運河的各項專題研究,各司其職、聯動互動。
整體系統需要在完備的安全體系以及體制、機制、標準規范等保障下,才能穩定、高效運行。
在主要功能構成方面,GCHGIS包括六大功能模塊,即數據共享和門戶、時空運河、空間數據挖掘、智能推薦和統計分析、數據采集與管理、運維管理等功能模塊。
(1) 數據共享和門戶子模塊:基于HTML5、JavaSrcipt和WebGIS技術集成了大運河河道本體、各專題研究成果、沿線文物信息即保護規劃信息、保護傳承利用的進展情況、相關文件和新聞報道等,是終端用戶(包括公共大眾和相關研學者)了解和研究大運河的一個直接的便利窗口,為大運河研究、宣傳和推廣提供了一個便捷的平臺。
(2) 時空運河模塊:以時空框架為基礎,運用Bootstrap前端技術框架,通過統一坐標系、統一的定位、統一地理編碼,實現了大運河沿線各類數據的融合和集成,包括時態基礎地理、影像、高程和專題(七大研究專題)數據等,并實現了這些數據的導航、定位、疊加、瀏覽、綜合查詢和統計分析功能。實現了地圖基本的GIS功能,包括地圖的放大、縮小、平移、距離面積測量、圖層控制等。實現了大運河歷史變遷的動態演化,通過時間軸的自動或手動播放,可以動態呈現出大運河自春秋戰國至今的運河河道的歷史變遷,以及附加至大運河上的文化和生態環境的形態的演化,如河流和湖泊水體面積變化、水利工程的利用、沿線城市的空間格局變異等。實現了大運河基礎要素和專題要素的綜合展示、檢索查詢、對比分析和應用研究。
(3) 空間數據挖掘模塊:以大運河基礎歷史地理和專題數據為基礎,利用C#編程語言并結合Python,通過空間數據挖掘算法或模型,如統計法、聚類方法、關聯規則發掘方法、機器學習方法、決策樹方法、空間特征和趨勢探測、圖像分析和模式識別等,提供新的大運河研究的方法和手段,驗證大運河的史料,得到新的研究觀點等。并把這些研究成果通過Web的方式提供給終端用戶,為了解和研究大運河提供幫助。
(4) 智能推薦和統計分析模塊:基于數據資料內容的推薦系統算法,根據終端用戶感興趣的數據,以及數據資料之間的關聯性,實現智能推薦和相應的統計分析。由于本平臺的大運河相關數據量大,數據類型豐富多樣,智能推薦是必要的。
(5) 數據采集和管理模塊:用于數據的采集與維護管理,大運河文化遺產空間和屬性數據,通過現代測繪、地理信息系統、遙感應用、衛星導航定位等技術的綜合應用,在本子系統的支持下不斷地更新完善。本子系統所提供的主要功能包括大運河流域遙感數據的更新,基于野外數據采集功能(App模式)的數據更新、批量數據更新、地圖數據編輯等。
(6) 運維管理模塊:主要是實現平臺通用的數據運維管理操作功能,包括數據字典管理、用戶管理、數據和功能操作權限的管理、平臺環境配置的管理、日志管理等。
多源數據采集功能。大運河時空跨度大,其保護傳承利用的相關工作涉及運河本體及其遺址區域的社會、經濟、文化、自然生態環境等多個領域,數據源豐富,數據量極大。平臺整合了部分大運河文化遺產的空間和屬性數據,但還需要不斷地更新和完善。除了基礎遙感數據和新涌現的研究成果需要更新外,野外采集數據也不需要更新。前者由于數據量大更新頻度相對較低,平臺采用PC端數據采集模式,后者考慮野外采集方便,采用移動App的數據采集模式。數據采集的同時直接入庫,通過審核直接發布至數據共享和門戶系統。
數據的共享發布功能。該功能實現共享發布大運河本體信息、前人相關的研究成果、基于平臺基礎數據而形成的各類科研成果數據。為保障數據的一致性,突破參照系和配準等技術障礙,這些成果數據將以基礎地圖數據和基礎歷史地圖數據為參考系自動配準。另外,發布后的科研成果將自動納入到平臺的基礎數據庫中,為感興趣的學者進一步的研究提供數據支撐[16]。
歷史地名查詢和歷史疆域數據服務功能。時間維度上,大運河有2 500多年的歷史,歷史跨度長;空間維度上,大運河全長近3 200公里,地域跨度廣。大運河沿線部分地名和歷史疆域變更頻繁,一地多名或多地重名現象經常出現。因此歷史地名查詢功能是本平臺的不可或缺的組成部分。本平臺主要是利用第三方提供的接口,實現了歷史地名查詢和歷史疆域數據服務。歷史地名查詢,調用哈佛CHGIS地名數據服務。歷史行政區劃數據,調用臺灣中央研究院中國歷史地圖數據服務。
多元化的空間分析功能。GCHGIS集成存儲了與大運河相關的大部分遙感柵格和地理矢量的空間數據,GIS應用于大運河文化的保護傳承利用,會拓展新的研究內容,帶來新的研究理念和思維方式。基本的空間分析功能是各種復雜分析的基礎,平臺提供了GIS的基本空間分析功能,如圖層疊加、緩沖區、空間統計、網絡、動態插值和趨勢面等分析功能。這些空間分析功能的操作智能化和程式化,經過簡單培訓即可使用,能夠使純人文知識背景的學者跨越技術屏障。
方便快捷的制圖功能。專題圖件是研究成果最生動直觀的表達方式。專題圖的設計制作和輸出是平臺的重要功能,主要實現平臺所融合的數據按專題分類,以電子地圖形式進行直觀展示。用戶利用豐富的地理要素和圖庫符號,可以直接進行點、線、面的繪制,以及任意添加數據制作自己所需要的專題圖,操作簡單方便。另外用戶可以利用平臺內集成的各類數據和內置空間分析方法,對得到成果進行編輯、制作、輸出。
地理空間參考自動配準和轉換功能。GCHGIS空間分析、數據采集和數據疊加功能都需要在統一的地理參考下進行。平臺所有空間數據采用了WGS84地理坐標系,所以后續進入平臺數據的地理坐標系必須是WGS84。平臺提供了地圖在線地理坐標系的配置和轉換功能,將圖庫中的地圖或用戶自己的地圖提交到平臺,可以進行在線配準轉換,為空間數據的展示、信息的提取利用、空間分析等提供了便利條件。
地圖的卷簾和對比功能。GCHGIS具有地圖的疊加卷簾和平鋪窗口對比功能,可以選擇任意兩類的矢量或柵格底圖進行卷簾疊加查看。三窗口對比可以選擇任意三個不同時期的大運河河道、水體面積或大運河流域的城市擴張范圍等在同一界面上比對,這對于它們歷史演化的展示一目了然,適合用于歷史地圖的對照與比較研究。
GCHGIS對于大運河文化帶建設、學術研究和教學實踐等領域進行廣泛的應用。
(1) GCHGIS建設對于推動大運河文化遺產信息資源數據整合、共享、開發利用具有重要的價值。 首先在GCHGIS的整體架構下,能夠逐步實現大運河本體和文化遺產基礎數據生產、整合和數據建設。它將目前大運河各種類型的歷史地理數據進行預處理和存儲,包括地圖資料、圖像影像資料、音視頻資料、文獻資料全部集成到平臺中,利用平臺提供的功能和接口,隨時快捷調用。普通公眾、科研人員和機構人員可以方便獲取自己所需要的各種數據資源,大大提高了數據資料的使用效率,是大運河研究不可或缺的資源寶庫。
(2) GCHGIS建設為大運河的綜合研究提供了新手段、新方法、新視角和新機會。以平臺的豐富數據資料為基礎,學者可以利用平臺提供的功能制作、修正或重繪過去由于技術屏障無法繪制的專題圖。學者可以把時空坐標與地理地圖相結合,為他們提供重新校驗大運河史料的有效方法。學者可以運用平臺內置的空間數據挖掘算法模型發現新的研究觀點,可以運用地圖空間疊加分析功能發現過去史料所不易觀察到的空間關系,甚至可以進一步提取出史料中的量化數據進行空間統計分析。該平臺打破學科之間壁壘,為學者提供大運河研究的學科交叉機會和有效的研究工具。
(3) GCHGIS建設為用戶提供科普知識,提供教學實踐基地和交流對話的機會。GCHGIS是一個多元開放、資源共建、成果共享的工作系統,是以時空數據和相關服務體系為基礎。師生可以利用平臺便捷的查詢檢索和友好的展示功能,宏觀地、系統地了解大運河本體以及相關文化遺產,在師生實地考察前,對大運河有個全貌的了解,甚至不需要實地考察就有深入的認知。用戶可以通過多種方式融入自己的個性化數據,根據自己需要構建自己的研究專題,并通過審核后發布共享自己的研究成果,科普公眾用戶,或促進學者們之間的互動。
GCHGIS是功能、數據、算法、模型、服務的有機耦合體,實現了一幅圖聯通古今,一幅圖貫通南北,是深入貫徹落實習近平總書記關于大運河文化帶建設的重要講話和批示精神《大運河文化保護傳承利用規劃綱要》的一項舉措。GCHGIS建設能夠實現大運河遺產保護和文化展示的系統性和全方位,幫助拓展大運河沿線遺產活態傳承載體和傳播渠道,協助深入挖掘大運河承載的文化價值和精神內涵,協助有關部門對岸線生態資源進行整體規劃,能夠實現統一宣傳和推廣平臺。為大運河國家公園建設科學定測,催生大運河新型智庫,服務國家決策與綜合施策,最終目的是傳承、保護、利用流動文化,堅定文化自信。