黃華坤



摘 要:以廣東省國土資源檔案云平臺建設為研究基礎,分析云計算技術典型三層級理論,提出省級國土資源檔案云平臺的構建思路。在三層級理論的指導下,詳細介紹基于虛擬化技術構建的基礎架構云、網絡化應用系統宿主環境的平臺云實現方法和網絡化業務應用的應用云的搭建方法,為我國省級國土資源檔案信息化建設提供全新的思路和方法。
關鍵詞:國土資源檔案;基礎構建云;平臺云;應用云
國土資源檔案是指國土資源主管單位及下屬單位在開展各項專業工作中直接形成的、具有保存價值的各種文字材料、圖紙、圖表、聲像等原始記錄。同時,國土資源檔案涵蓋了土地、地質、礦產、測繪等各類具有地理位置特征的空間數據檔案,數據形式呈現海量多源異構的特點。國土資源檔案承載著國家的土地、礦產等國家基礎資源信息,在社會發展中發揮著重要的基礎作用。目前,信息化建設已成為國土資源檔案建設的關鍵和核心,許多國土資源檔案部門的信息化建設年度預算已達到數百萬元至數千萬元。
以廣東省為例,省級國土資源檔案館和市縣級國土資源檔案保管部門,都是以單個檔案部門為單位進行信息化建設的。各單位都投入了大量的資金進行數字檔案館信息化建設,從機房設施(數據中心)建設、購置大量網絡設備和存儲設備、網絡安全等設備,到海量空間數據加工、數據資源整合、檔案網站建設、開發國土資源檔案信息管理系統等,雖然極大地推動了本部門的國土資源檔案信息化進程,提升了信息化水平,但同時也看到,由于每個地方經濟發展水平不同,檔案信息化建設水平參差不齊,存在著檔案信息資源整合困難、共享程度低,檔案信息知識管理與服務手段落后等一系列的問題。方昀、郭偉認為,在信息時代有大量的數據存儲需求并且要求能快速獲得,導致了數據中心的大量增加。[1]如何使海量國土資源數據得到更好的應用,如何破解以上這些問題,云計算技術給我們提供了嶄新的思路。
1 云計算典型層級介紹
經過近幾年的大力發展,云計算技術在各行業的應用已較為廣泛,云計算技術的概念也深入人心。簡而言之,所謂云計算,是指基于互聯網、通過虛擬化方式共享信息資源的新型計算模式,使計算、存儲、網絡、軟件等資源,按照用戶的動態需要,以服務的方式提供。SUN 公司在《云計算架構介紹白皮書》中也提到:云計算把虛擬化、按需部署、網上服務提供和開放源軟件融合在一起。[2]
近年來,云計算技術的迅速發展對檔案信息化進程產生了越來越重要的影響。運用云計算機技術,搭建省級和市級兩級檔案的溝通橋梁,加速現代檔案理念與新信息技術的融合,是本文研究的目的。
云計算可以按照用戶對資源和計算能力的需求動態部署虛擬資源,不受物理資源的限制。用戶基于云的計算和應用工作全部在虛擬化的資源上,不需要關心資源部署在哪些物理資源上,用戶可以方便地變更對計算資源的需求。云計算統一管理大量的物理資源,并將這些資源虛擬化,形成一個巨大的虛擬化資源池。云計算可以分為三種類型的云,亦即表述為基礎設施即服務(Infrastructure as a Service,“IaaS”)、平臺設施即服務(Platform as a Service,“PaaS”)和軟件即服務(Software as a Service,“SaaS”),構建一個完整的云平臺,如圖1:
第一層次(“IaaS”)搭建基礎設施云:對分布在大量計算機和存儲設備(包括本地或遠程設備)上的計算資源和存儲資源(包括內存、I/0設備、計算能力CPU、帶寬、存儲等)集中起來形成一個虛擬的資源池,采用虛擬化技術整合設備資源,構建基礎數據中心。
第二層次(“PaaS”)需要搭建一整套平臺運行環境,包括開發環境、應用程序運行環境、數據庫環境等,作為一個綜合環境平臺,以服務方式提供給用戶,由后者在該環境中開發和部署自己的應用程序,再通過互聯網提供服務。
第三層次(“SaaS”)就是通過網絡(Internet)提供應用軟件的服務模式。其特點是:供應商將應用軟件部署在自己的服務器上,通過Internet提供給用戶。用戶不用再購買或者重新開發應用軟件,而通過一些協議,可直接在網絡上使用這些應用軟件。目前網絡上多數是按租用的服務類型和時間付費使用軟件。
2 構建省級國土資源檔案云平臺
本文以廣東省國土資源檔案云平臺為例進行研究。關于檔案云平臺方面的研究,祝慶軒等認為,“云檔案館”作為一新生事物,可以作如下定義:以互聯網為平臺,運用云計算技術和理念,向用戶提供服務的虛擬檔案館。[3]廣東省國土資源檔案館保管省級國土資源檔案數據,對省內各地市的國土資源檔案業務進行指導,省級與市級的檔案保管職能屬于上級與下級的關系,以省館為中心,輻射各市。
網絡方面,廣東省國土資源政務網絡已開通,省館與市館的業務可以直接在政務網絡上進行;硬件資源方面,省館已建成網絡機房,有網絡設備和存儲設備若干臺,具有一定的規模;軟件資源方面,網絡安全軟件、服務器運行環境軟件、數據庫管理平臺、檔案管理平臺和各類應用系統都已具備;而市館則因各地經濟發展水平不一致,信息化水平差別較大,但總體來說都屬于較低水平,有些地方由于人才缺乏、經費緊張,根本就沒有信息化成果。在這些情況下,依托省館現有的信息化設備和各類資源,構建區域性的省級國土資源檔案云平臺(包括云存儲平臺),其他市館可以利用省級云平臺提供的各類資源,實現對本單位的檔案數據在云存儲平臺上管理,直接應用云平臺的應用系統而無需重新開發,達到快速提升檔案信息化水平的目的。
通過對云平臺基本原理的理解,省級國土資源檔案云平臺應屬于區域性的私有云,搭建該平臺,可以從“三朵云”的部署著手,即基礎架構云(Infrastructure Cloud)、平臺云(Platform Cloud)和應用云(Application Cloud)。
2.1 省級國土資源檔案基礎架構云。首先要摸清省館與市館(包括本地或遠程設備)機房設備的硬件資源(計算資源和存儲資源),了解各類設備上的資源信息(包括內存、I/0設備、計算能力CPU、帶寬、存儲等),采用硬件虛擬化技術,對列入云平臺的計算機或操作系統進行虛擬化,形成一個虛擬的資源池,構建硬件虛擬平臺。如圖2:
通過虛擬化技術構建的省級國土資源檔案基礎架構云是以虛擬機的形式,安裝在基于政務網絡的虛擬機上。根據百度百科的介紹,虛擬化技術可以同時運行多個操作系統,而且每一個操作系統中都有多個程序運行,每一個操作系統都運行在一個虛擬的CPU或者是虛擬主機上。[4]構建國土資源檔案基礎架構云,主要形成以下四種虛擬效果:
虛擬內存:將不相鄰的內存區,甚至硬盤空間虛擬成統一連續的內存地址。
存儲虛擬化:將實體存儲空間(如硬盤)分隔成不同的邏輯存儲空間。
網絡虛擬化:將不同網絡的硬件和軟件資源結合成一個虛擬的整體。
存儲器虛擬化:將網絡系統中的隨機存儲器聚合起來,形成統一的虛擬內存池。
這樣,省級國土資源檔案基礎架構云通過網絡就可以提供CPU、網絡和存儲等計算服務,市級館的用戶可以將操作系統和應用程序安裝在省級國土資源檔案基礎架構云上。同時還可以實現基于IP的VPN廣域網及通訊服務,所有虛擬客戶端的用戶都可以通過網絡接口來管理自己的虛擬資源。
2.2 省級國土資源檔案平臺云。平臺云也就是平臺即服務(PaaS)。從網絡化應用系統宿主環境的視角出發,平臺云是支撐網絡化應用/服務開發、部署、運行和管理的一系列中間件系統的合體平臺。省級國土資源檔案平臺云是在基礎架構云的基礎上進行搭建的,它提供了一個位于云架構上的硬件和軟件集合,從而為檔案管理的用戶提供檔案業務應用系統開發環境,以及相應的檔案管理系統建設所需的主機環境及檔案管理系統基礎架構。主要包括操作系統、平臺數據庫、檔案應用開發環境和檔案業務管理架構四種類型的平臺云集合,如圖3:
操作系統:共享的操作系統虛擬化允許多個不同應用在一份操作系統拷貝的控制下隔離運行。在省級國土資源檔案云平臺建立的根操作系統,或稱為宿主操作系統,通過劃分其特定部分,成為一個個隔離的操作執行環境,供程序運行。將操作系統資源訪問虛擬化,對省級館而言,它是運行于自己的獨立的操作系統實例中;對市級館而言,又可以提供上層應用的命名空間、資源進程需求等,使不同級別的用戶存在于一個操作系統內核和硬件資源中。
數據庫:在省級國土資源檔案云平臺上創建云數據庫平臺,使各級用戶可以快速使用和管理數據庫,無需再對服務器安裝數據庫軟件,在平臺云上,市級館的用戶只需要選擇自己想要的數據庫軟件,點擊安裝,就能把數據庫安裝到服務器中。
檔案應用開發環境:在省級國土資源檔案云平臺上,統一配置國土資源檔案開發與應用的環境,其他用戶只需在平臺上直接使用該環境,而無需自己構建開發環境。
檔案業務管理架構:對于國土資源檔案而言,省級和市級館的業務基本上是一致的,只需在平臺上定制開發好檔案業務管理流程,不同用戶就可以直接使用,無需再開發。
2.3 省級國土資源檔案應用云。在云計算的典型層級里面,應用云亦稱為軟件即服務(“SaaS”),也可稱作應用即服務(“AaaS”)。在這個層級里所進行的事情,就是將整個應用集合虛擬化并提供給最終用戶。省級國土資源檔案應用云要構建的,就是把國土資源檔案管理系統和利用系統整合集成并在云平臺上虛擬化,最終直接提供給各級檔案部門使用。
廣東省國土資源檔案“一張圖”云服務平臺,是最終要在省級國土資源檔案應用云中體現的應用系統。平臺框架以IaaS(基礎設施即服務)和PaaS(平臺設施即服務)為基礎,基于GIS技術管理空間數據庫。平臺將面向廣東省國土資源檔案館和全省21個地市的國土資源檔案部門提供三方面的服務:國土資源檔案“一張圖”公共服務平臺面向公眾,提供最基本的檔案目錄服務,以后可以進一步拓展至互聯網,實現國土資源檔案公有云的服務;國土資源檔案管理與利用服務平臺保障各級各檔案部門對檔案數據進行技術保管并提供給外界應用;國土資源檔案數據中心可以對國土空間數據檔案進行多源異構數據處理(包括矢量數據格式轉換、坐標轉換、位置匹配、拓撲檢查、疊加分析等)、數據編輯和更新維護以及第三方公共服務集成起來。平臺系統架構以SOA規范為基礎,以OSGI標準對各個服務進行統一封裝,為服務提供者提供統一的服務發布功能,為服務提供者和消費者之間提供統一的通信方式。
3 結語
廣東省已經具備構建省級國土資源檔案云平臺的三個典型層級的條件,基礎設施即服務(“IaaS”)是對硬件資源的整合,形成資源池,平臺即服務(“PaaS”)則是對硬件資源的補充和切合,兩者共同形成了構建應用即服務(“AaaS”)條件。廣東省國土資源檔案館已經基本完成了第三層級的平臺軟件開發。構建省級國土資源檔案云平臺優點不言而喻:實現全省檔案信息資源共享,在檔案部門之間共同構筑檔案信息共享池。各級檔案部門可以分享由省級云平臺提供的基礎設施,以極低的成本投入獲得極高的運算能力,克服服務器訪問限制的瓶頸,不再需要為了滿足用戶需求花費大量的資金購買更高級別的服務器等相關的硬件。另外,還可以解決各地檔案部門信息化人才短缺的問題。因此,構建廣東的省級國土資源檔案云平臺將為未來國土資源檔案信息化提供寬廣之路。
參考文獻:
[1]方昀,郭偉.云計算技術對檔案信息化的影響和啟示[J].檔案學研究,2010(04):71~72.
[2]SUN公司.云計算架構介紹白皮書[M],第一版,2009(6):2.
[3]祝慶軒,桑毓域,方昀.基于云計算的檔案信息資源共享模式研究[J].蘭臺世界.2011(7):8.
[4]百度百科,虛擬化技術.[2013-08-12].http://baike.baidu.com/view/13605.htm?fr=aladdin.
(作者單位:廣東省國土資源檔案館 來稿日期:2014-08-15)