孔昭煜,李晨陽,張像源,吳 軒
(1.中國地質調查局發展研究中心,北京 100037;2.全國地質資料館,北京 100037;3.天津市地質調查研究院,天津 300191)
地質資料成果數據是地質工作者辛勤的勞動和智慧的結晶,在具有資料、檔案和科研屬性的同時,也具獲取成本高、難以重復獲取、再利用價值高等特點。地質資料工作在地質工作環節中起到承上啟下的重要作用,即是上一輪地質工作的終結,又是下一輪地質工作起始的理論依據,也是地質工作成果社會化服務的重要展示窗口。
現階段我國各級館藏機構中普遍存在著對地質資料管理工作主體業務整體規劃薄弱,缺乏成體系的系統支撐,對紙介質和電子地質資料數據沒有進行精細化管理,在地質資料利用方面沒有發揮數字資源優勢,同時也缺乏對地質資料進一步的開發利用。在大數據、云計算、超融合和人工智能等新興信息技術不斷成熟和廣泛應用的當今,數字化的地質調查成果資料數據的種類和占用量呈爆發式增加,因此現有的IT基礎設施中的計算資源、網絡資源和存儲資源等基礎設施面臨極大的運行壓力和發展瓶頸。開展地質資料數據中心基礎設施建設,利用信息技術對傳統的工作流程進行梳理和升級改造,是地質資料管理工作向新時代數字地質資料館藏館轉型的有效措施,同時也是地質調查部門響應社會公眾對地質調查成果資料數據的開發利用迫切需求而推出的積極舉措。全國地質資料館已經開展并完成地質資料數據中心建設,利用信息技術全面推進地質資料業務全流程向數字化管理改造和升級,匯聚全國地質數字資源、集各學科各專業地質數據之大成、提供公益權威、開放穩定、持續發展的地質信息服務[1-4]。
全國地質資料館開展地質資料數據中心基礎設施建設工作,主要由基礎物理環境、網絡環境、計算能力、存儲備份系統、運維安全體系和標準制度所組成,完成了地質資料數據中心的基礎設施支撐保障能力建設,實現其先進、高效、穩定、可靠的地質資料數據中心的有效運轉。本文通過對地質資料數據中心基礎設施建設研究和總結,以先進實用的技術,低成本的開展建設地質資料數據中心基礎設施,并提出一套完整切實有效,具有較強可操性的指導建議,有效地帶動和促進地質資料信息化建設工作[5]。
1.1.1需求指導原則
地質資料數據中心基礎設施的軟硬件支撐系統平臺建設規劃,需要對業務發展、數據規模發展、信息技術發展、保密安全和網絡安全等多層次的不同實際需求進行調研,結合已有的工作現狀進行規范、細致的規劃和設計。以實際的服務需求、數據增長量、安全和基礎設施資源占用需求為主導,集中統一建設、按需分配高效利用資源。
1.1.2標準化建設原則
在開展地質資料數據中心基礎設施規劃和設計過程中,需嚴格遵循國際、國內和行業有關的標準和規范。規范術語表達方式,規范系統設計方案、規范數據庫建設和規范實施方案,加強地質資料數據中心基礎設施建設工作嚴謹、一致和規范,符合國際慣用方法和流程。
1.1.3成熟與先進性原則
地質資料數據中心基礎設施在總體架構規劃設計時,采用的基礎環境、網絡、計算能力、存儲備份系統和運維監控系統等系統的核心技術,需在現有成熟的產品中選擇,避免自行研發投入的成本高于現有產品價格。同時在選型中需要遵循符合國際和國家標準,并在國內外重大類似系統工程中成功運用的,能夠代表主流技術發展方向,引領未來技術發展的兩項核心原則[4]。
1.1.4安全保障原則
由于全國地質資料館館藏地質調查成果資料數據中含有部分涉密數據和敏感數據,因此,在基礎設施建設規劃設計中,需要對物理安全、供電安全、消防安全、系統安全、網絡安全和數字資源安全等方面進行嚴格的規范化設計,以國家安全相關標準和規范為核心設計原則[4,6]。
地質資料數據中心基礎設施建設主要滿足全國地質資料館主要業務和功能,分別建立了物理隔離工作網絡和互聯網絡。其中物理隔離工作網絡的建設規劃是參照涉密網進行設計和建設的,滿足日常數據交換、數據加工生產和到館服務查詢等支撐保障需求;互聯網絡主要保障面向社會公眾提供公開的地質資料成果數據的在線查詢和使用[4,7]。
1.2.1物理隔離工作區
物理隔離工作區主要由數據交換、數據生產、基礎網絡、基礎系統、核心存儲系統和核心備份系統幾大功能組成,實現了全國地質資料館內部業務數字化全面升級,同時利用信息化技術打造數字地質資料館一體化數據管理系統,切實有效的推動地質資料信息化建設。
1.2.2互聯網區
互聯網區主要由基礎網絡、基礎系統、應用系統、私有云平臺、核心存儲系統和核心備份系統等功能組成,實現高效、即時、全面、精準的面向社會提供具有權威、豐富、科學的地質調查成果資料數據服務平臺。同時利用現有成熟的信息技術,完成構建地質資料數據中心基礎設施平臺,為未來發展的人工智能和機器學習奠定必要的基礎資源環境。
目前全國地質資料館與中國地質調查局中央機房合并使用,該機房的基礎環境建設和基本運行由相關部門負責。在建設地質資料數據中心機房規劃和建設應嚴格遵循消防、供電、空調系統、綜合布線和機房建設等有關標準和規范[7]。
2.1.1機房的基礎環境建設
地質資料數據中心基礎設施機房在現有的機房環境的基礎上,完成核心功能區的進一步細化,物理隔離工作區和互聯網區嚴格規劃相應部署區域,減少存在的安全隱患。同時在現有的防塵、防水、防靜電、防鼠、防結露、保溫和阻燃的基本條件下,建立獨立緩沖區和維修區,進一步降低防塵和防靜電安全隱患,保障其運行安全平穩。
2.1.2供電系統
地質資料數據中心基礎設施機房的建設理念是綠色機房,在電能消耗上力爭控制符合節能要求的范圍之內。其供電方式由雙路市電支撐雙路UPS不間斷電源,為機房每臺機柜提供雙路供電,切實保障設備運行安全可靠。
2.1.3空調新風系統
數據中心基礎設施機房由高密度、高集成率的網絡設備、服務器設備和存儲等設備組成,因此機房的環境溫度直接影響各設備的正常運行。在溫度過高的環境下設備容易出現宕機和損壞,導致的直接和間接損失較大。目前中央機房完成了行間距空調的補充和機柜背板散熱系統建設等改造工程,有效的控制和降低了機房環境溫度,提高了設備運行的穩定度和降低設備損壞率。
2.1.4消防和防雷系統
數據中心機房在有關部門的規劃和建設下,順利通過消防部門的認定和驗收。同時在原有的基礎上對新增機柜進行防靜電、防雷擊等功能的完善和優化。
2.1.5綜合布線系統
綜合布線系統是地質資料數據中心的基礎環境保障必備條件,同時依據有關規定需要對強弱電進行嚴格區分和距離管控。結合中心機房規劃,調整為上走線形式,改善機房下送風存在的風道不暢和風量不足的問題。規范施工和標識清晰有助于故障的排除和維護。
在建設地質資料數據中心基礎設施網絡系統過程中,根據全國地質資料館主要業務特點和數據的重要程度差別,在地質資料數據中心建設和規劃中需要建設兩套且物理隔離的工作網絡,保障數據中心的主要功能能夠高效有序運行,在此基礎上進行進一步細化分別建立工作網絡、存儲備份系統網絡和設備管理網絡[7-8]。
2.2.1物理隔離工作網
物理隔離工作網主要承擔了全國地質資料館內部的主要業務需求,并提供基礎網絡環境保障。主要包括利用三層網絡交換結構構建核心層、匯聚層和接入層,實現各部門之間的業務流和數據流轉穩定暢通;提供主要業務的數據生產加工基礎環境保障;建設內部核心存儲備份系統網絡,保障數據流使用的光纖通信網絡具有高效高速的網絡環境;利用老舊設備建設網絡基礎設備的管理網絡。各司其職的網絡結構,避免了全業務混合導致單套網絡吞吐和運行壓力的增加,利用較少的經費投入切實有效的提高了網絡吞吐能力和運行能力。圖1為工作網拓撲圖。

圖1 地質資料數據中心工作網拓撲圖
2.2.2互聯網
互聯網區主要承擔了地質資料數據中心門戶網站、MapGIS發布集群、ArcGIS發布門戶、目錄數據發布系統、虛擬展館、數據出版門戶等服務系統,用于面向社會公眾,提供專業、權威、全面的地質調查成果資料數據在線公開化服務支撐平臺。該區域網絡主要有互聯網連接區、存儲備份系統網絡和設備管理網絡等功能組成。由于互聯網鏈路由中央機房管理部門承擔,因此僅需在現有基礎上進行使用的規劃和部署。存儲備份系統由于對數據讀寫速度要求高,因此利用光纖技術完成構建光纖網絡。利用老舊設備構建基礎設施設備管理網絡。優化清理業務需求,建立最為優化的網絡結構,充分提升地質資料數據中心高效快速的社會化服務能力和穩定安全的服務環境保障。圖2為互聯網拓撲圖。

圖2 地質資料數據中心互聯網拓撲圖
隨著信息技術不斷發展,地質資料數據中心的核心運算能力目前全部由PC服務器承擔。在有限的硬件資源下,需要系統的規劃建設,實現地質資料數據中心基礎運算擴展能力更加靈活,更加高效的利用PC服務器設備性能,有效降低采購、能耗和運營的投入成本。在對服務器進行整體架構設計中,以支撐服務的功能和系統為需求,結合虛擬化、私有云技術,將服務器整體架構分為核心基礎區、私有云基礎區和服務應用支撐區。根據系統對硬件需求特點,充分發揮和利用硬件資源,切實有效提高設備的使用率[9-10]。
1) 核心基礎區。該區域主要由普通PC服務器組成,主要承擔地質資料數據中心核心底層支撐,保障服務應用支撐區各系統所需必備環境支撐能力。該區部署的系統主要包括:AD集群、基礎SQL集群和門戶網站系統平臺等核心基礎類系統。
2) 私有云基礎區。利用現有成熟架構,完成搭建私有云系統,有效的保障了服務應用支撐區所需要的服務器資源。目前私有云系統通過2年的運行,實現了門戶網站系統、數據發布集群系統、辦公系統和服務支撐系統等各類應用系統對服務器的需求保障。
3) 服務應用支撐區。在私有云系統的支撐下,該區目前實現地質資料數據中心門戶網站、ArcGIS發布門戶、MapGIS發布集群、OA系統、國家地質虛擬展館、中國地質數據出版系統,統一身份認證系統、運行監控系統、郵件系統和部分服務應用系統。
2.4.1地質資料數據中心存儲系統
存儲系統是地質資料數據中心的核心基礎設施平臺,由于物理隔離工作網和互聯網的應用場景和數據類型不同,因此兩套存儲系統的偏重有所差異,前者由于是存放全國地質資料館的館藏數據,因此注重的是存儲系統的容量;后者的重點工作是提供社會化在線服務,因此注重的存儲系統的使用效率。
物理隔離工作網絡中的核心存儲系統由1套Isilon網絡存儲系統和1套FDS2210分布式存儲系統組成。截至2017年底,全國地質資料館館藏數據單套已經達到195.6 TB,共計187 187 610檔電子文件[11]。隨著新的地質資料成果匯交的有關要求規定,預計2018年單套館藏數據增長量有望突破100 TB,直接造成了存儲系統的運行壓力。充分發揮分布式存儲系統的性能,利用閃盤和存儲虛擬化技術,對存儲硬件融合在一個虛擬池中,將“冷、溫、熱”數據根據其訪問讀寫頻率特點進行分層,充分發揮閃盤的高速讀寫能力,同時建立獨立的存儲系統的元數據層,提升數據查詢的速度和效率。有效保障核心存儲系統的使用效率和安全性。圖3為物理隔離工作網存儲系統。
互聯網存儲系統主要由2套NSC 2600 SAN存儲系統和1套IBM V3700組成,其中NSC 2600主要承擔了私有云核心存儲和發布集群存儲應用,V3700承擔部分歸檔和其它應用存儲應用。利用閃盤結合分層技術,完成對私有云支撐的存儲系統進行分層,大幅度提高了虛擬服務器的使用速度。以成熟的技術自行完成私有云建設,實現低成本建設私有云系統。圖4為互聯網存儲系統。
2.4.2地質資料數據中心備份系統
目前備份系統物理隔離工作網由昆騰I6000大型帶庫提供支撐,互聯網由惠普4048小型帶庫提供支撐。如何提升物理隔離工作網中的館藏數據安全,提高互聯網應用系統和發布數據安全是備份系統需要保障的重點工作[12-13]。

圖3 地質資料數據中心物理隔離工作網存儲系統

圖4 地質資料數據中心互聯網存儲系統
在物理隔離工作網中由于數據量大,其數據涵蓋種類多因此需要制定詳細的備份策略開展備份工作。目前工作網中數據量大且小文件多,因此每季度進行一次完整備份,為彌補備份完整備份周期內的數據變化,每月進行差異化備份,確保數據的高安全可靠,同時依據部分數據特點進行存檔備份,用于部分廢棄數據的存放,對回溯性查找提供必備的數據源。
在互聯網區主要需要進行發布數據備份,同時結合相關軟件實現對私有云中的虛擬服務器進行備份。目前發布數據每月進行完整備份,每周進行差異化備份,虛擬服務器每月進行完整備份,根據系統調整情況即時開展差異備份工作。
地質資料數據中心基礎設施建設的安全體系建設,需要應對物理安全、網絡安全、數據安全、系統安全和應用安全等5方面進行建設。只有保障基礎設施的安全運行才能有效保障數據中心的安全可靠,主要遵循隔離、控制和保護三個基本原則[14-16]。
1) 物理安全。嚴格管理物理區域的訪問,合理劃分隔離網絡和互聯網區域,通過距離和必備防護措施做到符合安全要求。建立專用維修區域和緩沖區域,降低人為原因造成的次生事故的發生,同時減少物理環境的灰塵和靜電隱患。根據相關要求規劃和推進涉密機房的建設工作,切實提高數據安全保障能力。
2) 網絡安全。利用主流成熟的網絡防護軟硬件,提高入侵檢測和防病毒等基礎防護系統,同時依據有關要求,對網絡連路和網絡設備進行安全防護和安全加固,增加相應的檢測手段和防護措施,有效提高互聯網安全防護,保障地質資料數據中心安全可靠。
3) 數據安全。地質資料數據中心的核心是數據,在保障數據安全方面需要開展兩方面工作:①數據存放和管理安全,其主要包括對數據的校驗和驗證工作,確保數據是完整可信的;②數據的使用安全,主要包括數據內容是否符合保密規定,使用過程中使用者的是否具有使用數據的權限。通過技術手段對數據的完整性、可用性、可控性、可追查性、機密性等方面的嚴格管理和控制,保證了數據的安全性。
4) 系統安全。根據有關要求,定期開展漏洞掃描對系統進行安全威脅性評估,定期開展安全巡檢,根據巡檢結果提出修補和加固建議進行完善,安裝和部署防病毒系統,保障服務器各系統不受非法軟件和病毒的侵襲。
5) 應用安全。利用自行建設的CA(數字證書)和購買的商業CA相結合,建立一套適用于地質資料數據中心基礎設施環境的數字證書注冊審批機制,實現通過身份認證對數據服務進行有效管控,通過訪問控制權管理提高相應的安全管理機制。
地質資料數據中心在規劃和建設之初,需要對其總體定位、整體規劃、業務規劃、數據規劃和安全規劃等有關需求的詳細分析和確定。在建設和運行維護過程中始終遵循標準先行的基本工作原則。在整體架構規劃時制定詳盡的基礎設施建設標準和基礎系統支撐標準,有效的實現服務接口標準統一的基礎設施環境平臺,為服務應用平臺奠定一套良好的基礎環境支撐。同時對數據格式和存儲結構制定最優標準,便于后期的數據挖掘和標準化接口服務。在使用和維護過程中,依據標準實現使用的規范化和運行維護的規范化,有效提升基礎設施對應用系統的標準化的全開放支撐,更加有效的降低信息系統孤島效應。同時推動數據共享,提升數字挖掘能力和服務能力[3,15]。
地質資料數據中心基礎設施建設工作,是實現傳統地質資料館業務向全流程信息化轉變的一個重要契機,有效的提高地質資料數據的社會化服務支撐能力,同時也響應國家推進的數據開放共享等重點工作。地質資料數據中心歷經5年建設已初見成效,在物理隔離工作網重點完成了PB級的存儲備份系統建設,有效的保障了館藏地質調查成果資料數據的安全可靠,并實現全國地質資料館業務全部數字化遷移;在互聯網利用PC服務器和入門級存儲系統完成私有云平臺建設,實現數字地質資料館門戶、發布集群、輔助系統和備用系統及測試系統的有效支撐能力。通過對基礎設施持建設和完善,有效的保障了地質資料數據中心各系統和功能的游行運轉。
通過建設地質資料數據中心基礎設施,有效改善全國地質資料館的信息化工作環境和支撐能力,同時積累的建設經驗是建設省級和行業級分中心的重要技術方法。通過該項工作不斷積累有關經驗,對省級和行業有關館藏機構具有極高的借鑒和指導作用。在有力的保障地質資料數據中心的穩定、可靠、高效和安全運行的同時,基礎設施建設也是有效的提高生產率的重要手段之一。建設和運行一套一流的基礎設施系統平臺,是一流的地質資料數據中心的核心基礎,也是地質資料高效利用的核心保障手段之一,更是新一代地質資料工作者的核心工作目標[3-4,10]。
[1]連建,顏世強,王黔駒.地質資料信息化建設趨勢、問題及對策[J].中國國土資源經濟,2016(1):28-32.
[2]卜小平,張翠光,趙亞利.全國地質資料數據中心建設方案初探[J].國土資源科技管理,2007(6):127-131.
[3]孔昭煜,李晨陽,范璘,等.大數據時代地質資料數字資源管理保障體系研究[J].中國礦業,2017,26(4):73-77
[4]李晨陽,吳軒,王新春,等.國家數字地質資料館技術系統設計[M].北京:地質出版社,2016:188-193.
[5]黃少芳,劉曉鴻.大數據時代地質資料信息化發展探討[J].中國國土資源經濟,2013(10):67-69.
[6]武允文,管錫文.數據中心規劃設計方法論[J].中外建筑,2017(5):87-89.
[7]覃建國.大型數據中心機房基礎設施的發展趨勢[J].電信工程技術與標準化,2015(11):1-6.
[8]顏世強,張惠,王黔駒,等.地質資料服務產品基本模式構建[J].中國礦業,2015,24(10):164-167.
[9]高學正,李曉蕾.地質資料網絡服務產品及服務價值研究[J].中國礦業,2017,26(4):64-68.
[10]孔昭煜,李晨陽,賈麗瓊.大數據時代下地質資料數據安全保障的思考[J].中國礦業,2017,26(S1):43-46.
[11]齊釩宇,吳軒,商云濤,等.地質資料屬性及其社會化服務價值研究[J].中國礦業,2016,25(S2):85-88.
[12]魏祥麟,陳鳴,范建華,等.數據中心網絡的體系結構[J].軟件學報,2013(2):295-316.
[13]尤克勤,王毅,沈旻.淺談數據中心數據備份管理[J].中國金融電腦,2017(7):37-41.
[14]元海平.強化保密意識做好保密工作[J].中國科技信息,2011(4):200-201.
[15]王露,莊青.基于大數據技術的數據中心建設規劃[J].信息化研究,2017(2):5-11.
[16]馮國禮,李蓉,王曄.淺析數據中心網絡安全防護與設計要求[J].信息系統工程,2017(3):132-134.