王家兵,王成彥
(1.重慶交通大學 圖書館,重慶 400074;2.大連理工大學 信息與通信工程學院,遼寧 大連 116024)
圖書館數(shù)據(jù)中心是圖書館信息化建設的重要基礎設施,在現(xiàn)代化數(shù)字圖書館、智慧圖書館建設中起著支撐與保障作用,受到各高校圖書館的廣泛重視。近年來,隨著圖書館數(shù)字化、自動化建設的推進,越來越多的電子資源、自動化業(yè)務在圖書館數(shù)據(jù)中心上線,各種應用服務與數(shù)據(jù)量的快速增長對數(shù)據(jù)中心服務能力提出了新的要求。如何建設好數(shù)據(jù)中心,保障相關業(yè)務良好運行,使硬件資源得到最大化利用,在靈活、高效的同時,保持易于擴展,成為各高校圖書館需要面對的問題。
圖書館數(shù)據(jù)中心的特點是對數(shù)據(jù)存儲空間的需求大、備份數(shù)據(jù)量大、關鍵應用安全性要求高。目前各圖書館數(shù)據(jù)中心大多采用集群與虛擬化技術來保障業(yè)務的運行,以服務器與外置磁盤作陣列模式,以存儲網(wǎng)絡(Storage Area Network,SAN)作統(tǒng)一存儲來保障數(shù)據(jù)的安全并提高資源利用率。這種傳統(tǒng)集中式存儲架構(gòu)經(jīng)過十多年的發(fā)展,技術已相對成熟,通過將存儲和服務器隔離,簡化了存儲的管理,同時使存儲空間有效地匯集在一起,存儲利用率得到提高,在早期業(yè)務應用少、數(shù)據(jù)量小的情況下,得到了廣泛的應用。但隨著信息化與需求的發(fā)展,圖書館數(shù)據(jù)量與自動化業(yè)務暴發(fā)式增長,傳統(tǒng)集中式存儲架構(gòu)表現(xiàn)出了明顯的不足:一方面是數(shù)據(jù)處理性能受到存儲網(wǎng)絡傳輸速度的限制,難以承載持續(xù)暴漲的數(shù)據(jù)處理需求;另一方面是擴展不便、成本高,隨著應用規(guī)模的擴大,成本甚至達到難以承擔的程度。為解決這些問題,近年來,一些圖書館開始研究應用云計算相關技術,采用分散存儲的超融合架構(gòu)來搭建數(shù)據(jù)中心[1-2]。
超融合基礎架構(gòu)[3](Hyper-Converged Infrastructure,HCI)是由多個服務器節(jié)點整合而成的一個易于管理的集成系統(tǒng),每個服務器節(jié)點都具備計算、存儲和服務器虛擬化等資源,通過軟件將虛擬計算平臺和存儲融合到一起,形成一個統(tǒng)一資源池,按需為用戶提供服務。不同于傳統(tǒng)的IT 基礎架構(gòu),超融合基礎架構(gòu)是一種由軟件定義的系統(tǒng),以每個服務器節(jié)點的本地硬盤作數(shù)據(jù)存儲,系統(tǒng)不僅具有計算、存儲、網(wǎng)絡和服務器虛擬化等資源和技術,而且還包括緩存加速、重復數(shù)據(jù)刪除、在線數(shù)據(jù)壓縮、備份、快照等技術元素,多節(jié)點通過網(wǎng)絡聚合起來,很容易實現(xiàn)模塊化的無縫橫向擴展。
相對于傳統(tǒng)虛擬化方案,超融合架構(gòu)具有以下優(yōu)勢:
(1)擴容與管理簡單
超融合架構(gòu)底層基礎設施只有交換機和服務器,架構(gòu)簡單,簡化了管理;性能和容量擴容改造時,業(yè)務和架構(gòu)無需變革,只需橫向添加服務器就可以實現(xiàn)業(yè)務線性擴展;進行業(yè)務遷移時,采用集成的應用交付體系,業(yè)務上線簡便。
(2)穩(wěn)定性好
超融合架構(gòu)采用分布式跨節(jié)點多副本以及定時備份技術,實現(xiàn)了物理層數(shù)據(jù)可靠保存;通過虛擬化技術實現(xiàn)高可用性與分布式資源調(diào)度,減少了物理節(jié)點故障導致業(yè)務中斷的次數(shù);另外,通過負載均衡、容災技術、持續(xù)數(shù)據(jù)保護構(gòu)建了業(yè)務連續(xù)性訪問能力,保證了數(shù)據(jù)庫、關鍵應用能穩(wěn)定運行。
(3)安全性高
通過內(nèi)置分布式防火墻、虛擬機沙箱、Web 應用防護等安全機制,超融合架構(gòu)有效提高了平臺的安全級別,支持多副本容災保護,同時集成下一代防火墻、無代理殺毒軟件、數(shù)據(jù)庫審計等安全模塊,構(gòu)建了4~7 層網(wǎng)絡和應用安全防護能力,
(4)易于使用
實現(xiàn)了可視化運維和故障定位,采用流程化、自動化資源交付方式,計算、存儲、網(wǎng)絡和安全資源隨需索取,提高了部署和資源編排的效率,簡化了平臺的運維,方便管理。
超融合架構(gòu)產(chǎn)品應用日益廣泛,其市場增長迅猛。全球知名咨詢公司“IDC”的報告顯示,從2016 年到2021年,全球超融合市場的復合增長率為48%[4],2018 年我國超融合市場較上年同期實現(xiàn)了88.2%的增長。目前,提供商用超融合產(chǎn)品的公司較多,國外有Nutanix、VMware、SimpliVity 等,國內(nèi)有聯(lián)想、華為、H3C、深信服、SmartX 等公司,不同公司的超融合架構(gòu)方案在分布式塊存儲、虛擬化計算、運維管理平臺方面的實現(xiàn)技術各有不同。在分布式塊存儲實現(xiàn)方面,有采用開源Ceph、GlusterFS 改造來實現(xiàn)的,如深信服采用的GlusterFS;也有自主研發(fā)實現(xiàn)的,如Nutanix NDFS、VMware VSAN、SmartX ZBS、華為Fusion Storage。在虛擬化計算方面,大多數(shù)公司都支持多個虛擬化平臺,如開源的KVM 被很多廠商選用,另外商用的VMware 也采用較多。在超融合運維管理平臺方面,各公司均開發(fā)有云管平臺,基本具有Web 管理界面,實現(xiàn)存儲、虛擬化、網(wǎng)絡等集群服務管理,以及性能和事件的監(jiān)控、分析和報警功能,如VMware VCenter、Nutanix Prism、SmartX Fishey、聯(lián)想AIO CMP、華為FusionCube Center、深信服OpenStack Horizon 等。
另外,不同超融合產(chǎn)品廠商提供的交付方式還有不同,有的只支持本公司的服務器,有的支持多家服務器。交付的硬件也有一體機形式和純軟件方式,其中,純軟件方式可支持通用的服務器。
采用超融合架構(gòu)來進行數(shù)據(jù)中心建設,需結(jié)合圖書館數(shù)據(jù)中心建設現(xiàn)狀、未來發(fā)展需要以及相關技術發(fā)展趨勢等諸多因素來綜合考慮,保證整個數(shù)據(jù)中心的實用性、先進性、安全性、可擴展性,方便實施標準化管理,應當按照循序漸進、綜合考慮技術與服務的原則,結(jié)合各圖書館實際需要進行規(guī)劃與建設。
數(shù)據(jù)中心建設是一個長期的過程,相關技術在不斷地發(fā)展變化。各高校圖書館在前期同樣投入了相當多的資金,新的建設應考慮設備利舊,降低整個數(shù)據(jù)中心的投入。另外,新購設備在使用過程中也會逐漸老化,特別是保修期過后的設備損壞費用會大大提高。綜合這幾方面因素,超融合架構(gòu)的圖書館數(shù)據(jù)中心宜分步構(gòu)建,前期小規(guī)模建設,以三年至五年為周期進行多次投入的建設,逐步過渡到整個數(shù)據(jù)中心為新的超融合架構(gòu)。
對于超融合產(chǎn)品,后期升級、運維中的緊急服務支持都是需要考慮的因素。選用超融合產(chǎn)品方案時,除考慮實現(xiàn)技術與性能外,還需考慮硬件的交付方式、后期的服務支持等方面內(nèi)容,可以對同類高校已采購建設的方案進行實地考察,了解投入的資金與使用中的問題,再確定選型。
采用超融合架構(gòu)進行高校圖書館數(shù)據(jù)中心建設,通常包括需求分析與規(guī)劃、方案制定與選型、部署遷移、運行維護等幾個階段。
在需求分析與規(guī)劃階段,先對圖書館數(shù)據(jù)中心的業(yè)務進行調(diào)查統(tǒng)計,對關鍵業(yè)務應用分類,考慮未來3 至5年內(nèi)可能新增加的業(yè)務系統(tǒng),作出未來幾年整個數(shù)據(jù)中心的IT 總體需求目標,制定出建設需求報告與分期實施的計劃和方案。
在方案制定與選型階段,根據(jù)制定的分期實施計劃,確定所需運算能力與總存儲空間,以及所需要的服務器數(shù)量,再按超融合所需的搭配比例要求進行固態(tài)硬盤、內(nèi)存選配。再與多家超融合方案進行對比,綜合考慮性價比與后期服務能力,進行選型、招標,再簽定相關合同。
具體實施過程包括服務器上架、布線,超融合相關軟件安裝,業(yè)務系統(tǒng)遷移與測試等過程。實施中要做好業(yè)務系統(tǒng)的備份,業(yè)務遷移到超融合云平臺上后,應及時進行功能與性能測試,做好相關記錄,實現(xiàn)業(yè)務的平滑過渡。
超融合架構(gòu)提供了統(tǒng)一的Web 管理平臺,實現(xiàn)可視化集中運維管理,方便了平時的運維。日常運維中,需加強運行維護人員技術能力的培養(yǎng),提升運維管理水平,做好系統(tǒng)監(jiān)控與性能調(diào)整,建立靈活、高效、可控制、可衡量的運維監(jiān)控管理流程,做好維護日志記錄,為圖書館業(yè)務提供穩(wěn)定、良好、安全的服務。
重慶交通大學圖書館現(xiàn)有服務器16 臺、CPU 核數(shù)40 多個、存儲空間約260TB,采用單服務器配置RAID模式,承載圖書管理系統(tǒng)OPAC、RFID 自助借還系統(tǒng)、門禁系統(tǒng)以及CNKI、萬方、超星等三十多個本地電子資源數(shù)據(jù)庫等業(yè)務。由于業(yè)務增長與服務器老化,考慮逐步轉(zhuǎn)移到超融合云平臺。
考慮到現(xiàn)有電子資源存儲規(guī)模與近5 年的發(fā)展情況,近五年內(nèi)達成的建設目標為7 個結(jié)點,目標存儲空間約700T,滿足電子資源50~100 種本地存儲與圖書館相關業(yè)務的需要。項目分成兩期來完成,前期建設3 個節(jié)點,提供約300T 硬盤空間,遷移電子資源平臺約10~20 個,后期在舊服務器逐步淘汰的同時,進行新結(jié)點建設。
對國產(chǎn)聯(lián)想、華為、深信服等幾家超融合方案進行了對比,綜合考慮性價比,選擇了深信服超融合方案,深信服超融合方案具有架構(gòu)簡單、性能穩(wěn)定、安全、易用性好等特點。在IDC 最新發(fā)布的《中國超融合市場跟蹤研究報告(2017Q4)》中,深信服以19%的市場份額躍居超融合國產(chǎn)品牌第三名。深信服超融合方案支持其它廠家的服務器,也可以利用舊服務器,其超融合軟件分必選與可選兩類,必選軟件模塊包括云計算管理軟件、計算服務器虛擬化軟件、網(wǎng)絡虛擬化軟件、虛擬存儲軟件;可選軟件模塊包括深信服異構(gòu)虛擬化管理軟件、持續(xù)數(shù)據(jù)保護軟件、虛擬防火墻軟件、應用交付軟件、數(shù)據(jù)庫安全審計系統(tǒng)軟件等。初期建設三個節(jié)點,總預算費用約80萬,建成后可提供約300T 硬盤空間,可為10~20 個空間占用量大的電子資源平臺提供服務。相關設備清單如表1 所示。
數(shù)據(jù)中心是高校智慧圖書館建設的支撐平臺,采用超融合架構(gòu)來構(gòu)建圖書館數(shù)據(jù)中心,在保證圖書館相關業(yè)務高效運行的同時,實現(xiàn)了資源的安全存儲、合理分配、動態(tài)管理與自由訪問,是未來圖書館數(shù)據(jù)中心的必然發(fā)展趨勢。在規(guī)劃與建設中,必須結(jié)合圖書館實際,精心論證,使數(shù)據(jù)中心能夠滿足當前需要,同時也能進一步擴展,適應未來的發(fā)展。

表1 深信服超融合產(chǎn)品清單