應毅 顧問 葉傳標


【摘要】針對高校傳統信息化建設中存在的重復建設、能耗高、信息孤島等問題進行研究,提出一種基于SPI的校園云計算框架體系,同時闡述云計算在數字校園建設中所帶來的節約投資成本、提高資源共享水平、節能減排等六種優勢。在對業界流行的云平臺實施方案進行分析的基礎上,給出一種基于開源項目的高校私有云平臺的建設架構,已開展的工作說明該方案是建設智慧校園的有效途徑。
【關鍵詞】教育信息化建設;數字校園;云計算;私有云;開源項目
【中圖分類號】G40-057【文獻標識碼】A【論文編號】1009-8097(2012)12-0099-04
一、數字化校園與信息化建設的現狀
近年來,高校的教育信息化得到了前所未有的發展,作為信息化的基礎設施一一校園網已經融入到教學、科研、實驗、管理各個領域中,盡管數字校園和各種應用系統為高校的學生、教師和管理人員提供了很多的服務,節省了時間和精力,但還是存在若干問題:
(1)高校信息化建設需要投入大量的經費來購置硬件資源,由于經費投入不能從學校層面整體規劃,加之各部門之間存在“行政壁壘”,幾乎每一個業務部門新建一個信息系統都需要重新購置一套服務器設備。同時,硬件設備更新換代的周期越來越短,投入的設備往往使用不了多長時間就面臨著淘汰,結果導致資源重復建設,且利用率低、共享率低、維護成本高。
(2)隨著信息化進程的不斷深入,無論是企業還是高校,都發現能源消耗已經成為IT支出的一項重要組成部分。服務器增加的同時,配套用電量將呈指數級上升,在機房設計布局不合理的情況下,冷卻部分所占用的能耗比例更高。數量巨大的計算機設備將會造成大量的能源消耗,這已成為數字校園建設中不容忽視的問題。
(3)信息系統的建設通常都是按峰值情況規劃的,但是高校的信息系統有其特殊性,例如招生網站在每年高考結束至填報志愿之前,點擊量就相當大,而其他時段并發數就很低,學校的門戶網站、教務處的登分查分系統都有類似情況。為了保證高使用率時系統的可靠性,只能進行冗余建設,這造成巨大浪費。
(4)由于沒有統一的系統建設規劃,缺乏數據標準,各職能部門的數據組織形式和數據管理方式不盡相同,建設的信息系統越多,數據越分散,且不規范、不一致、甚至不準確,共享困難,形成信息孤島,在需要綜合利用數據進行統計分析、數據挖掘、決策支持時往往遇到很大困難,未能充分發揮數字校園應起到的作用。
二、云計算在數字校園建設中的應用
信息化建設的現狀不容樂觀,在很大程度上阻礙了數字校園的發展。云計算技術恰逢其時地出現了,將云計算運用于教育領域,用其改善教育信息化建設,將有效提高信息資源開發利用水平,推動我國高等教育的發展。
2009年4月,美國國家標準與技術研究院(NIST)提出云計算SPI(SPI是SaaS、PaaS、laaS的首字母縮寫)架構體烈”。在此基礎上,結合教育信息化技術的特點,本文給出校園云計算的分層架構,如圖l所示。最底層為物理硬件,其上是操作系統與虛擬設備,HypervisorManagement負責對虛擬設備的管理,這三者構成IaaS。PaaS主要由服務器和中間件組成。最上層是業務應用和對外接口。
基于上述架構的云計算系統在數字校園建設中具有以下優勢:
(1)許多學校都有大量的老式PC,這類計算機多數只是硬件配置低無法升級到新的操作系統或安裝新的應用軟件而被淘汰,硬件本身還可以正常工作。通過云平臺將它們集中起來對外提供服務,就不用再投入大量資金購買昂貴的硬件設備,負擔頻繁的維護與升級,能極大的節約硬件購買和維護的成本。
(2)通過多節點冗余的方式,云計算系統能夠容忍節點錯誤,自動檢測失效節點,并將之排除,以保證系統的正常運行。云計算系統采用分布式存儲的方式來存放數據,即為同一份數據存儲多個副本。通過以上兩種措施,云平臺能夠保證應用的高可用性和數據的高可靠性。
(3)云計算對基礎設施進行了統一的配置和管理,按需進行動態分配,充分利用空閑的計算資源,提高系統的整體計算能力和效率,使服務器的數量減少(每撤掉一臺服務器,意味著每年減少11.4噸CO2排放,降低信息技術設備的電源能耗,在節能、環保、降低成本的同時,達到構建低碳型教育的新型學校的目標。
(4)云計算把CPU、存儲設備、網絡等資源整合在一起形成了一個統一的資源池,這種集中管理利用資源的方式將有效消除資源獨立分散造成的資源閑置、資源浪費以及基礎設施超負荷現象,使基礎設施得到充分利用。
(5)存儲資源的共享和教育信息資源的共建能有效避免校內各部門的信息溝通不暢,減少信息孤島的產生,降低數據冗余,增強數據安全性和一致性,使統一數據管理和校級數據集成成為可能,同時也為學校領導和各管理部門進行OLAP、數據挖掘提供支持。
(6)作為典型云計算應用的虛擬桌面,能夠在“云”中為用戶提供遠程的計算機桌面服務。通過對終端桌面的集中控管,能有效降低機房管理工作量,降低軟硬件的管理和維護成本,強化數據安全。長期的大規模的采用桌面虛擬化技術,在延長傳統臺式機使用壽命的同時,還有利于減少碳足跡(CarbonFootprint),建立綠色的校園機房。
三、基于開源項目的高校云平臺
由于需要很強的資源協調能力和一定的技術厚度,目前云計算主要是由幾個大公司(如IBM、Dell)倡導和實施,并且大部分應用于商業目的。如果直接采用大廠商成熟的云計算方案,固然實施簡單使用方便,但是成本巨大,且后期維護還需大量資金,所以大公司的云計算方案不適合高校云平臺的建設。開源項目就成為必然選擇。
RedHat是全球最大的開源技術廠商,其開發的Fedora系統是全球使用最多的Linux免費發行版本,開源的KVM和OpenShiR也在由RedHat開發和維護,RedHat的開源策略使得其產品具有較低的成本。
如圖2所示,以RedHat的軟件產品為主體,給出基于開源項目的高校私有云平臺的理論架構,用于指導實踐與應用。
最底層由計算服務器、存儲設備、網絡設備等硬件設施組成,為上層提供最基本的存儲和計算服務。
國內院校的信息化建設程度不同,即使是學校內部,也因設備購置的先后順序,可能既有已經淘汰的廉價PC,也有用于科學計算的高性能服務器。為了屏蔽差異性,需要采用單機虛擬化技術將物理層的設備虛擬成一個巨大的基礎設施資源池。單機虛擬化是通過運行多個操作系統把一臺計算機當做多臺機器使用,提高設備的使用效率。在線遷移是云計算系統保證高可用性的最重要技術,當一個節點超載時,可以將一個操作系統的實例(以及它的應用程序)遷移到一個新的、不怎么繁忙的節點上。基于Linux的進程遷移在同構系統中比較容易實現,但異構節點之間的遷移難度很大。在云計算系統中,通過虛擬化實現節點同構后,可以規避這個難題。所以需要提供同構的運行節點,即運行同一種操作系統的節點,以便簡化管理。基于Linux的開源虛擬化軟件主要是KVM和Xen。KVM將虛擬化技術作為操作系統的一種特性集成到Linux內核中,現在由RedHat開發和維護,建議在部署虛擬機時大量使用。為了支持Citrix的虛擬桌面解決方案,也可以部署少量的Xen虛擬機。盡管大部分通用的云計算系統都依賴虛擬化技術提供同構的虛擬節點,但有一些專用的云計算系統(如Hadoop)也可以不需要虛擬化技術的支撐。不能運行KVM的極老式PC可以直接安裝Linux,建議使用免費的Fedora操作系統(RedHatLinux的社區版本)。以上三種部署方案可以根據實際情況選擇使用。
虛擬設備的管理主要由OpenStack完成。OpenStack由NASA(美國國家航空航天局)和Rackspace合作開發,于2010年7月開源,它主要分為云計算(Nova)和云存儲(Swift)兩個模塊。所做的工作主要是對虛擬設備進行統一配置,統一管理,并實時監測負載需求,自動分配基礎設施,達到彈性平衡資源、節能降耗的目的。OpcnStack默認的虛擬化引擎是KVM,但也提供對Xen的支持。
高校云平臺的PaaS主要由OpenShift、Hadoop、CitrixVDI(VirtualDesktopInfrastructure)組成。
通用性、可復用是傳統中間件的重要特征,大部分的PaaS開源技術都是在傳統中間件的基礎上發展而來的。OpenShift源自RedHat,于2012年5月開源。由于RedHat的開源背景,OpenShiff支持幾乎所有的主流開發語言和框架,包括:Java/JavaEE、PHP/Zend、Python、Perl、Ruby/RubyonRails、Seam、Hibernate,還集成了常用的AppServer和DBServer:JBoss、MySQL、mongoDB(NoSQL數據庫)。Openshift通過為開發人員提供在語言、框架和云上的更多選擇,使開發人員可以構建、測試、運行和管理B/S應用程序,在此標準化平臺上二次開發SaaS應用可以省去基礎性、重復性的工作,一般可減少60~70%的工作量。當然,OpenShift除了為應用層提供軟件的支撐平臺外,還可以通過互聯網向用戶直接提供軟件開發環境。
與OpenShiff不同,Hadoop只是一種基于批處理技術的PaaS開源產品,由Java語言編寫,可以直接運行在Linux之上,也可以運行在虛擬機上。Hadoop由HadoopCommon、HDFS、HadoopMapReduce核心部件組成。MapReducetsl是把以往通用的以MPI/PVM為基礎的并行計算技術理念加以簡化和提煉后,形成的能并發處理海量數據的并行編程模型,最早由Google于2004年提出。以此為基礎,Hadoop實現了海量數據的管理和分布式數據處理,使傳統的分布式計算中的數據分割和錯誤管理等復雜問題解決于系統內部,從而取得較好的松耦合型數據處理效果和系統伸縮性。
CitrixVDI由XenDesktop和XenApp組成,構建在Xen虛擬機上。XenDesktop技術將操作系統的安裝和運行分離開來,當用戶登錄桌面時,實際登錄的是Desktop服務器,服務器這時為用戶開辟了一個空間,在這個空間中調入操作系統的內存映像供用戶使用,所以后臺只需管理一個桌面系統。XenApp技術將應用與操作系統分離,應用安裝在App服務器上,用戶打開一個應用實際上是在App服務器上創建一個應用程序的實例。
上述laaS、PaaS組件中除了CitrixVDI外,KVM、Xen、Fedora、OpenStack、OpenShift、Hadoop皆是開源產品,這將大大降低建設高校私有云平臺的成本。
高校云平臺的最上層主要提供四種服務:在線應用、云計算輔助教學(CloudComputingAssistedInstructions)、高性能計算(HighPerformanceComputing)和虛擬教室。
在線應用提供最為接近用戶的服務——B/S應用程序。在OpenShift的支持下,原先的門戶網站、辦公自動化系統、數字圖書館等信息系統都可以移植到云平臺下。CCAI主要構建在OpenShift之上,教師利用云平臺提供的服務,構建個性化教學的信息化環境,教育者充當云服務管理者的角色,整合、歸類和管理教育信息資源,開展教學設計,優化教學過程,提高教學質量。Hadoop提供了HPC所需的計算和存儲能力,在線應用的集中和CCAI的推廣解決了信息孤島問題,使數據集成、資源共享成為常態。在此基礎上,可以使用HPC進行綜合數據分析、BigData挖掘,同時它也是一個廉價的科學計算平臺。虛擬教室由虛擬桌面和虛擬實驗室組成,虛擬桌面需要得到CitrixVDI的支持,實驗室都可從“云”中獲得。
除此之外,SaaS層還需要留出開放接口,以便云平臺為校園物聯網提供計算和存儲服務。
四、挑戰與建議
以上述私有云平臺框架為理論基礎,己開始落地實施:基于物理Fedora和KVM虛擬機的Hadoop系統己搭建完成,進行了初步的大數據處理工作,主要是云框架的應用和MapReduce算法的改進:OpenStack的安裝和對KVM管理的技術驗證工作己接近完成;OpenShift正處于部署實驗階段。
雖然云平臺的建設已開展部分工作,但仍舊面臨諸多挑戰。高校私有云有其自身特點:由于都是內部使用,所以不必考慮計費、多租戶等問題;大部分組件使用開源產品,雖然節約了成本,但是缺乏技術支持,需要進行長期的技術儲備;校內院系及各職能機構長期的各自為政會成為統一建設的人為阻礙,所以需要從校級高度成立專職的IT部門,對全校云平臺的建設進行整體規劃,尤其是中長期建設規劃,并從政策和經費上支持以云計算構建的公共服務體系,不斷提高數字校園水平。
由于云計算能帶來信息資源、計算資源、存儲資源甚至包括軟件資源在內的快捷方便的共享,所以在云平臺建設中,初期立足本校資源,長期應校校聯合,建立起較大的區域云或院校聯合云,以達到各高校IT資源的有效共享和應用。
五、結束語
云計算應用于數字校園是高校信息化建設的里程碑,使用開源項目構建私有云平臺既能解決信息化建設中的現存問題,又能在獲得云計算優勢的同時將建設成本最小化。本文主要在這方面進行了研究,已開展的工作說明這個建設方向具有可行性,但同時也存在巨大挑戰,建設部門需充分發揮創新性與創造性,把握住云計算的實質內涵及發展趨勢,努力促進我國教育信息化建設和數字校園創新發展,爭取智慧校園早日實現。