楊 威,楊陟卓
(1.山西師范大學網絡信息中心,山西 臨汾041004;2.山西大學計算機與信息技術學院,山西太原030006)
大學云架構與大數據處理建模研究*
楊 威1,楊陟卓2
(1.山西師范大學網絡信息中心,山西 臨汾041004;2.山西大學計算機與信息技術學院,山西太原030006)
本文簡要介紹了大學云架構與大數據處理的目的與意義。以山西師大園區云為例,概要介紹了大學云架構的方法,提出了一種支持大數據處理的校園云模型。重點討論校園大數據處理建模,大數據分析在學生成長、教師發展,以及提升學校服務能力等方面的作用。
云計算;大數據;學生成長;教師發展;智慧校園
大學云(Universities Cloud)是一種采用云計算技術,對教學、科研、行政、后勤等各種業務流程辦理和職能服務的園區云,也是學校各級部門可靠的基礎信息化服務平臺。大學云服務將產生大量的各種數據,云計算目前是大數據處理的基礎技術[1],采用云計算處理海量數據,提高管理與決策水平,是大學云架構的重點工作。
顯然,云計算、大數據等技術已成為高校生存與發展的基礎。大學云架構采用統一標準[2],不僅利于各種業務網絡與應用系統互連互通,避免產生“信息孤島”,也利于避免計算、存儲及網絡資源重復建設[3],節約資金及提高收益,還利于大數據處理,改善辦學績效及增強高校創新能力。
因此,大學云架構的關鍵問題是全面整合資源,優化云計算模型。也就是構建一種支持資源集約、信息共享、應用協同,以及大數據存儲管理及檢索使用的大學云。最優架構的大學云,是云計算、大數據與教育信息化的融合。這種融合,一方面規定了智慧校園高層劃分及各部分間的交互[4],另一方面決定了智慧校園應用系統的實施能力和發展空間。本文以山西師大園區云建設為背景,重點討論大學云架構與大數據處理建模等問題的解決方法。
大學云是智慧校園建設的核心部分,是一個復雜的系統工程。該工程側重六個方面:第一,優化整合學校各種管理信息系統和協同辦公系統,建立統一基礎數據庫、數據交換系統、統一信息門戶及統一身份認證等[5],消除信息孤島。第二,完善高校決策支持系統的模型庫、數據庫和知識庫建設,通過大數據分析,實現學校發展的智能決策。第三,優化整合網絡課程、精品資源共享課和視頻公開課及微課等資源,構建網上網下有機協同的智慧學習環境。第四,優化整合飯卡、洗浴卡、水卡、門禁卡、借閱證、上機卡等校園各類卡片,實現校園一卡通。第五,完善圖書館資源數字化管理,支持師生泛在數字化閱讀與在線討論。第六,優化整合多媒體視聽教學與微格教學設施,支持MOOC的開發與應用。按照以上要求,大學云計算體系結構與功能,如圖1所示。

圖1 大學云計算體系結構與功能
從圖1可以看出,大學云主要由基礎設施、資源平臺、應用平臺和服務門戶構成。基礎設施包括了各種服務器、存儲器、網絡設備(交換、路由、安全等)和操作系統及工具軟件等設施。采用虛擬化軟件 (如VMware vSphere 5.5),對云基礎設施進行集群架構與管理[6];按照業務所需資源量,將虛擬服務器與虛擬存儲器彈性適配與調度[7],由此形成大學云資源平臺。在資源平臺部署校園應用軟件,包括教務管理系統、學生管理系統、科研管理系統、教工管理系統、資產設備管理系統、財務管理系統、后勤服務管理系統、圖書文獻管理系統、教學信息化與網絡學習系統、協同辦公系統、平安校園監管系統、校園一卡通系統、統一身份認證系統、上網行為管理系統、網絡運維支持系統等。這些校園應用系統,構成了大學云應用平臺。
大學云應用平臺,通過數據交換系統(多個虛擬主機)接口,將各種數據庫與各種應用系統適配連接,實現了資源集約、信息共享及應用協同。云應用,一方面通過面向師生信息服務接口,建立了一站式校園信息服務門戶。師生可通過該門戶,依據本人權限進行各種功能操作。另一方面,通過面向大數據分析與智能決策服務接口,建立了一站式校園決策支持門戶。學校各級領導(或相關責任人),依據本人權限進行各種大數據分析操作。通過大數據分析,實施教學、科研與后勤服務等事務處理的決策支持。
隨著大學云建設與應用,大量數據來源于管理信息系統數據庫與日志庫、圖書文獻庫與日志庫、校園一卡通數據庫與日志庫、網絡行為與管理日志庫、平安校園視頻庫與日志庫、多媒體及微格教學視頻庫與日志庫、網絡學習資源庫與日志庫、辦學決策知識庫和模型庫及決策支持日志庫等。數據類型繁多,主要有文本、數值、圖形、圖像、標簽等。數據處理速度快,如管理信息系統數據庫、一卡通數據庫等,數據處理均有較高時效性。很多數據表現出低價值密度,如各種視頻庫、日志庫等。這些數據完全符合大數據的4V(Volume,Variety,Velocity 和Value)特征[8]。
校園大數據可分為結構化數據與非結構化數據兩類。結構化數據主要包括各種管理信息系統數據庫(關系數據模型)、能夠變換為關系數據表單的各種日志庫。非結構化數據主要包括圖形圖像、音視頻(微格教學視頻、精品資源共享視頻課、微課程視頻、校園監控視頻等)、Web文檔(HTML與XML網頁)、課件文檔(瀏覽器可打開的Word、PPT、PDF等)、工作文檔(如年度計劃、工作總結、項目研究、成果報告等電子文檔)。結構化數據處理,常用數理統計模型與算法 (如回歸分析,最小顯著差數法、最小顯著極差法等)。非結構數據處理,常用文檔語義表示與索引、文本處理與分析[9]、內容摘要等工具。校園大數據處理建模,直接影響著學校發展決策的水平。
在校園云的環境中,如數字化迎新、數字化學習(網上選課、學籍管理、網絡學習、在線討論等)、數字化生活(校園刷卡吃飯、洗浴、用水、進門、借書、上機、體育運動,以及社團與學術活動等)的每一個過程中,均有大量的數據記錄了學生成長。如圖2所示。對這些數據進行深入分析,對學生成長及改善學校決策績效[10],具有以下作用。
(1)學生入學與學習數據分析。整合學生入學情況和在校學習情況等數據,深入分析與了解不同生源地、不同單科成績、不同專業、不同個性特征的學生在校期間學習表現,為招生部門優化招生措施提供決策支持。
(2)學生專業學習數據分析。整合能夠反映學生在校的學習、研究和參加活動(如課程學習、校園學術活動等)等多種數據,持續、系統地分析每個學生的專業學習行為、課程測驗與作業完成、課程考試成績、項目申請與結題、學習興趣與意見等數據,深入了解學生專業學習中的問題,為學習績效改善提供個性化服務,為優化人才培養方案提供決策支持。

圖2 支持學生成長的大數據處理模型
(3)學生在線學習與圖書借閱數據分析。完善“在線學習管理系統”的學習軌跡記憶功能,能夠跟蹤學生的學習軌跡。深入分析學生在觀看課程視頻、網絡課程學習、網絡資源瀏覽、在線討論發言、完成電子作業等項目上花費的時間差異。為優化網絡學習資源開發與購置提供決策依據。統計學生訪問圖書館、借閱圖書與文獻等數據,分析學生網上、網下學習時間分配情況,分析網絡學習資源與館藏圖書文獻資源配置情況,為優化電子與紙質資源最佳互補提供決策依據。
(4)學生就業與深造數據分析。整合專業教育、教育實習、校園招聘、社會招考、考取研究生、用人單位反饋意見等各類數據,深入剖析專業人才培養方案、學生就業或考研意圖及市場對人才需求等數據,優化人才與市場對接機制、完善專業課程學習與考研對接機制,與為學生考研提供個性化指導服務,為畢業生提供個性化就業指導服務。
教師是學校發展的中堅力量,教師的教學、科研能力高低,直接關系到專業人才培養質量與水平。在校園云的環境中,教師的教學、科研活動密切與數字化關聯,如人事檔案管理、綜合教務管理、科研管理等系統,這些系統均記錄了教師發展的大量數據。建立支持教師發展的大數據處理模型,是提升教師能力、促進教師發展的有效途徑。如圖3所示。

圖3 支持教師發展與提升學校服務能力的大數據處理模型
(1)教師基本數據分析。建立健全教師入職與從業檔案數據庫。深入分析教師的學歷教育背景、學習專業與學緣狀況(學士、碩士、博士的畢業院校,以及專業銜接與研究方向等),教師從事專業與學習專業的關系(一致、相近、跨專業等),以及教師專業職稱與學習專業、從事專業及興趣愛好之間的相關性等,優化教師招聘策略與措施,為學校人力資源部門招聘教師提供決策支持。
(2)教學信息化數據分析。按照教師信息化教學情況,整合綜合教務管理系統、課堂教學日志(學生填寫)、聽課日志(領導和專家填寫)等相關數據。深入分析教師制定課程教學計劃、編寫教案、課堂教學、實驗教學、編寫教材、制作課程資源、承擔校本研究課題、獲得教學成果與獎勵等數據,了解教師教學能力發展中的優勢與不足,為提升教師教學能力提供個性化服務。優化教師教學考核機制,為學校修訂教師及課程組教學能力提升措施提供決策支持。
(3)科研與服務社會數據分析。深入分析教師承擔科研項目(題目,級別、主要研究問題、方法措施,結題、結論等)、發表論文(題目、刊物級別、檢索、社會反響等)、出版著作(名稱、出版級別、發行量、社會反響等)、獲得科技成果獎勵、學術榮譽,以及進行的學術報告和外出學術會議等數據。深入分析教師科研能力、技術專長與社會兼職、承擔橫向課題、服務領域及業績等之間的相關性,了解教師科研與社會接軌,促進生產力發展的情況。優化教師科研考核機制,為提升教師科研能力提供個性化服務,為學校修訂教師及團隊科研能力提升措施提供決策支持。
通過以上三方面數據分析,優化高校個人與團體的教學、科研績效考評機制。為教師職稱評聘提供考評依據,為學校修訂師資隊伍建設的政策與措施提供決策支持。
校園后勤服務、資產設備使用,圖書文獻使用,以及網絡使用等領域,均與學校服務師生的能力密切相關。而服務能力提升直接與領導干部執行力相關。如圖3所示。因此,在這些領域開展大數據的分析,可助推學校服務能力提升。
(1)領導干部管理數據分析。完善黨政干部管理系統功能,深入分析干部任職時間、職務變動、年度計劃、工作總結、工作業績、取得成果與獎勵等數據。優化干部考核機制,為學校選拔、培養青年干部提供決策支持。
(2)校園后勤服務數據分析。后勤服務是智慧校園的重要組成部分,動態采集校園生活、安防、環保、資源與能耗等各個方面的數據,建立后勤服務保障系統。通過該系統,深入分析校園日常水電計量數據與水電節約數據,挖掘節能空間,完善節能管理措施。深入分析樓宇、房屋、設備、道路等日常修繕維護資源消耗與費用開支等數據,參考經驗,完善修繕管理措施。深入分析學生刷卡吃飯與餐飲管理數據,普查學生餐飲問題,如飯量持續減少是否身體不適、每日三餐與每周營養搭配是否符合科學飲食,飯菜價格波動是否合理等問題,及時優化健康餐飲管理措施。深入分析師生在校體檢與醫療數據,普查師生身體不適,及時提供進一步醫療建議。深入分析平安校園(所有樓宇內外、公共場所、道路、校園進出通道等)視頻數據與操作日志數據,依據事件發生,普查電子眼密度與位置是否符合平安校園的需求,及時提供電子眼維護與增補建議。
(3)資產設備使用數據分析。建構資產設備管理系統,完善儀器設備臺帳與使用日志管理,深入分析教學、科研儀器設備(含材料)用于學生實驗、師生科研和協同創新攻關實驗中,儀器設備使用完好與損害數據、夠用與缺少數據。深入分析專業課驗證、設計和綜合實驗項目實施與儀器設備使用率數據。深入分析實驗室占地面積與配套設施使用率數據。綜合以上三類數據分析結果,優化實驗室建設、儀器設備維修與更新管理機制,為資產與設備科學、合理使用提供決策依據。
(4)圖書文獻使用數據分析。整合校圖書館和學院、所資料室的圖書文獻資源,構建圖書文獻閱讀管理系統。通過學科資源服務系統,聚合與分享海量學科信息資源,精細化篩選適合讀者需要的資源。采用RFID裝置、紅外感應器和激光掃描器等技術構建智能書架與書桌,智能抓取數據,進行讀者行為學分析,獲取其閱讀喜好,為讀者推薦感興趣的資源。綜合以上兩類數據分析結果,優化圖書文獻流通管理機制,提高圖書文獻有效使用率,為滿足讀者需求購置圖書、期刊等資源提供決策依據。
(5)網絡行為數據分析。整合校園網流量控制、網絡管理、安全管理、用戶管理、上網行為管理及Web服務器等日志數據,建立網絡綜合日志管理系統。深入分析各類行為數據,包括用戶訪問外網的各種協議占用帶寬、持續時長數據,用戶連接與斷開網絡數據,用戶訪問網址、內容與持續時間數據,網絡交換、路由設備工作正常、故障及恢復時間數據,網絡交換與路由設備、服務器與主機系統等安全服務、遭受攻擊及修復時間數據,以及服務器運行的行為數據。綜合以上多種數據分析結果,優化網絡運維管理機制,優化網絡協議帶寬分配策略,優化網絡安全管控措施,優化節能管理措施,為校園網技術升級、增強網絡可用性提供決策依據。
我們在大學云架構與大數據處理方面進行了有益的初步嘗試。但仍有很多問題需要研究,如數據安全保護、個人隱私保護,挖掘關聯規則[11]、構建預測模型等,我們要從深層次推進智慧校園可持續發展,使師生能夠如影隨形地感知與體驗教育信息化的魅力。
[1][8]竇萬春,江澄.大數據應用的技術體系及潛在問題[EB/OL].http://www.cnki.net/kcms/detail/34.1228.TN. 20130627.1215.002.htm l.2013.06.
[2]何京翔.為云計算和大數據重塑數據中心[EB/OL]. http://www.chinacloud.cn/upload/2014-06/14060211 339145.pdf.2014.06.
[3][4]楊威,劉彥宏.高校智慧校園建設中的關鍵問題與對策[J].中國教育信息化,2013(23).
[5]湖南青果軟件有限公司.山西師大數字校園建設方案[D].2011.11.
[6][7]楊陟卓,楊威,王賽.網絡工程設計與系統集成(第3版)[M].北京:人民郵電出版社,2014.9.
[9]Zhizhuo Yang,Heyan Huang.Chinese W ord Sense Disambiguation based on Context Expansion[C]. Proceedingsof COLING-2012.
[10]沈富可.高校智慧校園的核心價值探索[EB/OL]. http://free.eol.cn/edu_net/edudown/eduedu/shenfuke.pdf. 2014.6.
[11]楊陟卓,黃河燕.基于異構關系網絡圖的詞義消歧研究[J].計算機研究與發展,2013(2).
(編輯:王曉明)
TP393
A
1673-8454(2015)01-0016-04
山西省高等學校科技項目(20110015)資助。