陳劍,張志華,伍乙生,傅志銘
(1.肇慶醫學高等專科學校 信息中心,廣東肇慶 526020;2.肇慶學院 信息中心,廣東肇慶 526061)
智慧校園,是充分利用互聯網技術和人工智能技術,在校園內及校園之間,構建互聯網體系,實現有效的數據共享和供需匹配,有效提升高校教學質量和科研能力,促進產學研一體化進程。早期的智慧校園是建立在校園網上的學籍系統、教務系統、選課系統、考試系統、電子圖書館系統、虛擬實驗室系統、內網博客論壇交互系統和資源下載系統等[1]。這些系統雖然都運行在統一的校園網硬件架構上,但功能與數據之間相對獨立,形成較為分散的系統架構。但隨著互聯網+校園架構逐漸成型,這些系統之間的數據交互需求逐漸增強,所謂智慧校園大數據,就是將這些系統的數據資源充分融合,形成校園網體系下的統一管理且可以得到有效挖掘的大數據系統[2]。
在此研究中,本文重點研究高校智慧校園大數據的產生機制和匹配可能性,從數據供求擬合方面進行數學建模,在仿真環境下論證該擬合方式的統計學價值和數據資產價值。
校園網內,用戶角色一般分為6種不同角色。
(1)本專科在校生
本專科在校生是一般高校內的最大群體,這類群體以受訓學習為主,其對校園網的主要需求,來自互聯網外網接入、選課及考試、電子圖書館期刊文獻下載、課件資源下載和虛擬實驗室等。在研究型高校理念普及之前,本專科在校生是高校業務的核心組成部分。
(2)碩博士研究生
隨著近年來碩博士不斷擴招,高校內碩博士全日制在讀學生不斷增加。與本專科在校生不同,碩博士研究生更多參與到高校的科研項目中,從事基礎研究工作。其對校園網的主要需求,來自電子圖書館期刊文獻下載、虛擬實驗室、開題立項報送審批和高校間互聯互通等。部分碩博士研究生兼任代課教師或政治輔導員。
(3)研究員及博士后在站
工作在高校設立的各實驗室、研究院所中的研究員和在站博士后等,雖然人數較少,但屬于研究型高校的核心生產力提供者。教授學者的課題多由這一角色完成。其對校園網的主要需求,來自虛擬實驗室、云計算資源申請、圖書館期刊文獻下載和高校間互聯互通,因為研究員和在站博士后需要頻繁出差,對公網接入校園網的VPN需求也較廣。
(4)代課教師及政治輔導員
代課教師及政治輔導員主要與本專科在校生發生數據聯動關系,其對選課及考試系統、課件資源上傳等有需求。
(5)教授學者
教授學者主要與碩博士研究生、研究員及在站博士后等有數據聯動關系,其對線上科研資源有需求。
(6)管理人員
管理人員負責校內的黨政、行政、教務和學生管理,對整體大數據進行管理,根據其職務不同,對各系統管理后臺有部分操作權限。
所以,以上角色之間的邏輯關系圖如圖1所示。
圖中,本專科在校生、教師及輔導員對教學型資源的需求量較大,研究員及在站博士后、教授學者等對研究型資源需求量較大,而碩博士研究生對二者的需求較為折中。
在智慧校園IDC機房作為核心背板的情況下,可以實現多種接入方式,如VPN接入、公網接入、校內網接入和各種堆棧型計算資源接入等[3]。IDC為整合型計算機網絡機房的英文縮寫,是將網絡控制設備和網絡管理設備整合到一個核心機房中構建的硬件系統,VPN為虛擬撥號接入的英文縮寫,該方式支持在公網內構建虛擬專用鏈接,確保數據在公網內傳輸過程的私密性。該交互模式如圖2所示。

圖2 智慧校園大數據的交互數據流
圖中,智慧校園與校園網在硬件和數據層面均為兩套系統,智慧校園提供校園內的計算資源、虛擬實驗室資源、電子圖書館資源和各種與智慧校園相關的管理信息系統的邏輯接入點,而校園網更多承擔了校園網的通訊功能,負責將學生及教職工宿舍、辦公室、教室、實驗室、電子閱覽室和各種機房等實現校內高速互聯[4]。所以,在數據鏈路層面,校園網數據從校園網通訊系統中進行傳輸,而在數據邏輯層面,智慧校園數據從智慧校園IDC邏輯架構中得到充分利用。
任何一種管理信息系統,以數據倉庫為基礎,在此基礎上進行數據治理、數據挖掘等人工智能計算,再通過LAMP服務系統對外提供服務。LAMP為操作系統、服務器軟件、數據庫平臺、腳本解釋模塊等服務和開發工具的集合體[5]。但當前大數據系統的核心發展方向,是將所有相關管理信息系統構成統一的獨立的大數據系統,相關的管理信息系統在該大數據系統中獲取數據,實現相關功能,如圖3所示。

圖3 智慧校園大數據架構升級策略
圖3(a)為傳統模式下的智慧校園大數據架構,該架構下每個管理信息系統幾乎都運作在獨立的系統架構下,不同管理系系統會構建獨立的數據倉庫系統,這就導致可能使用多個不同管理信息系統時,如使用教務管理系統、學生管理系統、社團管理系統和評教系統等,需要構建多種獨立的教師檔案和學生檔案,每次數據調整,均需要在多個系統中執行重復操作[6]。這一過程影響信息管理效率,還有可能造成疏漏。
圖3(b)為革新模式下的智慧校園大數據架構,在校園網中構建一個統一的數據倉庫系統,所有相關的管理信息系統均在該數據倉庫系統中進行數據增刪改查操作。
在校園網內搭建該智慧校園大數據系統,需要對智慧校園全部管理信息系統進行統一數據庫升級。如果采用一步到位的部署方式,勢必會導致校園網運行階段出現較長的停機維護期。而高校的運營環境,除服務本專科教育的相關管理信息系統存在寒暑假的修整期外,其他系統均需要全年不間斷運作。所以,需要設計一種分別對各管理信息系統升級的分步策略,確保每次系統升級的停機維護期均在可接受范圍內,且保證每個單一管理信息系統的升級過程不影響其他管理信息系統的運行[7]。所以,該升級在一般高校校園網內通常需要多步操作,如圖4所示。

圖4 智慧校園大數據系統搭建梯度
圖中,分為4個階段分別對各個管理信息系統進行數據管理模塊的升級,逐步實現上述管理信息系統的統一化獨立運行大數據系統的構建目標。該升級過程的核心原則是逐步將各管理信息系統的數據調用模塊進行升級,且分為以下4步分別完成。
第一階段:通過數據自動同步算法,梳理不同管理新系統中的數據表關聯性,構建自動同模塊,在其中一個數據表發生變更時,同步操作其他所有相關數據表。這會在不改變原有管理信息系統的前提下,實現數據的同步管理。
第二階段:合并相關數據表,在多個同等用途數據表中,保留一個中心邏輯數據表,將其他數據表使用數據查詢表代替數據邏輯表,最大程度實現數據庫的輕量化。
第三階段:將邏輯整理后的數據庫,形成重新構建的統一數據庫,將所有相關管理信息系統的數據庫鏈接進行重置,使系統平穩過渡。之后開發新管理信息系統時,也被要求在該數據庫上進行上層系統搭建。
第四階段:數據邏輯實現統一后,對數據的治理、安全管理等模塊,也進行進一步合并,使云計算和人工智能模塊也得到進一步輕量化處理。
上述每一階段的升級工作,均包含智慧校園系統內的每個管理信息系統的逐一升級,即在上述分步策略中,每個管理信息系統均經過4步升級,每次升級的實際操作調試時間均控制在1小時左右,可以利用夜間或假期等運行負荷較低的時間段進行相應升級改造工作。此舉可以基本確保各相關系統的同步改造。在此期間,新部署的系統,在開發階段也應滿足當時階段的智慧校園大數據架構建設目標,且在后續升級工作中,與其他管理信息系統同步升級[8]。
使用SimuLink網絡仿真測試平臺構建個案高校的網絡軟硬件系統,本專科在校生為16 720人,碩博士研究生1 055人,在站博士后65人,研究員169人,代課教師及政治輔導員2 080人,教授學者95人,管理人員150人。假定所有角色均有至少1臺接入終端,根據其不同需求,使用隨機數驅動模塊構建其仿真需求模型,對當前IDC硬件設備的服務能力進行測算。測算結果如表1所示。

表1 數據響應與數據庫規模的比較
表中,系統響應指各角色提交網絡需求后,智慧校園網絡對其需求的響應周期,單位ms;誤碼率指系統在數據治理和數據挖掘階段發生輸出錯誤的概率,單位%;數據庫規模指系統中用于存儲數據庫數據的硬盤空間總占用量,單位TB;查詢比指所有相關系統產生的總查詢數據表數據量與全系統邏輯數據表數據量的比值。該表數據展示結果表明,革新模式可使得智慧校園網絡內的數據庫運行效率顯著提升[9]。
同樣在SimuLink網絡仿真測試平臺下使用隨機數引擎進行仿真驅動,判斷不同需求下教學管理體系中多種角色的實際交互量,即每個角色內的個體在每天之中在智慧校園相關管理信息系統中的頁面跳轉量。因為數據響應周期變短,考慮到心里依從性和平均耐受時間的邏輯關系,學生、教師、研究生和其他角色的教學相關人員交互量均明顯提升[10],如表2所示。

表2 教學管理效果的比較(單位:點擊/人·天)
表中,所有角色之間并無交叉性,即從事代課教師工作的研究生在研究生中進行統計,從事代課教師工作的研究員在其他角色中進行統計,而學生角色特指本專科在校生。此統計標準下,學生交互量提升4.12倍,教師交互量提升4.99倍,研究生交互量提升3.60倍,其他交互量提升2.57倍。即該大數據技術革新后,智慧校園相關軟硬件在教學管理中的應用量會大幅度提升。
在SimuLink網絡仿真測試平臺下使用隨機數引擎進行仿真驅動,使用電子圖書館、虛擬實驗室、計算中心、資源共享站等關鍵線上科研資源的負荷量對科研管理效果進行比較。如表3所示。

表3 科研管理系統負荷的比較(單位:MBps)
表中,革新模式下,圖書館負荷增加3.45倍,虛擬實驗室負荷增加5.08倍,計算中心負荷增加3.73倍,資源共享站負荷增加4.90倍。即可認為該大數據技術革新后,高校科研工作對智慧校園的依賴性顯著提升。
采用“四步走”戰略,將當前分散在各獨立管理信息系統的數據庫進行充分整合,形成智慧校園統一化獨立運行的大數據系統,可以有效提升數據庫運行效率,壓縮系統響應時間,節約計算資源和存儲資源,同時,教學體系和科研體系對智慧校園大數據系統的依賴性會顯著增加,智慧校園系統對教學體系和科研體系的促進作用也會顯著增加。