顧秀君 張豪成
智慧校園是以物聯網為基礎的智慧化校園工作、學習和生活一體化環境,以各種應用服務系統為載體,將教學、科研、管理和校園生活進行充分融合。[1]在這種大融合的條件下,信息系統數量和規模不斷擴大,各系統之間的獨立性造成了用戶體驗差、信息無法共享等問題,導致信息孤島問題愈發凸顯。因此,有效解決校園信息孤島問題,成為當前中小學智慧校園建設的當務之急。
信息孤島從本質上看是由學校信息化過程中信息系統部署時各自為政、缺乏統一規劃造成的。因此,最為徹底的解決方法就是把現有的信息系統廢止,重新進行系統的規劃和設計,建立一個綜合型平臺。然而,現有的信息系統經過較長時間的使用和磨合,積累了大規模的有效數據,具有較好的適應性和穩定性,重新建設的成本較高。因此,如何低代價實現已有信息系統間的數據融通是中小學校亟待解決的關鍵問題。基于此,筆者認為可以從以下方面進行突破。
第一,基于數據倉庫技術的信息共享策略。在學校實際事務工作中,經常會出現跨應用平臺的數據共享不暢問題。如在評定學生的獎助學金時,需要學生的家庭信息、成績信息、消費信息、考勤信息等作為事實根據,并結合這些數據進行打分。學生的這些信息存放于多個校內應用系統,需要實現這些數據的共享、融合與互通。在目前分模塊管理的狀態下,直接讀寫學校內部各信息系統數據庫存在一定的安全管理風險,如果操作不當,可能會影響或甚至破壞原有系統的正常運行。那么,建立一個數據備份或者數據緩沖系統,使所需數據從源系統中獲取、復制、備份、集中,各信息系統之間間接實現信息共享,這其實就是數據倉庫的思想。[2]
數據倉庫和數據庫可以基于同一數據庫系統或軟件來實現(如MySQL、MSSQL、DB2 等),但兩者建立的目的完全不同。數據庫是實際應用系統中的信息存儲,是正在使用中的數據;而數據倉庫是數據庫的一個備份或鏡像,本質上是“過期”的數據。這些“過期”數據是根據我們的需求從“正在使用的數據”中抽取并重新組織的,可以來源于各個信息系統,以便綜合分析數據、進行決策。本質上來講,數據倉庫就是為信息共享而生的,是實現用戶身份數據和應用數據共享的最佳方式。
第二,基于前端數據采集技術的應用數據同步策略。建立數據倉庫僅僅是實現信息共享的第一步,最核心的操作是在數據倉庫中的數據表中填充實際內容。現在的信息系統大多采用B/S 構架,應用網絡爬蟲(又稱為網頁蜘蛛、網絡機器人)技術對校園信息系統數據進行集中采集不失為一種便捷、有效的方法。網絡爬蟲可以按照一定的規則,自動地抓取網頁信息的程序或者腳本。它只需要讀取和分析數據的前端呈現形式,不受數據的存放格式影響;具備在沒有數據字典和文檔的情況下直接獲取原有信息系統數據的能力,大大降低了數據融通的難度。周期性地調用爬蟲對各信息系統進行數據采集,保障了分析決策系統中數據的時效性,在一定程度上實現了數據倉庫與校園信息的同步。
第三,基于賬戶關聯和模擬登錄技術的單點登錄策略。校內各信息系統間要實現融合,形式上還須實現“一次登錄、多系統有效”的單點登錄功能。為此,我們應該重塑用戶身份認證體系,以便能自動取得用戶在各個子系統對應的權限。然而,修改各個子系統,廢除原有的身份認證系統,統一采用新認證體系授權,其推進難度較大。因此,建立新的認證體系最好不修改各系統原有的認證和登錄方式,只要能關聯對應權限即可。賬戶關聯的方法并不復雜,只要把各系統中原有的用戶授權信息(包括用戶名和密碼等)統一錄入新身份認證體系的對應用戶名下。于是,在新身份認證體系中登錄,就可以獲取到用戶在所有子系統里對應的賬號和密碼。
實現賬戶關聯后,要自動獲得對應系統的權限,也就是要能自動登錄到各信息系統。由于很多早期開發的系統并未遵循當下的標準授權方式(如OAuth2.0、Basic Auth),技術差異性很大,所以可以選擇和采用一些保守型技術手段來解決該問題。比如,桌面客戶端形式的模擬登錄,這實際上就是用程序來模擬人輸入賬號、密碼,以及鼠標點擊登錄按鈕等操作。
利用數據倉庫、前端數據采集以及模擬登錄等技術可以有效破解中小學校園信息孤島問題,對增強系統普適性具有積極意義,在實際應用中能有效節省用戶開支,改善用戶體驗,為大數據決策奠定適用性的管理增值基礎。