文/毛琦 劉俊 王齊
?
西安交通大學大數(shù)據(jù)環(huán)境下高校如何開展數(shù)據(jù)分析和應用
文/毛琦 劉俊 王齊

近年來,多領域數(shù)據(jù)的爆發(fā)式增長推動著信息技術和互聯(lián)網(wǎng)的快速發(fā)展,針對大數(shù)據(jù)的研究已經(jīng)成為國家基礎性戰(zhàn)略資產儲備和衡量國家競爭力的重要標志。加強信息化建設,加強數(shù)據(jù)的管理、掌握與加工,打造“數(shù)據(jù)中國”已成為“十三五”戰(zhàn)略規(guī)劃的重要組成。信息化已從各個層面被提升至國家發(fā)展戰(zhàn)略的高度。
高校信息系統(tǒng)一直是數(shù)據(jù)生產大戶。麥肯錫報告《大數(shù)據(jù):創(chuàng)新、競爭和生產力的下一個前沿》中認為,大數(shù)據(jù)是大小超出常規(guī)的數(shù)據(jù)庫工具獲取、存儲、管理和分析能力的數(shù)據(jù)集。統(tǒng)計顯示,僅2009年,美國國家教育部某信息系統(tǒng)的數(shù)據(jù)庫就膨脹至269 P 字節(jié)(1 個P 字節(jié)等于10億個M 字節(jié)),龐大的信息程度入選當年全美10 大數(shù)據(jù)生產貢獻量排名。在我國,超萬人的高校非常多,對于高校管理層來講,學籍信息、選課、成績單、圖書借閱歷史、上網(wǎng)時間分布、校內論壇交流、微博微信等互聯(lián)網(wǎng)登錄和吃飯刷卡消費等都會產生大量信息數(shù)據(jù);對于任課教師來說,個人工齡及薪酬管理、上課課件和視頻傳輸、項目管理及經(jīng)費應用等教學科研也會產生大量信息數(shù)據(jù);除此之外,還有高校教務及行政系統(tǒng)的設備管理、辦公自動化建設和學校主頁建設等信息數(shù)據(jù)。這些高校現(xiàn)存的龐大信息系統(tǒng)經(jīng)多年運營積累了很多基礎原始數(shù)據(jù),如何對這些原始數(shù)據(jù)開展深入的分析和應用,在統(tǒng)籌分析的基礎上加強學校的科學化管理,為學校發(fā)展決策提供數(shù)據(jù)支撐,成為擺在我國高校面前的一個重要課題和開拓性機遇。
面對信息時代帶來的各種機遇與挑戰(zhàn),為滿足人才需求,美國政府率先行動實施了一系列促進計劃,以鼓勵研究型大學設立跨學科的研究生專業(yè)課程、培養(yǎng)新一代數(shù)據(jù)科學家和工程師人才。例如,向加利福尼亞大學伯克利分校的計算開發(fā)項目投資1000 萬美元,項目旨在集成3 種數(shù)據(jù)轉化信息方法(機器學習、云計算和眾包); 為“EarthCube”項目( 旨在允許地球學家獲取、分析和共享與地球相關的信息) 提供第一階段的資金支持; 向一個研究培訓小組(支持一項教授大學生如何利用圖形和可視化工具解析復雜數(shù)據(jù)的培訓計劃) 提供200 萬美元的資助; 為一個由統(tǒng)計學家和生物學家組成的專業(yè)研究團體提供140 萬美元的研發(fā)資金; 召集各個學科和領域的研究人員,共同探討如何利用大數(shù)據(jù)轉變教育與學習模式等。美國已將發(fā)展大數(shù)據(jù)提高到國家戰(zhàn)略高度,以求繼續(xù)保持在國際上的科技領先地位。
在國內,從2012年開始,包括廈門大學、復旦大學、華東師范大學、上海財經(jīng)大學等在內的一批大學開始重視數(shù)據(jù)的深度分析和應用工作。比如華東師范大學利用預警系統(tǒng)跟蹤學生的餐飲消費數(shù)據(jù),跟蹤分析學生是否有經(jīng)濟困難,是否需要幫助;東華大學的智能實驗室項目,記錄實驗室使用的全過程數(shù)據(jù),形成動態(tài)表格,實現(xiàn)教育經(jīng)費使用的集約高效。
此外,中國科學院、復旦大學、北京航空航天大學等相繼成立了近十個從事數(shù)據(jù)科學研究的專門機構。

通過對網(wǎng)絡行為數(shù)據(jù)的分析來研判教育系統(tǒng)網(wǎng)絡輿情走勢的價值就凸顯了出來。
高校中的數(shù)據(jù)有很高的教學與科研價值,開展高校數(shù)據(jù)分析和應用工作可以輔助高校教學管理,甚至能改變教育領域傳統(tǒng)的授課模式、學習模式和管理模式。對現(xiàn)存海量原始數(shù)據(jù)加以分析,可將其應用在科研計算、招生推廣、學科管理、薪資統(tǒng)籌、學生信息跟蹤等多個方面。在新形勢的驅使下,多數(shù)高校已經(jīng)形成共識,在信息爆炸的時代,開展數(shù)據(jù)的深度分析和應用工作,對高校的發(fā)展而言是非常有必要的一項重點基礎工作。
1.學校科學決策,需要數(shù)據(jù)深度分析和應用的輔助。
對于大量業(yè)務數(shù)據(jù)進行深度分析和應用的核心驅動力是輔助高校決策支持。這種基于預測的數(shù)據(jù)分析與應用體系成功的關鍵在于它們是建立在海量數(shù)據(jù)的基礎之上。此外,隨著高校數(shù)據(jù)分析及應用體系積累的原始數(shù)據(jù)越來越多,通過跟蹤記錄分析找到最好的預測模式,可以對高校運轉的各領域提供決策支持,具體而言,對高校預測招生生源情況、就業(yè)情況,預測在校學生的各種需求情況、教師的科研項目管理、教職工人事信息管理以及學校的將來發(fā)展狀況等方面都能起到數(shù)據(jù)支持與趨勢研判的前瞻性輔助支持。
2.教學質量評估,需要科學的數(shù)據(jù)深度分析和應用。
教學評估是每個高校定期要做的工作,把數(shù)據(jù)分析技術引入到教育領域的評估系統(tǒng)中,不僅提高了教育管理的科學性,而且增強了教育數(shù)字化建設的實效性。將基于海量數(shù)據(jù)挖掘的智能算法應用于教學質量評估中,從教師教學的效果、多媒體課件的使用、學生和教師的互動、教學與教學場所等因素中找出其中的內在聯(lián)系,能為教學部門提供決策支持信息,為教師提供準確的反饋信息,使之更好地開展教學工作,提高教學質量。
3.教師教學能力的提升,需要數(shù)據(jù)支持。
過去的教學因為沒有大量數(shù)據(jù)的支撐,該教什么全憑教師跟著感覺走。現(xiàn)在,通過深度分析學生在觀看網(wǎng)絡教學視頻過程中的關注頻次和瀏覽量,分析得出學生感興趣、或者難理解的課程關鍵節(jié)點,幫助教師有的放矢地改進教學重點、確定教學難點,勢必會引導教師改革教學方式。
4.校園網(wǎng)絡信息管理及分析,需要數(shù)據(jù)深度分析和應用的支撐。
在現(xiàn)代信息高度發(fā)達的年代,網(wǎng)絡輿情研究工作對高校政治思想教育工作和高校教育環(huán)境穩(wěn)定的重要性不言而喻。特別是隨著Web2.0時代的進一步推進,在高校管理當中,校園網(wǎng)BBS、微博、微信等新媒體正大行其道,“圈子”模式的交流方式為校園網(wǎng)絡輿情分析和突發(fā)事件網(wǎng)絡疏導增加了困難,正因如此,通過對網(wǎng)絡行為數(shù)據(jù)的分析來研判教育系統(tǒng)網(wǎng)絡輿情走勢的價值就凸顯了出來。
西安交通大學的信息化建設起步于上個世紀90年代初,是國內較早開展信息化建設的高校之一,目前學校信息化建設進程中的信息數(shù)據(jù)建設大致完成了兩個階段的工作:簡單的資源“數(shù)字化”(主要以大量的文字和數(shù)字資源上網(wǎng)為標志)以及業(yè)務工作的“流程化”。期間,學校建設了辦公自動化系統(tǒng)、科研系統(tǒng)、教務系統(tǒng)等各類業(yè)務工作系統(tǒng),傳統(tǒng)的部門業(yè)務工作開始通過網(wǎng)絡進行辦理。
現(xiàn)階段,業(yè)務工作的“流程化”產生了大量的業(yè)務數(shù)據(jù)信息,而相關部門對這些數(shù)據(jù)信息的需求催生了業(yè)務數(shù)據(jù)的“共享化”需求。從使用研發(fā)層面,所謂的業(yè)務數(shù)據(jù)的“共享化”也就是應用系統(tǒng)與數(shù)字資源的整合優(yōu)化。我校在數(shù)據(jù)“共享化”方面做出了一些有益的嘗試,打通了科研和財務系統(tǒng)的數(shù)據(jù)接口,實現(xiàn)了科研、財務一站式服務;建立了移動校園門戶,整合了科研、財務、OA、圖書館等業(yè)務系統(tǒng)的數(shù)據(jù)以及部分教務系統(tǒng)的數(shù)據(jù)。
然而,當前我國絕大多數(shù)高校在數(shù)據(jù)分析與應用層面遇到了類似的發(fā)展困境:當前高校還沒有在真正意義上將整合的數(shù)據(jù)分析和應用提升到學校發(fā)展戰(zhàn)略的層面上來考量。比如,在數(shù)據(jù)管理方面,多數(shù)高校還存在數(shù)據(jù)口徑不一致、各部門獨立發(fā)布和使用數(shù)據(jù)的現(xiàn)象,這就忽略了各口徑間數(shù)據(jù)的聯(lián)動效應,損失了數(shù)據(jù)關聯(lián)背后產生的巨大應用價值,不利于學校形成大數(shù)據(jù)格局。具體表現(xiàn)在:
1.數(shù)據(jù)整合程度不高,仍然存在數(shù)據(jù)孤島。
當前部分高校業(yè)務部門之間的信息缺乏統(tǒng)一規(guī)劃管理,導致各業(yè)務系統(tǒng)之間無法共享數(shù)據(jù),信息系統(tǒng)資源相互獨立,數(shù)據(jù)的一致性得不到保證,嚴重影響了跨部門之間的業(yè)務協(xié)同,造成了存儲系統(tǒng)的利用率不均衡和存儲空間的浪費。信息“孤島”難以對數(shù)據(jù)進行沉淀、積累、匯總和再分析應用,無法從中進行深度挖掘形成有價值的信息。
2.各部門各自為戰(zhàn),數(shù)據(jù)口徑不一致。
高校的運轉需要各個業(yè)務部門的協(xié)同配合,在當前高校管理過程中發(fā)現(xiàn)各業(yè)務部門在使用和共享既定業(yè)務數(shù)據(jù)時,普遍存在各自為戰(zhàn)的情況,導致數(shù)據(jù)口徑不一致,容易在學校信息管理中造成混亂。同時,這一現(xiàn)狀也直接導致學校無法利用有效的數(shù)據(jù)分析解決管理中遇到的實際問題,無法挖掘現(xiàn)在擁有數(shù)據(jù)中潛在的價值。例如,高校的校友系統(tǒng),無法與就業(yè)、招生、本科生管理、研究生管理等系統(tǒng)進行數(shù)據(jù)共享,造成了校友身份信息的不完整、不統(tǒng)一等問題,甚至部門在完善信息時還需要人工手動確認數(shù)據(jù)的情況,為校友工作上帶來了巨大的困難和繁冗的重復性工作,進行數(shù)據(jù)分析更是無從談起。
3.沒有歸口管理,尚未形成機制。
隨著近年來高校信息化建設的逐步發(fā)展,各高校管理口的業(yè)務部門積攢了大量的原始數(shù)據(jù),然而當前的高校數(shù)據(jù)管理體制沒有對所積攢出的零散原始數(shù)據(jù)進行歸口管理,缺乏協(xié)同響應的機制,無法對數(shù)據(jù)產生的標準、存放、使用、維護以及開展深入數(shù)據(jù)服務等應用進行統(tǒng)一的指導和規(guī)劃。因此,當前高校的數(shù)據(jù)分析和應用工作僅僅停留在各業(yè)務系統(tǒng)之間進行簡單數(shù)據(jù)交換的原始階段。
1.在已有的信息化建設成果的基礎上,構建全面互補的高校數(shù)據(jù)分析與應用管理體系。
經(jīng)過多年的信息化建設,不少高校已基本形成了包括組織管理、技術保障、運行維護等在內的信息化管理運行體系。因此,在大數(shù)據(jù)時代到來之際,在加快推進高校信息化建設的關鍵點上,要充分利用已有的信息化建設成果,進一步推進建立以主管校領導牽頭的信息化建設與管理領導小組,明確學校信息化推進的責任部門,制定與信息化建設相關的制度法規(guī),進一步開展全面互補的高校數(shù)據(jù)分析與應用工作。通過信息化標準規(guī)范的制定、采納和應用推廣構建高校信息化建設標準規(guī)范體系,完善信息化項目管理體系及信息化運行維護、檢查評估機制,迎接大數(shù)據(jù)時代的到來。
2.加強對已有數(shù)據(jù)的整合、分析與應用,提高數(shù)據(jù)對高校事務決策的輔助參議功能。
不少高校在初探信息化推進過程中產生了大量零散式、孤島式的數(shù)據(jù)信息,這類冗余信息的堆砌僅僅實現(xiàn)了高校信息數(shù)據(jù)管理中留存?zhèn)渫墓δ堋谂挪楝F(xiàn)有信息化建設進展的基礎上,集成高校辦公自動化、科研管理、財務管理等重要校務管理信息應用系統(tǒng)數(shù)據(jù),統(tǒng)籌整合、深入分析,將簡單堆砌的數(shù)據(jù)轉化為輔助高校決策的有力支撐例證,為學校教學、科研、管理和服務水平的提升以及進一步數(shù)據(jù)分析、整合、共享之路打下堅實基礎。
3.重視高校信息化工作的統(tǒng)籌指導和戰(zhàn)略規(guī)劃。
著力加強數(shù)據(jù)的分析與應用;著力增強網(wǎng)上輿論工作的主動性和創(chuàng)造性,承擔主要工作包括:
(1)數(shù)據(jù)分析與應用工作:制定學校數(shù)據(jù)發(fā)展規(guī)劃及相應數(shù)據(jù)標準;推動數(shù)據(jù)收集、存儲、分析和應用工作;學校綜合數(shù)據(jù)庫的建設、維護、管理工作;各級各類教育統(tǒng)計數(shù)據(jù)匯總、上報工作;數(shù)據(jù)統(tǒng)計服務工作,教育統(tǒng)計分析和評價報告撰寫工作,為學校宏觀管理與科學決策服務。
(2)學校信息化推進與實施工作:制定、推廣和實施學校各類信息化標準,開展標準應用的相關工作;學校教育信息化的發(fā)展規(guī)劃工作;組織、協(xié)調和推進全校各單位教育信息化的建設工作;綜合校務平臺等軟件項目的開發(fā)、評測工作。
(3)網(wǎng)絡輿情管理工作:網(wǎng)絡輿情的搜集采集,預警信息的提供;輿情信息匯編的制作和發(fā)布;不良信息處置,網(wǎng)絡突發(fā)事件應急響應。
(4)公共信息服務工作:學校門戶網(wǎng)站的內容管理和日常保障工作;信息技術培訓工作;校級公共信息服務保障工作。
(5)信息資源開發(fā)工作:網(wǎng)絡教育教學資源的開發(fā)、建設和發(fā)布等工作。
基于大數(shù)據(jù)的分析管理在高校應用中面臨著機遇與挑戰(zhàn)并存的現(xiàn)狀。隨著“數(shù)據(jù)中國”的深入開展,高校教育管理的信息化、數(shù)據(jù)化將成為不可逆轉的趨勢,挖掘教學數(shù)據(jù)深層次的價值并使其為學校發(fā)展決策服務是高校數(shù)據(jù)管理的重要任務。另一方面,以上文中所提到的當前所存在的問題在我國高校現(xiàn)今數(shù)據(jù)發(fā)展的探索過程中具有普遍性,如何結合本校實際情況進一步推進信息化進程和大數(shù)據(jù)挖掘程度還有待深入探索、修正。
(作者單位為西安交通大學數(shù)據(jù)與信息中心)