朱凱 王亞君 王勤勇 佟鳳

摘 ?要:目前,開放教育處于轉(zhuǎn)型期的攻堅階段,數(shù)據(jù)治理是開放教育轉(zhuǎn)型期需要解決的一個重要問題。該文闡述了開放教育數(shù)據(jù)治理的背景,分析了國內(nèi)外教育數(shù)據(jù)治理的研究現(xiàn)狀,提出一種基于微服務的數(shù)據(jù)中心架構(gòu)方案,闡述了實現(xiàn)架構(gòu)的技術(shù)方案及其幾個關(guān)鍵活動,以北京開放大學為例,介紹了數(shù)據(jù)標準的制訂內(nèi)容,數(shù)據(jù)清洗與管理平臺的建設。平臺的成功上線驗證了技術(shù)方案的可行性,希望這些數(shù)據(jù)治理的關(guān)鍵活動能為教育領(lǐng)域的數(shù)據(jù)治理工作提供有益參考。
關(guān)鍵詞:開放教育 ?數(shù)據(jù)標準 ?數(shù)據(jù)中心 ?信息化平臺
中圖分類號:TP3 ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A文章編號:1672-3791(2020)10(b)-0055-03
Abstract: At present, open education is at the tackling phase of the transformation period. Data governance is an important issue that needs to be addressed. In this paper, the background and the current research situation of educational data governance is described. A data center technology architecture based on micro service is proposed. The technical scheme is described, taking Beijing Open University as an example. The content of the data standard is introduced. The construction of the information platform is explained based on data cleaning and management platform. The platform has been online. It can verify the feasibility of the technical scheme. It is hoped that these key activities of data governance can provide useful reference for education data governance.
Key Words: Open education; Data standards; Data center; Information platform
“百年大計,教育為本”,教育是民族振興、社會進步的基石。開放教育是教育體系中不可分割的一部分,2012年3所開放大學掛牌成立標志著開放大學踏上了轉(zhuǎn)型發(fā)展的新征程。在新的歷史時期,教育信息化成為教育工作重點任務之一,教育數(shù)據(jù)治理是教育信息化的重點任務之一,《教育信息化“十三五”規(guī)劃》等關(guān)于教育數(shù)據(jù)治理的政策文件密集出臺,為教育數(shù)據(jù)治理提供了歷史契機。當前,信息化新技術(shù)層出不窮,大數(shù)據(jù)技術(shù)是新技術(shù)中的重要一員,促進大數(shù)據(jù)發(fā)展行動綱要的有關(guān)政策密集出臺,自2015年9月5日,《國務院關(guān)于印發(fā)促進大數(shù)據(jù)發(fā)展行動綱要的通知》發(fā)布,教育大數(shù)據(jù)開始在戰(zhàn)略層面推進教育領(lǐng)域全面深化改革與創(chuàng)新發(fā)展。隨著教育信息化和新技術(shù)的雙重疊加,利用新技術(shù)開展教育數(shù)據(jù)治理成為重要研究領(lǐng)域。論文開展數(shù)據(jù)治理關(guān)鍵活動研究與實踐,旨在為開放教育數(shù)據(jù)治理提供有益參考。論文認為數(shù)據(jù)治理是將繁雜散亂的數(shù)據(jù)按照特定標準進行統(tǒng)一存儲、管理,可以按某個需求快速完成存量數(shù)據(jù)的分類、檢索,實現(xiàn)數(shù)據(jù)全生命周期管理的過程。
1 ?國內(nèi)外研究現(xiàn)狀
總體來說,我國開放教育數(shù)據(jù)治理任務艱巨,以國外的數(shù)據(jù)治理思想為依據(jù),成功案例數(shù)量有限,并且多為理論層面的價值討論。論文檢索CNKI文獻數(shù)據(jù)庫中與教育數(shù)據(jù)治理相關(guān)文獻,通過文獻研究發(fā)現(xiàn),教育領(lǐng)域數(shù)據(jù)治理研究起步較晚,對開放教育數(shù)據(jù)治理的研究成果數(shù)量有限,研究成果中理論研究內(nèi)容居多。
于江霞等人[1]在論文中設計了教學輔助平臺的整體架構(gòu)和功能模塊。沈霞娟等人[2]選擇國外5所頂尖高校進行案例剖析,為我國智慧校園的建設提供參考建議。張國寶等人[3]梳理了一種門戶網(wǎng)站的主要內(nèi)容,設計了門戶網(wǎng)站的主要功能。胡祖輝等人[4]說明了已經(jīng)投入應用的信息平臺的設計方案。杜婧等人[5]使用在線教育服務的關(guān)注點數(shù)據(jù)構(gòu)建了一種在線教育服務質(zhì)量模型。徐峰等人[6]分析了教育數(shù)據(jù)治理的問題,思考并提出深入應用等舉措以提升教育數(shù)據(jù)品質(zhì)的價值和意義。這些研究證明,教育數(shù)據(jù)治理是當前研究的重要領(lǐng)域之一,存在許多需要解決的問題。
2 ?開放教育數(shù)據(jù)現(xiàn)存問題
開放大學是實現(xiàn)開放教育的載體,在多年辦學歷程中積累了大量業(yè)務數(shù)據(jù),這些數(shù)據(jù)是學校的一種特殊資產(chǎn),對這些數(shù)據(jù)有針對性地進行分析有利于教學質(zhì)量的可持續(xù)完善。但是目前這些數(shù)據(jù)存在如下問題:一是信息化平臺重復建設,數(shù)據(jù)大量冗余,現(xiàn)有系統(tǒng)在結(jié)構(gòu)方面不能滿足大數(shù)據(jù)時代教育數(shù)據(jù)治理的需要。現(xiàn)存數(shù)據(jù)類型多樣,難以實現(xiàn)共享交換,不利于進行統(tǒng)一的管理。二是數(shù)據(jù)分散在不同業(yè)務系統(tǒng)平臺,信息錄入需要大量人工搬運,不僅增加了業(yè)務人員和教師的工作量,而且工作效率低下。三是人工進行數(shù)據(jù)加工,數(shù)據(jù)在錄入階段容易產(chǎn)生錯誤,導致數(shù)據(jù)不準確,數(shù)據(jù)需要共享時,容易造成系統(tǒng)間的數(shù)據(jù)沖突,影響業(yè)務的開展。四是多個平臺記錄大量類似數(shù)據(jù),造成存儲資源浪費,共享數(shù)據(jù)中心的建設使用對打通數(shù)據(jù)孤島起到了很大的促進作用,部分業(yè)務系統(tǒng)已經(jīng)可以通過共享數(shù)據(jù)中心實現(xiàn)數(shù)據(jù)交換,但仍存在多數(shù)業(yè)務系統(tǒng)沒有權(quán)威的服務接口標準,由于數(shù)據(jù)庫接口難以打通而擱淺數(shù)據(jù)共享。五是教育數(shù)據(jù)作為一種特殊的教育資產(chǎn),各部門在教育數(shù)據(jù)治理的概念上還未達成共識。
開放教育的學生數(shù)量巨大,不斷發(fā)展的業(yè)務加快了數(shù)據(jù)膨脹的速度,加大了數(shù)據(jù)不一致的程度,學習者對一站式服務平臺及個性化學習的需求越來越迫切,這些因素決定了開放教育對數(shù)據(jù)治理的標準要求,開放大學是以現(xiàn)代信息技術(shù)為支撐的新型高等學校,如果數(shù)據(jù)治理工作做得不到位,勢必影響開放大學的發(fā)展速度。針對開放大學在數(shù)據(jù)方面的現(xiàn)存問題,同時為適應大數(shù)據(jù)時代教育的發(fā)展需要,以北京開放大學為例,研究數(shù)據(jù)治理的關(guān)鍵活動,包括數(shù)據(jù)標準、數(shù)據(jù)管理平臺建設等。
3 ?數(shù)據(jù)標準
數(shù)據(jù)標準是數(shù)據(jù)治理的主要內(nèi)容之一,開放教育數(shù)據(jù)標準可以作為數(shù)據(jù)治理的一個獨立方向進行研究,是建立一套符合開放教育業(yè)務實際,涵蓋定義、應用層次的標準化體系,結(jié)合編碼規(guī)則、國家標準,形成主題標準、接口標準、代碼匯總,為實現(xiàn)數(shù)據(jù)交換提供規(guī)范化依據(jù),結(jié)合元數(shù)據(jù),提升數(shù)據(jù)的合規(guī)性,進而提升數(shù)據(jù)質(zhì)量,結(jié)合數(shù)據(jù)源歸屬、數(shù)據(jù)分布情況形成主題標準可以有效實施數(shù)據(jù)分布的規(guī)劃,實現(xiàn)定義統(tǒng)一、名稱統(tǒng)一、參照統(tǒng)一的目標,為業(yè)務系統(tǒng)的建設和使用提供指導和約束。開放大學的辦學規(guī)模與普通高校不同,學生數(shù)量大,國家開放大學注冊在籍學生至少有359萬人,學生特征多樣化,因此開放大學的數(shù)據(jù)量很大,擁有使用統(tǒng)一標準的數(shù)據(jù)可以保障教學健康發(fā)展。開放大學的課程學習是以在線網(wǎng)絡學習為主的混合式教學,保證大量課程資源的有序有效存儲管理利用對保證開放大學的教學質(zhì)量具有重要的戰(zhàn)略意義。使用統(tǒng)一標準的高質(zhì)量數(shù)據(jù)有利于完成對教師、學習者,全過程、全樣本、大數(shù)量的動態(tài)跟蹤,可以提升信息化對教研的支持質(zhì)量,提升師生的獲得感。許多高校已經(jīng)根據(jù)學校實際業(yè)務制定數(shù)據(jù)標準,使不同系統(tǒng)的數(shù)據(jù)元素得以統(tǒng)一定義,促進數(shù)據(jù)在不同系統(tǒng)的流通。
論文旨在以北京開放大學為對象研究數(shù)據(jù)標準,主要包括人員、課程和學習服務系統(tǒng)等相關(guān)數(shù)據(jù)集的標準,其中,人員包括教師、學生,課程涵蓋國家開放大學北京分部的課程及北京開放大學自主業(yè)務課程,學習服務系統(tǒng)包括多個學習平臺、教務管理系統(tǒng)、科研管理系統(tǒng)等,分3個級別對數(shù)據(jù)保密。在深入調(diào)研校內(nèi)相關(guān)業(yè)務部門工作內(nèi)容、業(yè)務流程前提下,制定了適合學校實際情況的數(shù)據(jù)標準基礎(chǔ)版:北京開放大學信息標準2018基礎(chǔ)版(主題標準)(以下簡稱主題標準)、北京開放大學信息標準2018基礎(chǔ)版(接口標準)(以下簡稱接口標準)、北京開放大學信息標準2018基礎(chǔ)版代碼匯總表(以下簡稱代碼表),整合了學校多個業(yè)務系統(tǒng)可以共享的主數(shù)據(jù),包含學分認證信息,完成了數(shù)據(jù)清洗,形成了統(tǒng)一數(shù)據(jù)庫,提高了數(shù)據(jù)質(zhì)量,可以以接口的方式共享主數(shù)據(jù)庫中的數(shù)據(jù)。代碼表是北京開放大學的元數(shù)據(jù)標準,實現(xiàn)了數(shù)據(jù)的描述、管理,為實現(xiàn)數(shù)據(jù)交換奠定了基礎(chǔ)。
根據(jù)標準完成了數(shù)據(jù)庫建設,可以識別過期數(shù)據(jù),粗略顯示數(shù)據(jù)生命周期,以接口標準為依據(jù),建設數(shù)據(jù)清洗與整合平臺,使用DCI工具實現(xiàn)數(shù)據(jù)的導入。以主題標準、代碼表為依據(jù),建設數(shù)據(jù)共享中心,實現(xiàn)學校數(shù)據(jù)信息源的統(tǒng)一、唯一。
4 ?數(shù)據(jù)中心
數(shù)據(jù)中心收集分布在各業(yè)務系統(tǒng)需要共享的數(shù)據(jù),以數(shù)據(jù)庫形式形成統(tǒng)一的公共數(shù)據(jù)庫,配合數(shù)據(jù)查詢手段為各業(yè)務部門提供全面、真實的共享數(shù)據(jù)接口[7-8]。數(shù)據(jù)中心的技術(shù)架構(gòu)見圖1。
5 ?技術(shù)實現(xiàn)
數(shù)據(jù)服務需要有信息化工作平臺的支撐,建立校內(nèi)一致的信息化視圖,實現(xiàn)數(shù)據(jù)可視化,加強業(yè)務部門之間信息聯(lián)動,根據(jù)北京開放大學實際業(yè)務流程,設計實現(xiàn)了校園信息門戶平臺、統(tǒng)一身份認證平臺、數(shù)據(jù)清洗與管理平臺。
開放教育的許多業(yè)務是多部門協(xié)作完成,存在許多數(shù)據(jù)轉(zhuǎn)換場景,數(shù)據(jù)治理中的數(shù)據(jù)轉(zhuǎn)換緊密圍繞業(yè)務實際,與業(yè)務部門多次調(diào)研熟悉業(yè)務流程。數(shù)據(jù)清洗與管理平臺是基本數(shù)據(jù)的共享轉(zhuǎn)換平臺,本著統(tǒng)籌集約的原則,解決多個應用系統(tǒng)之間數(shù)據(jù)交換和數(shù)據(jù)共享問題。數(shù)據(jù)管理平臺使用DCI工具,通過三步完成數(shù)據(jù)的抽取、清洗、轉(zhuǎn)換,以作業(yè)為單位,實現(xiàn)數(shù)據(jù)轉(zhuǎn)換的可視化。平臺建立了靈活、可配置的作業(yè)管理機制,現(xiàn)已新建200個左右作業(yè)。
6 ?結(jié)語
數(shù)據(jù)的有無問題在我國開放教育領(lǐng)域已經(jīng)幾乎不存在,但是隨著技術(shù)的進步,教育數(shù)據(jù)質(zhì)量并未同步得到改善。教育數(shù)據(jù)治理的研究成果有助于相關(guān)部門對現(xiàn)有信息系統(tǒng)及數(shù)據(jù)資源進行梳理整合,有助于提升學校信息化管理水平,進一步完善了學校信息編碼資源、網(wǎng)上辦事業(yè)務過程信息資源等信息資源的建設及共享方案。推動實現(xiàn)教學、管理、服務一體化,加快實現(xiàn)智慧校園建設。
論文闡述了教育數(shù)據(jù)治理的目標及意義,分析了國內(nèi)教育數(shù)據(jù)治理的現(xiàn)存問題,提出了基于微服務的數(shù)據(jù)中心框架,以北京開放大學為例,列舉了相關(guān)數(shù)據(jù)標準的制定,基于設計框架的信息化平臺建設。望論文的研究內(nèi)容能夠充實開放教育數(shù)據(jù)治理的實踐工作,增加相關(guān)部門對數(shù)據(jù)治理的關(guān)注度,促進開放教育數(shù)據(jù)可持續(xù)治理體系的形成。
參考文獻
[1] 于江霞,蘇愛遠.服務于英美報刊選讀的教學輔助平臺研究[J].現(xiàn)代教育技術(shù),2019,29(9):73-79.
[2] 沈霞娟,洪化清,寧玉文,等.國外智慧校園研究熱點與典型案例分析[J].現(xiàn)代教育技術(shù),2019,29(12):13-20.
[3] 張國寶,王志堅.智慧校園中服務融合門戶的內(nèi)容與設計[J].現(xiàn)代教育技術(shù),2019,30(1):79-84.
[4] 胡祖輝,朱俐,吳國慶.面向質(zhì)量監(jiān)測與預警的研究生教育管理信息平臺的構(gòu)建[J].現(xiàn)代教育技術(shù),2019,29(10):54-59.
[5] 杜婧,段江飛,李緋,等.側(cè)重用戶感知的在線教育服務質(zhì)量模型研究[J].現(xiàn)代教育技術(shù),2019,29(10):74-79.
[6] 徐峰,吳旻瑜,徐萱,等.教育數(shù)據(jù)治理:問題、思考與對策[J].開放教育研究,2018,24(2):107-112.
[7] 溫芳芳.我國政府數(shù)據(jù)開放的政策體系構(gòu)建研究[D].武漢大學,2019.
[8] 毛博.基于卷積神經(jīng)網(wǎng)絡的地震數(shù)據(jù)重構(gòu)與模型構(gòu)建研究[D].吉林大學,2020.