999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

大數據時代下教育基礎信息庫整合研究

2017-05-03 20:14:49鄧學銘
廣西教育·C版 2017年2期
關鍵詞:大數據

【摘 要】本文以廣西為例,以教育基礎信息庫為研究對象,深入分析現有信息數據庫運行的現狀與存在問題,提出基于教育事業統計年報的基礎信息庫整合建庫模式,并通過構建基于互聯網的交互性查詢平臺,實現教育數據的開放共享,充分發揮教育大數據的價值。

【關鍵詞】大數據 教育基礎信息 整合建庫 數據共享

【中圖分類號】G 【文獻標識碼】A

【文章編號】0450-9889(2017)02C-0006-04

目前,大數據已經在教育領域,特別是在人才培養方面產生了深遠的影響,但在教育基礎信息庫的應用建設方面,進度相對滯后于教育主管部門、研究機構與社會公眾對教育數據日益劇增的需求,信息孤島突出、系統易用性差、數據共享不足、深層次的應用缺乏等問題亟須解決。在大數據時代下,構建教育基礎信息庫和具有開放性、交互性的信息查詢平臺已成為教育研究領域中的熱點、難點、重點問題。因此,本文深入分析當前教育基礎信息庫存在的問題,通過將近十年省級教育基礎信息整合建庫的研究,系統地分析和闡述信息庫整合建庫的方式,并根據指標的內涵和相互的關聯性,研發基于互聯網的數據查詢平臺,進一步促進了數據的開放與共享。

一、大數據的起源與發展

大數據一詞出現于1997年,由NASA研究人員Michael Cox 和David Ellsworth第一次使用該詞描述20世紀90年代出現的數據方面的挑戰。2011年,著名的管理咨詢公司發布《大數據:創新、競爭和生產力的下一個前言》,最早發現大數據潛在的商業價值,并提出相關的關鍵技術、應用設想和對應策略。隨著Viktor Mayer-Sch?nberger和Kenneth Cukier《大數據時代—生活、工作與思維的大變革》一書的出版,通過公共衛生、貿易領域應用的鮮明案例,列舉出了人們日常生活、工作與思維中所面臨的數據大變革,將大數據與日常生活和商業緊密地聯系在一起,大數據的思維與理念瞬間席卷世界,許多國家已經將大數據作為增強國家核心競爭力的重要手段,上升到國家發展戰略中。美國發布了“大數據研究和發展計劃”(Bid data research and development initiative),宣布投資2億美元,正式啟動“大數據發展計劃”,計劃在科學研究、環境、生物醫學等領域利用大數據技術進行突破。日本于2013年6月發布《創建最尖端IT國家宣言》,闡述了2013—2020年以發展開發公共數據和大數據為核心的日本新IT國家戰略。我國于2015年印發《促進大數據發展行動綱要》,指出“數據已成為國家基礎性戰略資源,大數據正日益對全球生產、流通、分配、消費活動以及經濟運行機制、社會生活方式和國家治理能力產生重要影響”。

許多高校、研究機構、企業公司也都紛紛主動擁抱“大數據時代”,各種基于大數據的研究成果、應用和技術不斷涌現。中國貴陽成立了全國第一家以大數據命名的交易所,大數據交易所將積極發揮貴陽在大數據領域的政策優勢、數據清洗建模優勢、數據金融衍生品設計的優勢等等,連通大數據的供需雙方,讓數據互相碰撞,產生聚變結果,讓數據變成政府決策、企業經營的第一決策要素。在教育領域方面,大數據已經在在線教育方面積累了許多成功的經驗,作為線下課堂教育活動開展的重要手段,通過海量數據,可以甄別不同學生在學習過程中存在的差異,并針對性地開展個性化的教學輔導活動等,真正實現因材施教的教學理念。這種以大數據為基礎,教學研究與教學產品研發緊密耦合,最終推動教育向個性化和適應性發展。

二、大數據時代下基礎信息整合的必要性

隨著數據爆炸性的增長,大數據已經對教育、醫療、金融、經濟、社會等各個領域都產生了顛覆性的影響。在數據大規模的應用下,如何確保數據的可靠性就成為研究人員所面臨的一大挑戰。研究表明,為了充分發揮大數據的優勢和價值,確保數據的可靠性,首先就需要構建一個統一、完整、高效、準確的基礎信息庫。在科學數據方面,白如江、冷伏海指出“大數據”日趨發展的今天,整合集成科學數據,實現科學數據共享與互操作性,構造基于科學數據的、開放協同的科學研究新范式具有重要的意義。在教育信息化方面,左明章、鄧果、李莎莎研究表明隨著信息化進程的不斷推進,教育主管部門、教育研究機構和人員、社會公眾對教育基礎信息的需求急劇增長,建設一個完備的教育基礎信息數據庫來滿足社會需求,就成為當前教育信息化建設的重要任務之一。在國家治理方面,梁芷銘提出數據整合是實現國家治理主體智能化的重要途徑,需要填平存在于不同地區、不同領域、不同部門之間的“數字鴻溝”。

因此,基礎信息的整合建庫是刪除冗余數據,提高數據質量,消除信息孤島,促進異構數據源整合的重要途徑,是確保數據的可用性、一致性、完整性、準確性的必要保障。是充分發揮大數據的各項技術,深度挖掘數據潛在價值的重要前提。

三、我國教育基礎信息庫現狀研究

我國教育信息庫的建設隨著信息技術的發展而不斷完善,為了準確掌握各級各類教育事業發展現狀、存在問題,甄別發展風險,保障教育發展量質并重,各級教育行政部門針對不同的需求,分別構建了多樣化、多層次、多類型的教育數據統計平臺。教育數據不斷積累,已經初步具備大數據的4V典型特征:Volumn(大量)、Variety(多樣)、Velocity(高速)、Value(價值)。即數據的規模巨大,復雜程度高,高效的分析處理速度和蘊含著巨大的價值。

(一)涵蓋各級各類教育事業發展的綜合數據統計年報初步搭建

隨著信息技術的發展,教育基礎信息庫的建設已經取得了一定成果,我國已經建設了涵蓋高等教育、中等職業教育、基礎教育的教育事業統計年報。教育事業統計年報由教育部發展規劃司負責統籌管理,擁有報表97張。從教育類別來看,基礎教育、中等職業教育和高等教育分別擁有38張、25張和34張報表;從指標內容來看,統計年報中擁有描述學校基本信息6張,學生與教職工情況表分別為39與32張,反映學校資產與信息化情況15張,體現其他內容報表5張,見表1。年報數據采集于每年的9—10月,是反映學校當年各項辦學指標的關鍵數據。由于該統計年報采取由下至上逐級填報審核匯總,指標涵蓋范圍廣,數據準確程度高,并作為國家教育統計的法定數據,每年定期公布在國家和各省、市、自治區的《統計年鑒》《教育統計年鑒》上,作為研究各級各類教育改革與發展的重要依據。教育事業統計年報為省級教育基礎信息庫的建設奠定了基礎。

(二)多層次、多類型、多樣化的教育信息平臺相互補充

針對教育發展過程中的多樣化需求,我國各級各類教育行政機構研發多種數據統計平臺應用,如應用于高等職業院校評估的《高職院校人才培養工作狀態數據采集與管理平臺》,平臺體系擁有一級指標11個、二級指標70個、近千個數據指標,該平臺已經成為評估專家組衡量一所高職院校人才培養工作成效和辦學特色的重要途徑,也是學校做好日常管理監控的重要手段;用于央財項目日常管理的《專業建設與職業發展管理平臺》,與現行各數據采集平臺的最大區別在于,《專業建設與職業發展管理平臺》是從專業層面反映一個高技能人才從學生—學徒—熟手—能手—大師的成才過程,不是某一時間點上的數據采集或統計數據填報,而是日常的實時活動記錄;用于學生學籍管理的《中國高等教育學生信息網》,是我國高等教育學歷證書查詢的唯一網站。不同的教育信息統計平臺相互補充,在教育的發展過程中扮演了越來越重要的角色,形成了我國教育信息平臺多層次、多類型、多樣化的特色。

四、教育基礎信息庫存在問題

在教育主管部門、研究機構、各級學校歷經十幾年的研究探索下,基于教育事業統計年報的教育基礎信息庫的建設與應用取得了較大的突破,為教育事業的發展提供了決策依據,但在信息的處理方面仍然處于初級層次,信息檢索及分析能力不足、信息孤島現象突出、數據的共享與開放不夠等問題。

(一)信息檢索功能不足

信息檢索是指根據用戶提交的查詢需求,在信息庫中快速有效地檢索到有用的信息并反饋給用戶。由于現行的教育基礎信息庫及采集軟件主要是服務于學校和基層單位的數據采集和各級教育主管部門的數據審核過程,強調的是數據采集和審核過程的易用性,主要功能涵蓋了初始化賬號、角色的設定、任務分配、數據的校驗等,缺乏直接服務于數據交互查詢的功能設計,特別是無法滿足大數據視角下多維度、跨年度的綜合查詢,如按照不同的辦學類型、城區類型分類統計學生、教師規模等。

(二)數據應用統計分析缺乏

基于采集、審核業務流程設計的教育基礎信息庫和教育統計軟件無法應對繁雜的數據應用統計分析需求。數據分析是大數據價值鏈的最后也是最重要的階段,是大數據價值的實現,是大數據應用的基礎,其目的在于提取有用的值,提供論斷建議或支持決策。如對于學校各項基本辦學指標,都需要從軟件中逐校導出,才能進行進一步分析處理,工作量巨大且容易出錯,導致信息庫中巨大的信息資源得不到有效的利用,為教育事業改革發展過程提供決策支持的能力不足。

(三)信息孤島現象突出

歷年來,由于受到軟件開發單位變更和教育研究的發展,教育基礎信息庫和采集軟件版本與指標經歷過多次修訂的影響,每年的信息庫都是單獨構成,互不相連。據不完全統計,從2000年以來統計軟件版本就升級4次,所采用的數據庫從DBF發展到MS SQL SERVER;對于數據指標而言,每年的教育事業統計指標為了適應經濟社會和教育的發展對教育研究的需求都會不斷完善更新。因此,由于歷年數據版本與統計指標存在差異性,不同年度的教育基礎信息庫均是獨立運行,缺乏集成、互聯性差和信息管理分散等問題突出,嚴重影響了大數據的完整性、精確性、可用性和實時性。

(四)信息的開放共享不足

現行的教育事業統計年報是基于CS(客戶端/瀏覽器)架構研發的單機版數據采集軟件,該軟件以采集和審核過程為核心,只能部署于統計人員的電腦上,日常操作,數據的維護、處理和分析只能由統計人員負責。對于其他教育研究人員或行政管理者,只有親自安裝該統計軟件或者由統計人員親自導出,才能瀏覽到數據。由于缺少基于互聯網的開放性信息查詢平臺,導致非統計采集人員必須投入大量的時間和精力關注軟件的安裝、部署和升級,無法全身心的專注于數據本身價值的挖掘分析?;ヂ摼W的優勢在教育基礎信息庫的建設中沒有得到有效發揮,大量數據難以訪問、查詢和分析,大數據的價值無法得到充分體現。

五、教育基礎信息庫的整合與共享策略

大數據技術的戰略意義并不在于掌握龐大的數據信息,而在于對這些含有意義的數據進行專業化的處理。因此,如何能夠全面、多維度的分析、呈現數據,揭示教育發展過程中的隱藏現象、規律,甚至是存在問題,是實現大數據價值的關鍵。與國外相比,國內大數據的研究和應用起步比較晚,特別是在教育領域,在教育基礎信息庫的整合方面,更多的是在宏觀理論層面的研究,實證研究還比較缺乏。因此,通過對廣西區級教育基礎信息庫的建設,提出了操作性強的,其他省份可以借鑒的數據整合建庫與共享策略。

(一)確定數據來源

通過對比分析各類教育信息統計平臺,確定將教育事業統計年報作為教育基礎信息庫的數據源進行整合:一是該統計年報屬于國家教育統計數據的一部分,是國家教育統計的法定數據,每年定期公布在教育部統計數據網站上及各年度的教育統計年鑒中,為研究各級各類教育發展問題提供數據支撐;二是相對于其他教育統計報表結構比較單一,只關注于特定的教育層次或者教育內容,如學籍管理系統只關注學生情況,《高職院校人才培養工作狀態數據采集與管理平臺》只應用于高職院校等,該統計年報屬于綜合性報表,運行時間已經超過10年,各類辦學指標體系已經相對成熟,基本上涵蓋了一所學校關鍵的辦學事業指標;三是相對于其他教育數據,該年報在采集的過程中,使用統計核查軟件對數據進行核查,并要求學校對異動超過一定幅度的指標進行再次核驗,并做出書面說明,同時注重各年度的數據銜接,數據的采集質量高。該年報已經建設成為反映全區各級各類教育事業發展的重要數據來源。

(二)梳理和整合統計指標體系

由于經濟社會的發展以及教育研究多樣化需求,每年的教育統計指標都有所變更,主要體現在以下幾個方面:一是指標的細化,如“死亡”指標之前只統計至非正常死亡,但隨后又細化到分類統計各種死亡事故,如溺水、地震、泥石流等。二是指標名稱改變:如“社會力量辦學”改為“民辦”。三是地域劃分的變更,如2002年,廣西的南寧地區改名為崇左市等。四是辦學主體的變更:每年都有學校合并或升格轉型,如2009年廣西幼兒師范學校升格為廣西幼兒師范高等??茖W校;2012年廣西工學院、柳州醫學高等??茖W校合并升格為廣西科技大學等。五是專業目錄的調整,有些是專業的取消,有的則是專業名稱的改變,還有的是專業歸屬類別變更。面對種類繁多的教育指標的變更,通過認真梳理了近十年的數據指標,按照2015年的數據指標體系,根據數據之間的關聯程度,將指標進行整合。

(三)數據預處理與整合

根據確定的指標體系,將近十年的教育基礎數據進行預處理和整合。一是清理冗余數據。在數據采集的初始階段會產生大量的冗余數據,必須要將冗余數據逐一標記,在整合建庫過程中不做導入處理,提高數據庫查詢執行的效率;二是數據編碼的轉換。在數據庫中,歷年指標所對應顯示行號、名稱都會隨著指標的增加或減少而改動,為了便于數據信息的查詢和展示,需要將指標的行號、名稱依據統一的編碼進行重新修訂。三是數據集成。在前兩步步驟的基礎上,將原本屬于多個數據源且獨立保存的歷年信息庫統一整合在一個信息庫中,確保信息庫的完整。

(四)數據的查詢與展示

為了實現多樣化、多維度的數據查詢要求,本文依據報表本身指標體系特征,經過反復的研究、論證、調查,構建了相對合理的查詢結構。首先,按照教育層次劃分為高等教育、中等職業教育和基礎教育三大層次,依據每個層次的指標體系,又進一步劃分為學校、教師、學生、布局、專業等5個維度(見圖2)。通過“三層次五維度”的查詢結構,用戶可以便捷地查詢歷年廣西各市、縣(市、區)教育發展情況,為廣西的專業布局均衡發展提供了強有力的數據支撐,同時也為各個地市的同級比較提供了依據。

六、教育基礎信息庫的運用與成效

(一)為區域教育事業的發展提供數據支持

科學制定各項教育事業發展規劃離不開大數據的支持,教育基礎信息庫將近10年的教育數據整合到統一的數據庫中,消除歷年信息庫版本、數據指標多樣化所帶來的信息孤島的影響,為信息的查詢、統計分析提供必要條件。2014年初,廣西在南寧召開了全區教育發展大會。在大會召開的前一年,為了制定各項政策,廣西專門開展了廣西教育振興重大課題研究。在子課題《廣西教育振興目標體系研究》中,基于教育基礎信息庫的數據為2014—2017年教育改革發展目標制定提供了科學依據,為教育現代化事業指標、人力資源指標、基礎能力建設指標測算提供了依據和改革思路。

(二)實現教育主管部門對教育數據的監測

隨著全區教育事業的大發展,各地市、學校的各項辦學教育事業指標的監測成了教育主管部門關注的熱點、難點問題。通過教育基礎信息庫,教育主管部門就能實現分市、學校導出各項主要辦學指標,還可以通過信息庫的公式設定,測算各項辦學教育事業指標,從而對市、學校的教育事業發展進行監測。如通過對高等學校13項基本辦學指標的監測,能做到及時預警,消除風險,避免學校只注重學生規模的擴張而忽視了各項辦學條件的投入;通過對各市、縣的辦學指標測算,了解資金投入的成效,保障各級各類教育又快又好地發展。

(三)促進教育事業數據的共享

隨著教育事業的發展,社會各級各類科研院所或個人對教育事業數據的需求日益劇增,借鑒其他行業信息查詢平臺的模式,通過創建基于互聯網B/S(瀏覽器/服務器模式)架構的教育數據查詢平臺,是實現數據開放、共享的基礎?;诮逃A信息庫研發的信息查詢平臺,可以使得教育各部門僅需通過瀏覽器就可以訪問,無需關注軟件的繁雜安裝、部署和升級過程,教育數據更加易于訪問、查詢和分析。同時,該數據平臺還具備有面向社會大眾開放的能力,進一步提高數據的效用和價值,促進數據的共享。

七、結語

信息的整合建庫是實現大數據價值的基礎,本文基于教育事業數據統計年報,將近十年的教育數據整合到一個統一的平臺下,借鑒其他行業的查詢模式,創新性的構建了省級教育基礎信息查詢平臺,為區域的教育發展提供數據決策支持,實現教育主管部門對區域、學校的教育發展進行監控,促進教育數據的開放與共享。但與教育發達地區如美國的國家教育統計中心(NCES)相比,在數據的統計、分析與應用方面,特別是面向社會公眾開放的大規模應用方面,存在著較大的差距,這也是我國在構建國家級、省級教育基礎信息庫方面需要進一步研究的方向。

【參考文獻】

[1]祝智庭,沈德梅.基于大數據的教育技術研究新范式[J].電化教育研究,2013(10)

[2]Big data:The next frontier for innovation, competition,and productivity[EB/OL].http://www.mckinsey.com/insights/business_technology/big_data_the_next_frontier_for_innovation

[3]孟小峰,慈祥.大數據管理:概念、技術與挑戰[J].計算機研究與發展,2013(1)

[4]何寶宏,魏凱.2013大數據產業回顧與發展電信技術[J].電信技術,2014(1)

[5]國務院關于印發促進大數據發展行動綱要的通知[EB/OL].http://www.gov.cn/zhengce/content/2015-09/05/content_10137.htm

[6]貴陽大數據交易所[EB/OL].http://www.gbdex.com/exchange.html

[7]楊滿福.焦建利.大教學、大數據、大變革—edX首門“慕課”研究報告的分析與啟示[J].電化教育研究,2014(6)

[8]白如江,冷伏海.“大數據”時代科學數據整合研究[J].情報理論與實踐,2014(1)

[9]左明章.美國國家教育統計中心對我國教育基礎信息數據庫建設的其實[J].中國電化教育,2012(8)

[10]梁芷銘.大數據治理:國家治理能力現代化的應有之義[J].吉首大學學報(社會科學版),2015(2)

[11]陸璟.大數據及其教育中的應用[J].上海教育科研,2013(9)

[12]專業建設與職業發展管理平臺簡介[EB/OL].http://www.fjmzw.com/InfoView-174-2647.html

[13]唐宏宇,李姣.生物醫學文獻的知識發現與數據整合[J].中華醫學圖書情報雜志,2015(2)

[14]張引,陳敏,廖小飛.大數據應用的現狀與展望[J].計算機研究與發展,2013(50)

[15]馬曉婷.基于大數據的圖書館異構數據整合機制研究[J].現代情報,2015(35)

[16]宮夏屹立,李伯虎,柴旭東,谷牧.大數據平臺技術綜述[J].系統仿真學報,2014(3)

【基金項目】廣西2014年度高校科學技術研究項目“大數據時代下廣西教育事業統計數據的整合與探究”(YB2014484);廣西人文社會科學發展研究中心團隊建設階段性成果

【作者簡介】鄧學銘(1984— ),男,廣西柳城人,廣西教育研究院研究人員,研究方向:教育統計、高等教育管理。

(責編 何田田)

猜你喜歡
大數據
基于在線教育的大數據研究
中國市場(2016年36期)2016-10-19 04:41:16
“互聯網+”農產品物流業的大數據策略研究
中國市場(2016年36期)2016-10-19 03:31:48
基于大數據的小微電商授信評估研究
中國市場(2016年35期)2016-10-19 01:30:59
大數據時代新聞的新變化探究
商(2016年27期)2016-10-17 06:26:00
淺談大數據在出版業的應用
今傳媒(2016年9期)2016-10-15 23:35:12
“互聯網+”對傳統圖書出版的影響和推動作用
今傳媒(2016年9期)2016-10-15 22:09:11
大數據環境下基于移動客戶端的傳統媒體轉型思路
新聞世界(2016年10期)2016-10-11 20:13:53
基于大數據背景下的智慧城市建設研究
科技視界(2016年20期)2016-09-29 10:53:22
數據+輿情:南方報業創新轉型提高服務能力的探索
中國記者(2016年6期)2016-08-26 12:36:20
主站蜘蛛池模板: 国产精品视频999| 99九九成人免费视频精品| 在线色国产| 三上悠亚精品二区在线观看| 久久网综合| 乱系列中文字幕在线视频| 99久久精品久久久久久婷婷| 日韩精品少妇无码受不了| 天天躁夜夜躁狠狠躁图片| 亚洲日韩高清无码| 欧美亚洲一区二区三区导航| 91视频首页| 国产成人精品男人的天堂下载| 精品视频免费在线| 欧美高清国产| 国产精品香蕉在线| 国产午夜精品一区二区三| 久久婷婷六月| 色综合综合网| 极品私人尤物在线精品首页| 40岁成熟女人牲交片免费| 国产清纯在线一区二区WWW| 一区二区午夜| 中国国产高清免费AV片| 看av免费毛片手机播放| 久久精品人人做人人爽97| 久久精品国产精品青草app| 91精品国产综合久久不国产大片| 无码中文AⅤ在线观看| 天天爽免费视频| 日本人妻一区二区三区不卡影院| 亚洲欧美日韩成人在线| 91久久偷偷做嫩草影院免费看| 欧美一区二区三区欧美日韩亚洲| 欧美日韩亚洲综合在线观看| 欧美成人精品一级在线观看| 色老头综合网| 国产欧美亚洲精品第3页在线| 欧美国产综合视频| 欧美精品v| 亚洲精品色AV无码看| 日本高清免费不卡视频| 亚欧美国产综合| 亚洲国产综合第一精品小说| 毛片在线播放网址| 88av在线| 又黄又湿又爽的视频| 女人18毛片一级毛片在线 | 国产免费福利网站| 国产成人一级| 自拍亚洲欧美精品| 国产成人精品第一区二区| 国产精品天干天干在线观看| 一本综合久久| 成人在线观看不卡| 国产精品女熟高潮视频| 毛片免费观看视频| 欧美色视频网站| 国产视频自拍一区| 日本国产精品一区久久久| 亚洲午夜国产精品无卡| 国产www网站| lhav亚洲精品| 2021国产精品自产拍在线| 成人福利在线视频免费观看| 精品一区二区三区水蜜桃| 国产在线欧美| 中文字幕亚洲无线码一区女同| 国产伦精品一区二区三区视频优播 | 亚洲日本一本dvd高清| 99青青青精品视频在线| 亚洲日韩精品综合在线一区二区| 久综合日韩| 一区二区三区四区在线| 亚洲日本中文字幕天堂网| 久久综合丝袜长腿丝袜| 91精品啪在线观看国产| 久久福利网| 欧美亚洲日韩中文| 毛片视频网| 激情综合婷婷丁香五月尤物| 国产免费网址|