敬國東 劉曉莉

基金項目:四川省高等學校人文社會科學重點研究基地·四川省教育信息化應用與發展研究中心項目“基于大數據的高校教學質量評價改革研究——以川港部分高校為例”(項目編號:JYXX19-027,主持人:敬國東);四川省高等教育學會川港高等教育教學研究專業委員會2019年度重點課題“成效為本(OBTL)教學質量保證體系研究”(課題編號:19ZD0101,主持人:敬國東);四川中醫藥高等專科學校教學改革研究項目“基于大數據的醫學院校教學質量保障體系研究” (課題編號:19JGYB13,主持人:敬國東)
摘要:教學質量是高校生存和發展的生命線,教學質量評價是以教學活動相關數據為依據的教學質量建設與管理的過程。基于大數據的高校教學質量評價平臺以智能數字化校園為基礎,以Hadoop技術和數據挖掘技術為支撐,采用全校統一的數據標準將數據采集、數據存儲、數據處理和數據應用整合為有機整體,實現了教學數據的共享,有效提升了高校教學質量評價的效率和質量。
關鍵詞:大數據;教學質量評價;數據挖掘
中圖分類號:G642.0; TP311.13?? 文獻標識碼:A?? 文章編號:1672-9129(2020)12-0082-02
1 引言
高等教育是我國教育體系的重要組成部分,現在已由追求規模擴張到注重內涵建設的觀念轉變,特別是學校的教學質量已成為高校的生命線[1]。影響高校教學質量的因素非常多,包括學校基礎硬件環境、圖書資源、科研環境、師資水平等資源性因素,也包括教師課教學理念、教學方法、教學手段、師生互動等課堂教學動態性因素,如此復雜的教育教學環境和過程,導致高校教學質量的評價既重要又難以實施。
傳統的教學質量評價一般是在學期教學工作完成后,學校組織學生對老師的課程教學方法、教學態度、教學技巧等教學活動直接相關的因素進行集中評價。這種傳統的教學質量評價模式是靜態的結論性評價,忽略了教學活動中師生互動過程、學生學習實時成效、教師課堂展現實時狀態等過程性因素,無法科學全面地反應高校真實的教學質量水平。另一方面,由于受觀念和技術的限制,傳統的教學質量評價一般是采用紙質材料以書面問卷的方式進行的,數據的后期分析和處理也是以人工勞動為主或采用EXCEL進行簡單的計算機處理,數據采集和分析的效率極低,數據分析算法也只是簡單的數據匯總和比例統計,缺乏深層次分析和挖掘,無法揭示高校教學質量本質,嚴重地影響和制約了高校教學質量的提升。
隨著計算機信息技術的快速發展,大數據科學技術已從理論研究轉向應用實踐,教育科學和大數據技術想結合的教育大數據理念應運而生,并快速的被應用到高等教育教學質量管理和評價實踐之中,開始構建基于大數據的高校教學質量評價大數據平臺[2]。
2 建設原則
2.1注重智能化數字校園建設。智能化數字校園是建設高校教學質量評價大數據平臺的基礎和前提條件,為教學質量評價大數據平臺提供硬件支撐和運行環境。智能化數字校園建設應用采用整體規劃逐步實施的原則,根據高等教育的基本規律和學校發展的目標定位,全面考慮學校教學管理的具體要求,科學設計智能數字化校園的總體框架,特別要注重將人工智能技術和大數據技術相結合,實現教學質量數據采集自動化、教育質量數據挖掘和分析的智能化和教學質量評價實時化[3]。數字化校校園建設是一項復雜的工程,在做好整體規劃的基礎上,學校還要結合輕重緩急和財力狀況制定詳細的實施計劃,分步有序地推進智能化校園建設,并在實際應用中逐步完善智能數字化校園和教學質量評價大數據平臺的結構和功能。
2.2加強數據標準制定與共享。教學質量評價大數據平臺的數據來源與學校教學管理的各個環節和數字化校園的各個應用系統,這些數據包含了豐富的教學質量評價因素,但因各個環節或應用系統關注的重點不同,其中的數據結構各不相同甚至相差極大,為了能充分利用這些數據對教學質量進行客觀而科學地評價,就必須制定統一的數據標準并共享數據[4]。學校教學質量數據標準制定要在教育部教學信息化標準的基礎上,結合學校教學質量管理實際需要進行改進和完善,形成體現學校自身特色的數據編碼標準、交換標準和共享標準,各個應用系統根據學校統一的數據標準對教學質量評價平臺開放接口,確保教學質量評價平臺能從各個應用系統獲取教學質量評價相關的數據,從而實現數據共享。
2.3注重建設與應用并重。隨著社會的進步與發展,高等教育教學也是不斷發展變化的,影響高校教學質量的因素也會不停改變,高校教學質量評價平臺的建設也是一個在應用中不斷改進和提升的過程。學校往往存在重建設輕應用的現象,導致花費大量人力物力建設的平臺無法發揮應有的作用。教學質量評價大數據平臺的建設必須與教學質量評價實際工作相結合,邊建設邊應用,及時采集和分析教學活動各個環節的數據,形成教學質量評價大數據,再以這些大數據為基礎及時對教學質量進行評價并將評價結果及時反饋給教學管理部門、教師和學生,這些部門和教學活動參與者依據教學質量評價和建議及時改進和提升教學質量,并對教學質量評價大數據平臺的運行狀態和效果提出需求和建議,學校再進一步完善和改進教學質量評價大數據平臺,從而形成平臺建設與應用并重相互促進的良好局面。
3 平臺構建
3.1整體框架。基于大數據的教學質量大數據平臺整體框架如圖1所示,主要由數據采集、數據存儲、數據處理、數據應用四個部分組成,并包涵可靠的平臺安全保障機制和科學的質量評價指標準。
(1)數據采集。數據采集是教學質量大數據平臺的信息流入口,主要負責采集與高校教學質量相關的各種教育大數據。根據教學質量數據的來源和性質不同,可以分為資源性數據采集、過程性數據采集和結果性數據采集三類[5]。資源性數據是指高校內為提升教學質量而必備的各種資源,這類數據一般是從學校各個應用系統提取整合而得的,比如圖書管理系統中的圖書資源數據,人事管理系統中的教師信息數據,學工管理系統中的學生信息數據,教務管理系統中的課程信息和學分成績數據;過程性數據是教師和學生在課堂教學或在線學習過程中實時產生的教學數據,這些數據是教學活動中動態生成的,一般可以借助學校多媒體教室的智能麥克風和高清攝像頭實時自動采集并上傳到教學流媒體服務器中以供教學質量評價系統抽取分析;結果性數據是兼容傳統教學質量評價模式,在課后、期中或期末允許學生通過網絡在線評價系統對教師的教學活動進行在線評價并自動將評價數據上傳的教學質量評價平臺。
(2)數據存儲。教學大數據包括結構化數據、半結構化數據和非結構化數據三類,平臺數據存儲方案應綜合考慮兼顧三類數據存儲要求。結構化數據是以二維表的形式表示的數據結構,數據以行(記錄)和列(字段)的構成數據表,多個數據表相互聯系在一起形成數據庫,比如圖書數據、教師數據、學生數據、成績數據等都是標準的結構化數據,這類數據結構規范,適合應用Oracle、SQL Sever、MySQL等主流關系型數據庫進行存儲。半結構化數據一般以標記形式來表示數據,最常見的半結構化數據是JSON和XML格式數據,以屬性的方式來描述數據特征,這類數據主要用于教學大數據平臺的系統配置、標準設置、數據交換、網絡傳輸等場景,可直接利用操作系統的文件管理功能以文本文件的形式存儲半結構化數據。非結構數據是指數據結構不規則無法產生規范的二維表結構的數據,現實教學活動產生中的數據絕大多數數據都是非結構化的數據,如教學圖像、教案文檔、課堂教學的音頻和視頻文件等,非結構化數據可以利用Hadoop的HDFS進行分布式存儲[6]。
(3)數據處理。數量宏大的教學大數據必須經過高效地處理才能充分挖掘數據的內在價值,分析教據之間的內在聯系及對教學質量的關聯程度,從而對高校教學質量進行科學的評價。教學質量大數據評價平臺對數據的處理主要為數據整合和數據挖掘。數據整合是根據事先制定學校數字化建設統一的數據標準和數據交換接口,將來自學校各個應用系統和實時動態采集而來的結構化、半結構化或非結構化的數據利用Hadoop的ETL進行數據抽取、清洗、修正、轉換和集成,形成數據倉庫或數據集市[7]。數據挖掘是在數據倉庫或數據集市的基礎上根據教學質量評價的具體需要,建立相應的數據模型并利用先進的大數據算法對各種教學大數據進行分析,獲取教學質量評價相關數據并對教學質量進行科學評價。
(4)數據應用。數據應用是平臺信息流的輸出端,根據教學質量評價的具體需要對數據進行查詢、統計和多樣化展示,以供高校進行教學質量診斷和改進使用。高校的教師、學生和教學管理者經平臺統一身份證后便可以查詢教師本人的教學質量評價結論及教學活動中的優缺點,還可以查詢各教研室、系部和學校的教學質量狀況統計,查詢和統計的結果可以以表格的形式展示,也可以以圖表的形式顯示,還能根據評價結果生成圖文形式的教學質量評價文本文檔。
3.2關鍵技術。
(1)Hadoop技術。Hadoop是重要的分布式系統架構之一,便于開發者開發分布式應用程序,并以集群的方式對大數據進行分布式存儲和運算,其核心技術包括HDFS和MapReduce[8]。HDFS(Hadoop Distributed File System,分布式文件系統),主要用于大數據的分布式存儲,可以通過一個管理節點(NameNode)和多個數據結點(DataNode)來對服務器集群上的文件以塊(Block)為單位進行創建、刪除、復制和讀寫操作。MapReduce是大數據運算模型,能高效率地分析大數據并輸出結果數據。除了HDFS和MapReduce兩大核心框架外,Hadoop還包括了Ambari(Hadoop集群的安裝、部署、配置和管理工具)、Sqoop(數據庫ETL工具)、Flume(日志收集工具)、Zookeeper(分布式協作服務)、HBase(實時分布式數據庫)、Hive(數據倉庫)、Pig(數據流處理)和Mahout(數據挖掘庫)等工具或功能組件,形成完整而成熟的Hadoop生態系統。
(2)數據挖掘技術。原始的教育大數據雖然包含了大量的與教學質量相關的信息,卻無法直接從這些數據源對教學質量進行評價,必須借助數據挖掘技術對教育大數據進行處理才能獲得有效的教學質量評價結果。數據挖掘(Data Mining)是從數量龐大、雜亂無章、充滿噪聲、隨機分布、信息模糊的原始數據中根據應用需要運用科學的算法分析獲取實用價值信息的過程。常見的數據挖掘技術包括關聯技術、聚類技術、預測技術和挖掘算法[9]。關聯技術利用教育大數之間內存聯系建立相應的關聯規則,并根據關聯規則分析教育大數據對教學質量的影響關系進而對教學質量進行評價;聚類技術將教學大數據按相似程度把類似的零碎數據聚集在一起進行分析處理,從不同的類型角度對教學質量進行評價;預測技術是在大數據全集(而非校本)的基礎上,通過時序分析或回歸分析對教學質量的變化趨勢進行預判,及時預警和正教學活動,從而有實現教學質量的動態評估和提升。算法是大數據挖掘的核心和關鍵,決定了大數挖掘的效率和質量,常用的大數據挖掘算法有決策樹算法(如ID3、C4.5,CART)、關聯規則算法(如Apriori、FP-growth)、聚類算法(如K-MEANS、K-MEDOIDS、Clara、Clarans)等,研究和改進挖掘算法是教學質量評價平臺建設的重要技術支撐點。
4 結語
教育大數據涵蓋了教育教學過程中的一切相關的數據,包括學校的教學環境、實驗設備、后勤保障、師資結構、教學觀念、教改能力、課堂互動、在線教學等資源性、支撐性和過程性的教學因子。教育大數據以宏大的數據量為基石,全面的反應了高校教學質量的各種指標因素,對高校教學質量評價有重要的理論意義和實踐價值。同時,教育大數據的數量之大已無法用傳統方法進行采集、整理和分析,必須借助先進的技術才能有效處理教育大數據,大數據技術是最佳的教育大數據挖掘技術,教學質量評價大數據平臺是大數據技術應用于教學質量管理與評價的重要應用系統,對高校教學質量的提升有重要的作用。首先,利用教學質量評價大數據平臺,能有效提高教學質量評價的效率,大數據平臺不再通過人工方式獲取和處理數據,而是借助音視頻智能網絡終端可以實時動態采集各類教學活動相關資料,并利用先進算法讓計算機自動對所采集的數據進行分析獲得評價結果;其次,利用教學質量評價大數據平臺,能實現評價過程全面化,大數據平臺能將高校教學活動相關的各個方面有機地整合到一起,全面收集影響教學質量的各種信息,并對教學過程進行全程跟蹤和動態監督,從而對教學質量進行全面全程全員的評價;另外,利用教學質量評價大數據平臺,能提高評價結論精準度,大數據技術憑借先進的數據算法,在全面全程教學質量評價數據源的基礎上,參照科學評價評價指標體系進行精確分析判定,能夠極大地提高高校教學質量評價的精準度。
參考文獻:
[1]徐慧芳,陳原艷.大數據背景下地方高校教學質量評價體系的構建探索[J].牡丹江教育學院學報,2020(07):35-36+81.
[2]唐秀忠,蘭曉俐,陳洪磊.基于大數據的高校教學質量評價系統設計研究[J].開封文化藝術職業學院學報,2020,40(02):120-122.
[3]劉璐.大數據時代高校數字化校園建設[J].中國管理信息化,2020,23(09):212-214.
[4]郭猛,那日蘇,特日格樂,包東明.數字化校園數據交換平臺建設研究[J].信息與電腦(理論版),2020,32(11):237-239.
[5]黃旭彬.構建校園大數據采集與評價分析平臺的關鍵技術[J].計算機產品與流通,2020(08):14-15.
[6]陳敬彬.基于NoSQL數據庫的空間大數據分布式存儲策略[J].計算機產品與流通,2020(08):40.
[7]賀麗麗.探討云計算模式下大數據處理技術[J].科技視界,2020(26):95-96.
[8]王玉.大數據時代Hadoop和Spark技術研究[J].品牌研究,2020(04):88-90.
[9]崔巍.大數據挖掘與分析的關鍵技術研究[J].中國新通信,2020,22(08):62.
作者簡介:敬國東,碩士研究生,副教授,四川中醫藥高等專科學校質量管理辦公室主任,長期從事教學質量管理、課程體系建設和高職教學工作,主要研究計算機輔助教學與管理教學的理論研究、軟件開發和體系建設;劉曉莉,講師,四川中醫藥高等專科學校英語教師。