張恩昊
(大連電子學校,遼寧 大連 116100)
近年來隨著國家和各級政府的持續不斷的大力投入,中等職業教育得到了長足發展,但制約中等職業教育實現高質量可持續發展的掣肘還存在,關鍵痛點未得到有效解決。中等職業教育的受眾群主要來自九年制義務教育的階段綜合評定成績后45%—55%的學生,普遍存在學習習慣有缺陷,學習方法不科學,多門學科學習基礎不牢固的頑疾,年齡普遍處于15—18歲的未成年人,進入中等職業教育體系后,既面臨繼續提高綜合人文素養的艱巨任務,同時還處于豐富健全完善人生觀和世界觀的關鍵期,更具有挑戰的是直接進入未來就業崗位技能培訓階段,在中等職業教育階段,既要塑造合格的高素質的社會公民,又要培養適應社會發展的高技能的合格就業者,這就要求充分掌握中等職業教育受眾群的大量相關數據,通過數據挖掘和分析,實現個性化教學,因材施教。
傳統中等職業教育主要關注對受眾群學習成績的評價,而忽略對學習過程的分析,缺乏受眾群歷史數據的掌握和分析,而大數據技術通過對受眾群相關學習行為、興趣、習慣等數據的留存和深度挖掘,學習行為評價和評估,教師可以根據大數據技術分析和挖掘出的學習過程中的相關規律,根據個受眾群個人的學習數據,制定相應的學習計劃和輔導,而不再基于自己的教學經驗分析學生的學習偏好、難點和共同點。通過對企業的工程案例庫中面向工作過程的知識庫的挖掘和分析,能夠準確和高效地挖掘出相關崗位專業技能對應的知識點,可以實現中等職業教育受眾群的精準培訓和教學,從而完成學校和就業崗位的無縫銜接和融合。
中等職業教育在基于5G通信技術實時傳輸和物聯網高速信息采集的大數據技術和數據挖掘相關算法的大規模應用下,通過不斷持續建設基于大數據技術的個性化教育社區,中等職業教育可以實現彈性學習、個性化學習、按需學習、終生學習[1]。
該系統為中職教育受眾群的專業技能領域的個性化學習,提供數據和數據挖掘技術支持。系統將面向工作過程的各專業的專業知識,根據數據特點和應用特點將數據資源歸類為標準資源庫和主題信息庫。
標準資源庫主要用于存放經過清洗后的資源數據。標準資源庫中,將靜態數據進行歸納,形成行業共享共建的基礎數據庫,將動態數據整合形成業務數據庫。
主題信息庫是基于標準資源庫數據,通過對支撐不同分項主題的數據,既包括常用統計及分析,也包括根據專業崗位而制定的不同主題、不同維度的統計及分析數據,進行數據建模和組織并結合聚類、序列分析、相關性分析等機器學習算法組成的強大數據挖掘引擎,按照從初學者、高級初學者、有能力者、熟練者到專家的職業能力規律,挖掘各專業崗位工作邏輯對應的知識邏輯,構建符合發展邏輯的各專業的教學內容,根據相關職業能力等級,建立從低級到高級的難點遞增的,面向工作過程的專業知識數據庫,該數據庫既可以完成中等職業教育受眾群的專業技能進階培訓,也用于專業能力等級測試和劃分,受眾群個體的專業能力畫像生成,為后續的個性化教學,分層次教學、分就業崗位教學提高數據支持和分析服務。
人文素養知識庫的數據是由人文綜合素養領域形成的各種與文化素養本身相關的數據,及外圍所形成的數據綜合匯聚而形成的。其數據來源既包括數字圖書館等數字化的數據,也包括公眾在社交網絡上搜索或者發布的自媒體等相關數據如語音、短視頻、公眾號等數字化數據。
通過對人文大數據的挖掘,可以提供各種統計分析服務,如基于相關人文素養大數據資源訪問熱度的分析、基于大數據訪問時段、訪問數據類型如漫畫、短視頻、電影、直播等的統計分析等,用戶行為分析主要對大數據平臺的用戶在搜索、瀏覽內容、瀏覽時間、討論等所有行為數據進行建模與分析,通過對用戶行為分析,挖掘什么類型的人文數據資源最受歡迎,以達到根據用戶的歷史行為記錄分析用戶的愛好和興趣等目的,為此后的個性化推薦提供理論依據[2]。
用戶畫像系統,其核心是用計算機理解的詞語,去描述一個人,一般用標簽+權重來做用戶畫像。用戶相關的數據,分為靜態和動態兩種。用戶靜態數據主要是指其個人標簽,屬性如年齡、性別、愛好等。用戶動態數據主要是指行為數據,常見要素是時間、地點、行為等。
當用戶畫像系統建立后,通過與專業知識數據庫系統結合后,通過收集并記錄用戶的相關專業知識的掌握情況、興趣點等數據,送到數據分析系統,實時挖掘分析用戶的專業特長、短板、專業技能升級路線圖等,并實時將個性化的專業學習關聯信息推送給用戶。通過與人文素養知識數據庫結合后,可以找到更符合用戶興趣、適合用戶特性的人文素養知識、并對知識的呈現形式進行針對性的調整和優化。
專業知識個性化推薦系統通過學生與教育的應用軟件、手機APP等互動,通過大數據分析的得到以下需求:我的專業優勢、劣勢、提高學習成績的障礙、勝任的工作、推薦的專業學習計劃、專業技能提升路線圖等。
人文大數據個性化推薦主要通過對海量文化大數據和用戶行為對比分析來實現。對用戶行為和興趣點進行精確描述,將包括訪問特征、用戶特征及用戶社交信息在內的用戶行為數據引入到推薦系統,以提升個性化推薦的效果,構建一套個性化的推薦系統。
傳統課堂教學很難根據學生個體特點有針對性地進行教學,而基于大數據的教育平臺系統可以針對每個學生的學習情況,實現個性化教學。通過對教育大數據的分析,找出每個學生的學習興趣點、學習難點、學習行為、喜愛的學習方式、喜歡的課程、潛在的天賦,幫助學生依據個體的情況提高學習的收獲量。
將學生的一切學習行為和相關數據均記錄下來,相關教育的原始數據主要包括學生信息、教師信息、電子輔助授課資料、電子試卷、學習記錄、考試記錄、學習筆記、教師批改記錄、教師授課視頻及互動留言等。以學生做題為例,題的難度、考察的知識點、答題時間、正確率都是需要采集的指標。通過數據分析和挖掘,獲取和掌握學生的愛好、興趣、對知識點的掌握程度等信息,教師可以有針對性地調整相關教學要素,因材施教。通過數據的積累和數據挖掘,形成學生的用戶畫像、興趣圖譜、學科偏好、學習軌跡,大數據能夠幫助教師實時了解學生的學習狀況、對學生進行分類、因材施教、實現知情教學。
通過大數據分析教師與教育應用軟件、手機APP等互動,可以分析出教師的教學優勢、教學劣勢、優化的教學手段、推薦的教學計劃、學生成績評估分析與反饋、課件的智能評估與反饋等相關提高教師教學質量的影響因素。
數據采集是實現大數據分析的基礎,一般來說,采集的數據類型分為三類,結構化、半結構化、非結構化數據。結構化數據是存儲在數據庫里,能用二維表結構邏輯表達實現的數據,常用于記錄客戶信息等方面的數據,半結構化數據具有可被理解的邏輯流程和格式,但格式不友好,分析起來比結構化數據復雜,如網絡流量、APP日活躍用戶數、登錄用戶數、停留時間等。非結構化數據是處理難度最高的大數據,比如圖像、語音、音頻,以及文本信息如聊天記錄、文檔、電子郵件等多媒體類的非結構化數據。
在中職教育中,應該優先挖掘出大數據之間的相關性,通過對專業知識大數據的相關性分析,可以挖掘對進階到高端崗位的控制性技能和知識,影響崗位工作效率和能力的關鍵參數,相關控制性技能和知識點的進階次序;不同控制性技能和知識集合對應的就業崗位,影響個體崗位技能提高的短板項;通過對人文素養知識大數據的相關性分析,可以挖掘影響個體人文素質提高的制約因素,適合不同個體、不同受眾群的人文知識呈現形式和方式、適合不同個體、不同受眾群的人文素養提高路線圖。通過對教師教學大數據的相關性分析,不僅可以挖掘出相關受眾群的學習規律,還可以挖掘出提高教學質量和水平的教學規律。
大數據技術通過5G通信技術、物聯網等技術手段將自然、社會、人類的一切狀態、行為記錄存儲下來,這些數據通過網絡和云技術對外開放和共享,對數據權益、數據隱私和人性自由帶來了極大的影響和挑戰。
中等職業教育大數據從個人、相關企業采集而來,數據產權歸屬權是數據采集者、被采集對象、還是數據存儲者,誰擁有對這些數據的所有權、使用權、存儲權和刪除權;來自企業的技術數據和項目數據是否會導致企業的商業機密泄露,被第三方采集,用于惡意的商業競爭;同時大數據對思想、行為預測結果的非正常泄露是否會對中等職業教育未成年人受眾群和監護人的行為意志、職業規劃、自我認知等領域產生不可控的干擾,這些事項需要做好規劃和設計,否則會引發隱私保護危機。
對于中職教育的數據利益相關方,因其多數為未成年人,應該保證數據被采集者的知情權和所采集數據的知識產權,同時對挖掘出的公共知識,應該面向數據利益相關方公開,對涉及被采集者的可能影響其未來正常學習和生活、人生成長的數據應該進行脫敏,盡可能地降低對其的影響。