尹幫治



關鍵詞:大數據技術;專業核心課程;解釋結構模型;層次關系構建
0 引言
大數據技術的使用在各個領域迅速擴展,尋求有效的方法來設計專業核心課程體系結構,顯得非常重要。高等職業院校大數據技術專業的課程體系結構可以通過各種方法來確定,如行業咨詢、課程基準、基于研究的方法和教師專業知識[1]。咨詢行業專家可以使課程體系結構符合行業要求,學生為就業做了更好的準備。但這種方法可能會導致狹隘地關注當前的行業需求,隨著時間的推移,這可能會變得過時。課程基準是將各高校的教學計劃進行比較,在必要時進行調整。這種方法可能導致大學之間缺乏差異,并且可能沒有考慮到特定機構的獨特優勢和重點。基于研究的方法是高校根據與大數據技術相關的現有研究和出版物來設計課程體系結構。這種方法的優勢在于它將課程建立在最新的學術研究之上,但是缺點是這種方法可能沒有考慮到大數據技術在行業中的實際應用。依靠教師的專業知識和經驗來定制課程體系結構,可以成為高校吸引學生的競爭優勢,但這可能無法反映大數據技術領域更廣泛的要求。
本文將上述方法有效地結合起來,充分利用每一種方法的優點,采用解釋結構建模(ISM) ,科學設計高等職業院校大數據技術專業核心課程的層次結構圖,強調多學科課程的重要性,反映最新的學術研究、行業趨勢和實際應用,同時保持靈活性并適應該領域不斷變化的需求。
1 大數據技術專業核心課程識別
識別大數據技術專業包含的核心課程對于學生選擇專業以及在專業中學習和發展都具有重要意義。首先,了解核心課程有助于學生建立起全面深入的大數據技術知識體系,把握大數據技術的主要應用領域和發展趨勢。其次,核心課程還涵蓋了大數據技術的各種基礎和重要的應用技術,如大數據處理、數據挖掘、機器學習等,這些技術在實際工作中都有廣泛的應用和需求。最后,了解大數據技術專業包含的核心課程還有助于學生在今后的職業生涯中為自己制定學習和發展計劃,更好地適應職業發展的需要。
從國內的研究文獻來看,主要分為本科層次和專科層次的大數據教育。在本科層次中,賀文武博士設計的數據科學與大數據技術專業課程體系中,主干課程包含了機器學習、數據可視化、并行與分布式計算等課程[2]。中南大學數據科學與大數據專業主要課程包含了數據挖掘與分析、大型數據庫技術及應用,數據安全等課程。福建工程學院數據科學與大數據專業主要課程包含了機器學習與模式識別、時間序列分析、數據挖掘等課程。在專科層次中,從潘梅勇教授設計的課程體系中可以看出,高職大數據技術與應用專業核心課程包含了數據庫應用技術、Hadoop實用技術、數據可視化技術等課程[3]。李建平老師指出,大數據技術與應用專業課程應涉及數學、統計學、計算機科學等領域[4],大數據技術與應用專業核心課程建設除了要重視理論知識外,還要重視實踐技術。
國外的研究文獻主要包括大學教育、行業資訊和專著出版物。在大學教育中,Wadhwa和Krishnamur?thy 提出了一套指導原則和經驗教訓,用于設計大數據課程,為學生在該領域的未來職業生涯做準備。指導原則來自對現有課程的審查、對行業專家的調查以及來自教師和學生的反饋[5]。Gehringer提出了數據科學專業的課程設計框架[6]。該框架包括一套數據科學畢業生應具備的核心能力,以及一套可供學生根據興趣和職業目標選擇的選修課程。該框架旨在靈活適應不同機構的需求,同時仍然提供一致和全面的數據科學教育。
綜上所述,數據建模可以使學生掌握大數據的基礎理論知識和數據架構設計方法,從而能夠將大數據理論應用到實際的數據分析和處理中。數據庫系統課程使學生掌握數據庫系統的基本原理和技術,掌握數據庫設計和管理技術。數據可視化能夠培養學生對數據加工和可視化的能力,使其能夠從數據中挖掘出信息和知識。統計分析培養學生對探索性數據分析、統計分析和數據建模的能力,為數據分析和決策提供科學支持。機器學習課程是培養學生應用機器學習方法解決大數據分析問題、構建機器學習實踐項目的必修課程。分布式數據處理課程是培養學生理解分布式計算的理念和機制,掌握分布式計算平臺的原理和使用方法,提高學生大規模數據命令的能力。數據安全是大數據時代面臨的重要議題,數據安全課程是培養學生對大數據可信和安全行為的認識和掌握,增強學生的大數據安全意識。數據挖掘培養學生填補大數據領域各種知識間斷的人才,掌握大數據分析整體思路及熟悉算法,能夠應對大數據領域的多元場景要求。因此,選擇上述8門課程作為數據技術專業的核心課程是科學的,這些課程的設置可以讓學生全面、深入、系統地了解大數據技術專業相關知識和技術,為學生的學習和未來的職業發展提供了必要的保障。
2 解釋結構建模(ISM)
解釋結構模型(Interpretative Structural Modeling,ISM) 是由Gregory H. Watson于1982年首次提出的一種處理復雜戰略規劃問題的方法,用于識別系統或問題的不同組件之間的復雜關系。 它包括將一個復雜的系統或問題分解成更小的子系統或組件,并創建一個層次結構來表示這些組件之間的關系。然后,使用該結構來理解系統或問題的組件如何相互作用,并識別影響系統的整體行為和動態的關鍵驅動因素和依賴因素。
解釋結構模型(ISM) 方法可以作為一種有效的工具,用于確定專業領域中核心專業課程的順序。通過使用ISM,有可能確定不同課程之間的關系,并確定在給定順序中影響其重要性的關鍵驅動因素。 特別是,ISM可以幫助確定構成專業領域基礎的核心課程,以及它們相對于其他課程的相對重要性。它可以揭示不同課程之間的依賴關系,以及它們如何有助于學生知識和技能的發展。然后,這些信息可用于設計結構良好的課程,并與該計劃的學習目標保持最佳一致。 此外,ISM可以幫助識別不同課程之間的潛在沖突或權衡,并提供如何解決它們的見解。它還可以幫助根據課程對專業實踐的影響或它們對實現學習目標的貢獻程度來確定課程的優先順序。
3 專業核心課程層次關系ISM 模型構建
ISM模型一般遵循四個步驟:研究問題的目標抽象確定模型中的要素及其關系,并生成鄰接矩陣;對鄰接矩陣進行相乘操作,得到可達矩陣,必要時進行多次自乘,直至矩陣不再發生變化;基于可達矩陣進行模型層級分解,形成模型層次結構,通常最上層為系統目標,下面的各層則為上一層因素;劃分完層次后,使用有向連接圖更直觀地表示模型的層次結構。
3.1 確定課程關系鄰接矩陣
為了方便討論,將8門核心專業課程標記如下:C1為數據建模、C2為數據庫系統、C3為數據可視化、C4為統計分析、C5為機器學習、C6為分布式數據處理、C7為數據安全、C8為數據挖掘。通過與企業專家、高校專業教師和已畢業的相關學生進行訪談,明確各課程之間的邏輯關系(學生學習課程的優先順序關系),生成鄰接矩陣 A,如式(1) 所示。矩陣A 中,當Ci對Cj有直接優先順序關系,則元素aij=1,否則aij=0。
3.2 求解可達矩陣
若M=(A+I)n = (A+I)n-1則M=(A+I)n
利用上述方法,根據鄰接矩陣A,利用Python編程語言,可求得可達矩陣M=(A+I)4,如式(2) 。
3.3 可達集合與先行集合的抽取過程
可達集合定義為式(3) ,先行集合定義為式(4) 。
若P (c ) i ∩ Q(c ) j = P (c ) i 則Ci 為當前最高級要素。可達集合與先行集合的初始狀態如表1所示。從表1可以得出:L1={C5}。
根據表1,對可達集合與先行集合進行第1次抽取后,得到的結果如表2所示。從表2可以得出:L2 ={C8}。
根據表2,對可達集合與先行集合進行第2次抽取后,得到的結果如表3所示。從表3可以得出:L3={C1 ,C4 ,C7}。
根據表3,對可達集合與先行集合進行第3次抽取后,得到的結果如表4所示。從表4可以得出:L4={C3 ,C6 }。
根據表4,對可達集合與先行集合進行第4次抽取后,得到的結果如表5所示。從表5可以得出:L5={C2 }。
最后得到核心課程層級表,如表6所示。
4 課程層次關系分析
大數據技術專業核心課程層次關系如圖1所示。
第一層的課程是數據庫系統,可安排在第一學期。數據庫是用于存儲、管理和處理大量數據的軟件系統,是大數據技術不可或缺的基礎。Hadoop、Spark等大數據技術都依賴于數據庫系統,而這些大數據技術也被廣泛應用于數據挖掘、機器學習等領域。數據庫系統提供了大量的數據處理和管理功能,如查詢、索引、事務管理、并發控制、安全控制等,這些功能對于處理和管理大量的數據必不可少。因此,數據庫系統作為大數據技術的基礎,是大數據技術專業最基礎的課程之一,需要最先開始學習。掌握數據庫系統的知識和技能,有助于學生更好地應對大規模數據的處理和管理。
第二層的課程包含分布式數據處理、數據可視化,這兩門課程可以安排在第二學期。其中分布式數據處理的前導課程是數據庫系統。分布式數據處理建立在數據庫知識之上。學生需要掌握數據庫的基本原理和知識,能夠快速編寫SQL查詢語言,以及實際上手操作數據庫,這些都是分布式數據處理所需要的技能和知識。另外,數據庫系統還提供了諸如索引、事務、完整性控制和并發控制等重要的功能,這些功能也是分布式數據處理所依賴的。通過學習數據庫系統,學生可以掌握這些重要的功能和技能,有助于學習分布式系統的設計和開發。
第三層的課程包含數據建模、統計分析、數據安全,這三門課可以同時安排在第三學期。其中,統計分析的前導課程是分布式數據處理、數據可視化,數據安全的前導課程是數據庫系統。對于統計分析而言,分布式數據處理和數據可視化是必不可少的工具和技術。分布式數據處理可以協助學生處理大量數據,通過并行計算實現數據的快速處理和分析;而數據可視化則可以幫助學生更好地理解數據,從而提高分析的準確性和可靠性。對于數據安全,其中一個核心部分是數據庫系統。數據庫系統是數據安全的基礎,因為大多數應用程序需要與數據庫打交道。學生需要了解關系型數據庫,掌握SQL查詢語言以及防范SQL注入等攻擊。
第四層的課程是數據挖掘,需要先修讀數據建模、統計分析、數據安全、數據可視化,可安排在第四學期。數據挖掘是一個涉及多個學科領域的綜合性任務,需要很多專業知識來支持。數據建模能幫助人們了解數據是如何構成的,以及如何進行數據清洗和預處理;統計分析能夠幫助人們處理大量的數據并從中提取有價值的信息;數據安全能夠幫助人們保護數據的安全性,防止未經授權的訪問或濫用;數據可視化能夠幫助人們以圖形化的方式展現數據,更直觀地理解數據的內涵。所以,修讀這些課程將有助于人們建立一種全面的數據挖掘理解和方法,從而更好地進行數據挖掘工作。
第五層的課程是機器學習,需要先修讀數據挖掘、統計分析、數據建模,可安排在第五學期。現代大數據技術趨向于自動化和智能化,機器學習技術可以在海量數據中發現規律和模式,為大數據技術的應用提供支持。機器學習可以促進大數據處理中的數據預處理、特征提取和分類任務等,提高大數據生成的價值,減少對人工處理的依賴。大數據技術的發展離不開數據挖掘、數據分析等相關領域的知識,機器學習作為數據挖掘和數據分析的重要工具,可以幫助學生更好地理解和運用這些領域的知識。同時,學習機器學習課程需要具備一定的數學、統計學和計算機科學基礎。如果沒有良好的數據挖掘、統計分析和數據建模的基礎,學習機器學習課程會相對困難,可能會對機器學習的深入理解和應用產生影響。
5 結束語
從引入ISM模型到遞階結構的建立,專業核心課程體系結構的設計是高等職業院校大數據技術專業建設的重要內容。而ISM模型為專業課程建設提供了方法指導,并通過分析課程間的關系,優化教學計劃、排布教學進度等方面提供了有效方法。這一過程中,理論的支持與現實系統的運作吻合,為課程體系優化提供了更加可靠的基礎。