劉波
基于知識圖譜的學習資源平臺構建
劉波
(南京工業職業技術大學 計算機與軟件學院,江蘇 南京 210023)
針對當前職業院校學生自主學習過程中所面臨的問題,提出了一種學習資源平臺構建方法.基于此設計平臺研究了知識圖譜的構建技術架構、知識的建模過程、圖譜數據的采集處理過程、知識的抽取技術和知識的存儲等關鍵技術,介紹了知識點抽取和知識關系抽取的具體方法.平臺采用基于課程教材層次結構的本體建模方法,使用Neo4j圖數據庫進行知識存儲.該研究成果為學習資源平臺的建設提供了技術參考和支撐.
數字化平臺;學習資源;知識圖譜
隨著信息技術的不斷發展,人們的學習方式也發生了重大變革,自主學習成為了一種趨勢和需求.職業院校的學生作為應用型人才培養的主要對象,自主學習的能力和水平對其未來的職業發展具有重要影響.然而,當前職業院校學生在自主學習過程中面臨著諸多問題[1-2].首先,知識獲取不全面.職業院校學生需要掌握大量的專業知識和技能,但是傳統的教學方式往往難以覆蓋所有知識點.此外,不同教師教學風格和教學內容的差異也會導致學生知識獲取的不全面性.因此,學生需要一個全面的學習資源庫來補充和完善其所學知識.其次,知識結構不清晰.職業院校學生需要將所學知識整合成系統性的知識結構,并建立起不同知識點之間的關聯關系.然而,由于傳統的教學方式往往注重教學內容的傳授而忽視知識結構的構建,學生在知識結構的構建方面往往缺乏有效的指導和幫助.最后,學習過程不連貫.職業院校學生需要將所學知識整合并應用于實際工作中.然而,由于傳統教學方式往往強調知識點的單獨學習,而忽視知識點之間的聯系和應用,學生在實際工作中往往無法有效地將所學知識應用于實際情境中.
知識圖譜作為一種新型的知識表達方式,可以將各種不同的知識點以及它們之間的關系以圖形的方式進行展示,從而更好地幫助人們理解知識的本質和內在聯系.而基于知識圖譜的學習資源平臺,則是利用知識圖譜技術構建一個學習資源庫,為學生提供全面、系統、便捷的學習資源和知識服務,幫助學生更好地掌握知識,提高學習效率和自主學習能力.首先,基于知識圖譜的學習資源平臺可以將各種不同的知識點以及它們之間的關系以圖形的方式進行展示,從而讓學生能夠更全面地了解和掌握知識,同時避免因為信息獲取不全面而出現的學習漏洞.其次,基于知識圖譜的學習資源平臺可以幫助學生建立知識點之間的關聯性,形成知識網絡,讓學生能夠更好地理解知識點之間的內在聯系和邏輯結構,避免因為知識結構不清晰而出現的學習難度.同時,基于知識圖譜的學習資源平臺可以將各種知識點之間的關系進行清晰地展示,讓學生能夠更好地理解知識點之間的關聯性和邏輯順序,避免因為學習過程不連貫而出現的學習障礙.
因此,建立基于知識圖譜的學習資源平臺可以有效地解決職業院校學生自主學習過程中所面臨的問題.本文的研究旨在探索基于知識圖譜的學習資源平臺的構建方法和技術,以提供技術支撐和參考,為職業院校學生自主學習提供更好的學習環境和學習資源.
學習資源平臺是一種數字化智能平臺,其基于職業院校專業知識圖譜以及職業崗位技能要求進行聚合.為了構建這樣一個平臺,需要對相關資料進行查閱,理清知識圖譜、職業本科專業課程體系、企業用人技能要求等相關內容,以及歸納總結平臺構建的關鍵環節.此外,在平臺構建過程中,還需要整理分析多源數據,梳理學習內容圖譜數據.同時,通過現代信息技術構建數字化學習環境,并采用知識圖譜技術來組織和序列化學習內容.通過將課程知識圖譜、學科知識結構和學習內容進行深度融合,可以滿足不同認知階段和不同能力水平學習者的不同教育需求,促進傳統學習方式的變革.
基于知識圖譜的學習資源平臺的構建過程可以總結概括為4個步驟:
需要查閱相關資料,如文獻、書籍等,以理清知識圖譜、職業院校專業課程體系、企業用人技能要求等相關內容,并將平臺構建的關鍵環節進行歸納總結.
在平臺構建過程中,需要整理分析多源數據,梳理學習內容圖譜數據.通過現代信息技術構建數字化學習環境,并采用知識圖譜技術來組織和序列化學習內容,以幫助學生更好地“看得見”學習內容.
通過將課程知識圖譜、學科知識結構和學習內容進行深度融合,可以滿足不同認知階段和不同能力水平學習者的不同教育需求,促進傳統學習方式的變革.
構建好基于知識圖譜的數字平臺后,需要將其應用于教學實踐,并收集伴隨性數據和學習者反饋數據,對數據進行整理分析,并驗證平臺的有效性.同時,還需要總結存在的問題并加以改進,以提高平臺的效果和用戶體驗.
通過4個步驟,可以構建出一個基于知識圖譜的學習資源平臺,該平臺可以幫助學生更好地理解和掌握學科知識,同時也可以滿足不同學生的不同學習需求,從而促進傳統學習方式的變革.
知識圖譜是一種用于描述和組織知識的技術架構[3],在教育領域,要求其對知識的深度和廣度進行準確描述和表達.本文采用自頂向下和自底向上結合的方式來構建知識圖譜,這種方式能夠更好地滿足教育領域的知識組織和應用的需求.
在構建知識圖譜的過程中,首先,進行知識建模,通過學科教學團隊人工編制,確定學科知識體系并梳理知識構成,逐步細化到各個知識點,形成知識層次結構.在此過程中,需要考慮知識的概念、屬性和關系的準確描述和表達,保證知識結構的合理性和學習資源平臺的可擴充性.其次,確定數據來源并進行知識抽取,將知識實體、實體屬性和實體關系添加到三元組中.這一步驟是非常關鍵的,需要采用自然語言處理和機器學習等技術,對大量的學術文獻、教材和網絡資源進行分析和挖掘,以獲取可靠的知識數據源.最后,進行知識融合、本體構建和知識展示.在知識融合方面,需要將不同數據源中的知識進行整合,去重和歸一化,確保知識的一致性和完整性.在本體構建方面,需要建立起一套規范的知識表示語言和本體模型,以實現對知識的自動化處理和應用.在知識展示方面,需要提供可視化界面和搜索引擎等工具,使用戶能夠快速準確地獲取所需知識.
因此,基于知識圖譜的學習資源平臺構建是一項復雜的任務,需要采用多種技術和方法進行配合,以保證知識的準確描述、組織和應用.本文的知識圖譜構建框架見圖1,這一框架為職業教育領域的知識組織和學習資源平臺的建設提供了重要的指導和支持.其中,知識建模階段是構建知識圖譜的基礎,決定了知識圖譜的準確性和可擴展性;知識抽取階段則是獲取知識數據源的關鍵步驟,需要采用多種技術和方法進行數據挖掘和分析;知識融合和本體構建階段則是對知識進行規范化和整合的關鍵步驟,保證知識的一致性和應用的效率;知識展示階段則是將知識呈現給用戶的重要環節,需要提供直觀、易用的界面和工具,以滿足用戶的需求.

圖1 知識圖譜構建框架
知識建模是對知識的概念、屬性和關系進行準確描述和表達的過程.在知識圖譜學習資源平臺構建過程中,知識建模是非常重要的環節.本文的研究對象是職業本科教育領域,因此相較于其他通用知識圖譜,其廣度、深度和細粒度方面都有更高的要求.
在進行知識建模時,需要考慮如何保證知識結構的合理性和學習資源平臺的可擴充性.對于職業教育領域而言,需要建立起專業類、課程類、章節類、知識點類和學習資源類等5個分類,并考慮各分類間的橫縱關系,分類之間的關系見圖2.
在專業類方面,需要對各個專業的知識領域進行建模,包括專業名稱、專業描述、專業方向、所屬行業等屬性,并通過關系連接不同的專業.在課程類方面,需要對各個課程的知識領域進行建模,包括課程名稱、課程描述、課程目標、所屬專業等屬性,并通過關系連接不同的課程.在章節類方面,需要對各個章節的知識領域進行建模,包括章節名稱、章節描述、所屬課程等屬性,并通過關系連接不同的章節.在知識點類方面,需要對各個知識點的知識領域進行建模,包括知識點名稱、知識點描述、所屬章節、知識點類型等屬性,并通過關系連接不同的知識點.在學習資源類方面,需要對各個學習資源的知識領域進行建模,包括資源名稱、資源描述、所屬知識點、資源類型、資源路徑等屬性,并通過關系連接不同的學習資源.
在這個知識圖譜中,每個節點代表一個知識點或學習資源,每個節點都有自己的屬性,例如:知識點的名稱、描述、類型,或者學習資源的名稱、描述、類型和路徑等.節點之間的邊代表不同節點之間的關系,例如:一個學習資源所屬的知識點,或者一個章節所屬的課程等.通過這樣的知識建模方式,可以在職業本科教育領域中建立起一個詳細、準確、全面的知識圖譜,幫助學習者更好地理解和掌握相關知識,同時也能夠幫助教師和教育管理者更好地制定教學計劃和評估學習效果.此外,保證學習資源平臺的可擴充性也是一個重要的考慮因素.在知識建模時,需要充分考慮未來的拓展和升級,保證平臺的可持續發展.因此,在建立知識圖譜時,需要注意數據格式的統一性和可擴展性,并預留一定的空間以容納未來可能新增的節點和邊.

圖2 各分類橫縱關系
在知識圖譜學習資源平臺構建過程中,學習資源數據采集與處理是重要的環節之一.學習資源主要來源于課程教材、教材配套的教學資源和互聯網數據等3個方面.
2.3.1 課程教材 課程教材是專業領域知識的高度凝練,適合作為知識構建的主要數據源.在選擇課程教材時,需要經過學科教學團隊的專業評估和討論,同時要充分結合當前就業市場的職業能力要求,確保教材具有實際應用價值.不同的課程教材以不同的角度進行教學知識闡述,有助于學習者從多角度進行知識學習,同時也為學習資源平臺提供了多樣化的數據源.
2.3.2 教材配套的教學資源 教材配套的教學資源是目前各大出版社新出版教材的必備內容.這些教學資源如課件、教案、案例、習題等拓展了教材的學習內容,具有很強的系統性和針對性.此外,配套的二維碼、網址等同步學習資料可以隨時隨地獲取并使用,方便快捷,極大地提高了學習效率.
2.3.3 互聯網 互聯網也是重要的學習資源來源.在信息化時代,眾多教育教學網站提供了大量教學資源,這些教學資源進一步完善了學習者的學習系統性.同時,各類招聘網站的招聘信息中,也明確提出了各個職位的職業能力需求.學習者可以通過互聯網更加全面地了解就業環境,幫助學習者更好地做好職業能力準備和職業學習規劃.
在收集和存儲學習資源之后,需要對這些資源進行篩選和處理,才能夠進行資源數據采集.這個過程可以通過文本挖掘技術和自然語言處理技術來實現.文本挖掘技術可以從非結構化文本中找出結構化的數據,自然語言處理技術可以自動抽取知識信息,將其轉化為結構化數據.這些技術的應用,可以大幅度提高資源數據采集的效率和準確性.但是,由于學習資源的來源非常廣泛,其質量和可信度也參差不齊,因此在進行數據采集和處理時需要注意4個方面:(1)來源可靠性.在選擇學習資源時,應盡量選擇來源可靠、內容真實可信的教育機構或網站,以免誤導學習者.(2)版權問題.對于非自主創作的學習資源,需要尊重原作者的知識產權,確保獲取學習資源的合法性和版權合規性.(3)內容質量.需要對收集到的學習資源進行評估和篩選,保證內容的質量和實用性.同時,應注意資源的時效性,及時更新或淘汰過期的學習資源.(4)數據格式.為了便于資源管理和利用,需要對采集到的學習資源進行標準化和分類,建立起完整的知識圖譜體系.通過這些措施,可以保證學習資源的質量和可信度,提高學習資源平臺的知識覆蓋率和應用價值,從而更好地服務于學習者和教育機構.
數據采集完成后還需要進行分詞處理,本文主要采用Jieba對課程教材內容進行分詞操作.Jieba具有詞性標注、統計詞頻、關鍵詞抽取以及去除停用詞和標點符號等功能.對于一些相關領域的專業詞匯,則需要人工手動添加.
2.4.1 知識點抽取 在知識圖譜的構建前,要對專業領域知識進行分析、提煉等處理操作.提取知識點及知識點之間的關系,分析各知識點之間的層次關系,然后建立知識本體模型,最終以本體模型作為知識圖譜的組織框架,進行實例數據的填充,完成知識圖譜的構建[4].知識點作為知識圖譜構建的重要組成單位,應首先將課程知識點抽取出來.
TF-IDF(Term Frequency-Inverse Document Frequency)是一種常見的數據挖掘與信息檢索技術,主要用于文本特征提取.其核心思想在于:一個詞語的出現頻率,與該詞語對某篇文章的重要程度成正比,但與在語料庫中出現的頻率成反比.即一個詞語在文章中出現的頻率越高,則該詞語越能代表該文章,可以視為該文章的關鍵詞.
TF-IDF是TF與IDF乘積的一種算法,其中:TF為詞頻;IDF為逆文檔頻率.TF是指一個詞語在某篇文章的出現次數與該文章總詞數之比,IDF是指在某篇文章中,給定一個詞語在其他文章出現的次數,用來檢測該詞語的普遍程度是否能作為區分該文章與其他文章的詞語.TF-IDF的計算公式[5]為



通過TF-IDF抽取知識關鍵詞后,再經由人工標記歸納無用詞,保留該專業領域的關鍵詞.將保留的關鍵詞交由專家查看、審核、補充和完善,最終得到高質量的核心關鍵詞,并將這些關鍵詞作為課程知識點.
2.4.2 知識關系抽取在知識圖譜中,知識之間通過關系相互關聯,并最終構成語義網絡,主要采用兩階段的方式進行關系抽取.一階段采用關鍵詞觸發的方式進行關系抽取.在關系抽取前,對文章進行統計分析,把一些常用關鍵詞作為核心關鍵詞,利用關鍵詞匹配的方式獲取知識關系,常見的關鍵詞[6]見表1.

表1 常見的關鍵詞
在二階段主要采用依存句法分析的方法進行關系處理.句法分析主要用于確定句子的句法結構以及句子中詞與詞之間的依存關系,依存句法分析則是通過分析語句結構中成分之間的依存關系解釋其句法結構,發現語句語法特征和語義聯系.依存句法分析廣泛應用于實體關系抽取、情感分析、自動問答、觸發詞識別等自然語言處理任務之中[7].本文使用的依存句法分析工具是LTP[8],LTP是由哈爾濱工業大學研制的一套中文自然語言處理系統,集成了詞法、句法和語義分析等中文語言處理技術,能夠幫助研究者深入研究語言各個層面之間的關系[9].
知識圖譜的構建是非常關鍵的一個環節,在構建本體模型時,需要從“章節”到“知識點”再到“資源”的方式進行建模.使用本體庫Protégé[10]來建立知識圖譜模式層,該層包含相關概念、屬性和關系等信息.知識圖譜本體分為模式層和數據層2個層次,模式層是本體建模的模板,用于描述概念之間的關系和屬性;數據層則用于填充模式層,以創建具體的實例.
在本體建模的過程中,著重考慮了課程教材的層次結構.通過對不同層次的教材內容進行分析,以建立一個更加完整的知識圖譜模型.例如:可以將一個課程的每個章節作為模式層的一個概念,并將每個章節下的知識點作為該概念的屬性.通過這種方式,可以建立一個更加完整的知識圖譜,可以幫助學習者更好地了解課程內容.
在填充數據層的過程中,使用了Neo4j[11]圖數據庫進行知識存儲.Neo4j圖數據庫是一種非關系型數據庫,它可以存儲具有復雜關系的數據.通過將模式層中的概念和屬性映射到數據庫中的節點和屬性上,將概念之間的關系映射為數據庫中的邊.通過這種方式構建一個高效的知識圖譜,并可以方便地查詢和管理其中的數據.
本文的方法在構建知識圖譜時,更加注重數據的層次結構,從而更加準確地描述了不同概念之間的關系和屬性.而使用圖數據庫來存儲知識圖譜,使查詢和管理數據更加高效和方便.然而,值得注意的是,學習資源的來源非常廣泛,其質量和可信度也參差不齊.在實際應用中,需要對資源的質量和可信度進行評估和篩選,以確保學習者可以獲得高質量和可靠的學習資源.
在學習資源平臺構建過程中,以“人工智能工程技術”專業為實驗對象,具體分析了專業信息,包括課程類、章節類、知識點類和學習資源類及其應包含和具備的學習內容,學習內容示例數據見表2~6,人工智能導論課程的知識圖譜內容見圖3.在下一步的研究中,還將在知識圖譜中加入來自學生學習數據的實時反饋,以進一步優化知識圖譜的質量.通過對知識圖譜的評估,所構建的知識圖譜能夠有效地支持學習資源的推薦和學習過程的輔助.

表2 專業類示例數據

表3 課程類示例數據

表4 章節類示例數據

表5 知識點類示例數據

表6 學習資源類示例數據

圖3 人工智能導論課程的知識圖譜結構
本研究通過知識圖譜的構建和學習資源的推薦,能夠為學生提供個性化、高效的學習支持,有望成為未來在線教育平臺的重要發展方向.
本文研究了學習資源知識圖譜平臺的構建方法,通過教學精準化以滿足學習者的職業化學習需求,縮短學習者匹配職業崗位的時間成本,提升學習資源的開發質量和利用率.通過數據分析和人工智能技術,將學習者的學習內容及資源以圖譜化的方式進行展示,打破原有參照普通教育建立的“以教師為中心”的學習生態系統.通過該平臺讓學生直觀地了解所學知識脈絡、職業技能需求及職業差距,引導學生更有針對性地學習,更好地發揮他們學習的積極性和主動性,促進教育資源的最大化利用,使得優質的教育信息資源的使用率大幅提升.在下一步的工作中,還需要研究學習者畫像的構建.通過對學習者的基本信息、學習內容以及學習行為等數據的收集,刻畫學習者的個體化特征和行為特征,對用戶、標簽、資源等個性化數據進行聚類和分析,最終實現個性化學習資源推薦服務.
[1] 劉煒杰.特殊情形下職業院校在線教學模式的構建研究[J].職教論壇,2020(4):49-54.
[2] 王雯,韓錫斌.職業院校課程混合教學設計的現狀分析[J].教育與職業,2020(9):95-100.
[3] 劉嶠,李楊,段宏,等.知識圖譜構建技術綜述[J].計算機研究與發展,2016,53(3):582-600.
[4] 家明強.基于知識圖譜的課程學習系統設計與實現[D].昆明:云南師范大學,2021.
[5] 唐曉波,劉江南.基于BERT和TF-IDF的問答社區問句自動標引研究:以金投網問答社區為例[J].情報科學,2021,39(3):3-10.
[6] 蔣婷,孫建軍.領域學術本體概念等級關系抽取研究[J].情報學報,2017,36(10):1080-1092.
[7] 鄒超群.基于知識圖譜的智慧學習平臺的設計與實現[D].西安:西安理工大學,2020.
[8] 李曉,解輝,李立杰.基于Word2vec的句子語義相似度計算研究[J].計算機科學,2017,44(9):256-260.
[9] 劉挺,車萬翔,李正華.語言技術平臺[J].中文信息學報,2011,25(6):53-62.
[10] 洪娜,張智雄.Protégé在科研本體構建與推理中的實踐研究[J].現代圖書情報技術,2009(增刊1):1-5.
[11] 王紅,張青青,蔡偉偉,等.基于Neo4j的領域本體存儲方法研究[J].計算機應用研究,2017,34(8):2404-2407.
Construction of learning resource platform based on knowledge graph
LIU Bo
(School of Computer and Software,Nanjing Vocational University of Industry Technology,Nanjing 210023,China)
A method is presented for constructing a learning resource platform to address the challenges faced by vocational college students in their independent learning processes.The design of the platform is based on the investigation of key technologies such as the construction of knowledge graphs,the modeling process of knowledge, the collection and processing of graph data,knowledge extraction techniques,and knowledge storage.Specific methods for knowledge point extraction and knowledge relationship extraction are introduced.The platform adopts an ontology modeling approach based on the hierarchical structure of course textbooks and utilizes the Neo4j graph database for knowledge storage.The research findings provide technical references and support for the development of learning resource platforms.
digital platform;learning resource;knowledge graph
1007-9831(2023)07-0041-07
TP311
A
10.3969/j.issn.1007-9831.2023.07.009
2023-03-06
江蘇省現代教育技術研究課題(2022-R-100280)——職業本科院校學生學習資源圖譜化研究;江蘇高校哲學社會科學研究課題(2023SJYB0537)——數字化賦能職業教育高質量發展研究
劉波(1986-),男,江蘇徐州人,工程師,碩士,從事智慧教育研究.E-mail:liubo@niit.edu.cn