劉歡 張廣娜



摘? 要? 互聯網技術與各領域的深度融合推動著教育事業的發展,解構知識圖譜的理論內涵,構建計算機應用基礎課程的本體模型和知識圖譜,并利用Neo4j對圖譜進行可視化,結合校本資源和學生數據進行教學實踐,以期運用知識圖譜創新教育教學方法,為提高教學質量提供參考。
關鍵詞? 計算機應用基礎;知識圖譜;可視化
中圖分類號:G712? ? 文獻標識碼:B
文章編號:1671-489X(2022)22-0078-04
0? 引言
如今,利用網絡進行教學和學習的教育方式越來越被廣泛使用。網上學習時,學生對知識點的理解是孤立零散的,難以系統地掌握所學知識點,在檢索及學習知識的過程中效率低下。只有對知識進行分析、整理,找準內在聯系、弄清知識脈絡,形成知識結構體系,根據學生對知識的掌握情況,針對學生特征提供學習資源,才能幫助他們提高學習效率。因此,將學科知識點構建成知識圖譜應用于教學,為提高教育教學質量帶來希望。
在教育知識圖譜方面,Fabian K等[1]在2013年首次將概念圖引入教育教學;Yang Y等[2]應用誘導圖挖掘課程之間的內在關系。在國內,最早開始的是2013年關于旅游管理學科課程教學的研究,隨后,CSDN應用知識圖譜推出計算機知識系統[3];張春霞等[4]基于數學課程本體,研究數學課程知識圖譜的構建方法,并提供一種形式化的、顯式的課程知識表示,改善知識服務效果;何政等[5]針對C#程序設計課程構建知識圖譜并設計學習導航系統,在實際教學中進行實踐運用;楊娟等[6]對教育知識圖譜模型構建進行研究,構造教育知識圖譜KSCG理論模型,為自適應學習提供一定的理論支撐;朱鵬[7]通過從優質的教育資源站點采集課程知識,完成課程知識圖譜的構建。
本文采用自頂向下與自底向上結合的半自動方式構建計算機應用基礎課程知識圖譜。
首先,自頂向下使用Protégé本體建構工具對計算機應用課程可視化。
其次,根據課程本體,從百度網站、校本數字化學習平臺網站中爬取數據;應用數據進行實體與關系的抽取。
最后,采用Neo4j進行存儲與可視化。
課題組把課程知識圖譜應用于實際教學中,并通過調查問卷和測試,發現該技術能有效增強學習效果。
1? 相關知識
一般來說,課程知識圖譜可以分為模式層和數據層兩個層次:模式層存儲提煉加工后的知識,而數據層儲存真實具體的數據信息;模式層可通過構建本體對其進行設計,而數據層一般使用數據庫進行管理。
1.1? 本體
在課程領域的知識圖譜中,課程本體是指構成課程的核心概念、課程概念之間的相互關系以及概念的一些描述信息,如定義、內容等。本體建模的方法主要有七步法、Methontology方法、IDEF-5法、TOVE法、骨架法等。一些常見的本體開發工具有Ontolingua、WebOnto、Protégé等。
1.2? 知識圖譜
狹義的知識圖譜本質上是大規模的語義網絡,由節點以及連接節點的邊構成,其中節點表示實體、屬性值、概念等,邊表示節點間的相互依存關系或屬性,可以使用三元組表示:<實體1,關系,實體2>和<實體,屬性,屬性值>[8]。
構建知識圖譜的主要流程是從結構、半結構或非結構化的數據出發,將其歸一為結構化數據,使用融合算法進行實體消歧,得到實體數據,抽取關系建邊,存入知識庫。
2? 知識圖譜的構建
計算機應用基礎課程知識圖譜,主要構建過程包含本體構建、基于Scrapy的數據獲取、基于TF-IDF的實體抽取、實體間的關系抽取以及課程的知識存儲與可視化。
2.1? 本體構建
大學計算機基礎課程為大學計算機專業課程體系中的第一門基礎課程,也是非計算機專業必修的公共基礎課,課程內容主要涉及計算機各領域概念,內容主要包含計算機基礎知識、Windows操作系統、Word文檔、Excel表格、PowerPoint演示文稿制作軟件、多媒體技術基礎和網絡信息安全等。組織形式上可歸納為課程知識點、課程知識塊與課程知識體系等。課程知識點與知識塊之間相互關聯,知識模塊之間也存在關系,在本體的構建構成中主要包含分類、屬性、包含、平行、前驅—后繼關系等,關系的定義影響著課程結構體系的構建。參考大學計算機基礎教材,使用Protégé軟件構建本體關系模型,如圖1所示。
2.2? 數據的獲取
本文使用Scrapy爬蟲技術對數據進行爬取,過程主要包括Scrapy引擎、資源調度、數據下載、解析以及數據內容處理五個部分。首先確定課程語料采集目標站點:百度文庫中包含很多計算機技術方面的資料,采用Scrapy技術對網頁數據進行爬取。其整個爬蟲的處理流程為:
1)初始化URL;
2)調用parse()方法,進入爬蟲核心程序;
3)定義數據抽取算法;
4)解析URL,設置數據保存目錄;
5)抽取網頁數據并保存。
2.3? 課程領域概念抽取
對網站有關數據爬取后,需要對課程領域關鍵詞進行抽取,抽取關鍵字的技術又分為有監督的算法和無監督的算法兩類。本研究主要使用基于無監督的TF-IDF算法對概念詞進行抽取。
TF-IDF就是計算TF與IDF的乘積,TF表示詞頻,IDF表示逆文檔頻率。其主要思想是,如果某個詞語在相關文章中出現的頻率高,并且在其他不緊密相關的文章中出現的次數少,則認為詞語具有良好的分類能力。
對于抽取的課程知識的詞匯來說,TF是指在一篇文檔中某個詞語出現的次數m與文檔總詞數n的比值:
IDF指的是總文檔數N與包含該詞語的文檔數M的比值,再取對數:
分母加1是為了避免分母為0。
然后,求TF-IDF的值:
TF-IDF(w)=TF(w)*IDF(w)
IDF—般可以篩選出常見詞,該算法已在jieba
中實現,直接調用即可實現,主要代碼為:
import jieba
import jieba.analyse
jieba.analyse.extract_tags(open(“*.txt”,rb).
read(),topK=30,withWeight= False, allowPOS=())
2.4? 實體消歧
在完成信息抽取后可能出現實體歧義,此時要進行關鍵字對齊,即對課程概念之間相似度進行計算。此部分利用Python工具包gensim調用word2vec,其主要代碼為:
from gensim.models
import word2vec
model=KeyedVectors.load_word2vec_format(ck_word2vec_model_file,binary=True)
model.most_similar(query_list[0],topn=5)
在得到的與課程概念相似度靠前的幾個詞中進行篩選。經過算法篩選出來的關鍵詞中尚存在一些無用的關鍵詞,因此有必要進行二次過濾,去掉無用詞、相似詞,經過質量評估,獲取最終的課程關鍵詞,其部分結果如表1所示。
2.5? 概念關系抽取
課程關鍵詞抽取后,要確定關鍵詞關系。在課程本體的構建過程中應用到的知識關系主要包括分類關系、包含關系和上下位關系等。
對于分類關系數據,基于迭代K-means算法生成,其算法思想是:
1)初始化,任意選擇k個點作為中心點;
2)分別計算其他點到每個中心點的距離,將其分配到離它最近的中心點;
3)重新計算已經得到的各個類的中心點;
4)迭代第2)和第3)步,直到中心不再發生變化或達到迭代次數,則停止迭代。
對于上下位關系,主要基于教材等圖書目錄信息來確定,算法步驟為:按照目錄的組織,進行深度遍歷,按照關鍵詞出現的先后順序進行排序。但由于源數據的不同,部分關鍵詞會有不同關系,這時就輔助以人工的方式進行判斷。
執行上述操作后,得到本文課程知識圖譜構建中的節點和關系。
2.6? 知識圖譜可視化
通過前面的數據處理,已將課程內容中的關鍵詞和關鍵詞的關系抽取出來,下一步則是把課程知識存儲起來。本文選擇Neo4j引擎,在Windows下,使用Java語言對計算機應用基礎課程知識圖譜進行可視化,如圖2所示。
3? 知識圖譜在教學上的應用
課題組將計算機應用基礎知識圖譜應用于教學,應用于線上線下相結合的授課實踐之中。教師授課過程中將圖譜作為輔助教學的工具,引導學生使用知識圖譜進行自主學習。具體實施方式體現在,根據學院現有學習平臺數據,把智慧課堂、在線網絡學習空間、移動學習平臺、大數據分析與質量監控平臺有效地聯動利用起來,對學生個人進行跟蹤,根據學生當前狀態和學習接收能力,為其篩選推薦合適的學習資源及學習計劃。
學生在課堂之外使用知識圖譜進行自主學習,根據圖譜查看當前學習模塊包含的知識點集合,以及和其他知識點的關聯,判斷知識點的前驅后繼關系,生成各知識點模塊的學習順序。同時,鼓勵學生利用網絡資源自學,結合知識圖譜能夠構建課程學習的整體感,幫助形成課程知識體系。最后,專業課教師借助知識圖譜集體備課,教授同一門課程的教師可以共享彼此資源,構建側重點不同的課程知識圖譜,減少重復性工作。
課題組教師在教授班級中,在2021年下半學期進行教學實踐實驗,以期中測試時間為分界點,前半部分時間未使用知識圖譜教學并對學生進行期中測試,后半部分時間把知識圖譜引入教學,分別在期中、期末對學生學習效率、課程知識體系構建、對教師滿意度以及考試成績等方面進行調查打分,以100分為滿分,圖3為調查打分結果。
數據顯示,本研究使學生在以上方面均有提高,說明知識圖譜在一定程度上能夠增強學生的課程學習效果。
4? 結束語
本文研究知識圖譜技術內涵,構建出計算機應用基礎課程知識圖譜,以可視化的形式將課程知識內容展現給學生,學生可以直觀看出知識點間的內在聯系,清晰課程知識體系,提高學習效率,幫助教師發揮資源優勢、共同提高,促進實現線上與線下相結合的教與學方式。但是,作為新的研究熱點,知識圖譜應用于教育教學在技術上還不是很成熟,相信隨著相關研究的不斷深入,知識圖譜將會為教學提質增效。
參考文獻
[1] Kneissl F, Bry F. Fostering Concept Maps Aware-ness as a Means to Learning[M]//2013 IEEE ThirdInternational Conference on Cloud and Green?Computing,2013:354-357.
[2] Yang Y M, Liu H X, Carbonell J, et al. ConceptGraph Learning from Educational Data[J].8th ACMConference on Web Search and Data Mining,2015.
[3] Network Chinese Software Developer.知識庫[EB/??OL].(2018-01-02)[2018-01-02].http://lib.csdn.??net/home.
[4] 張春霞,彭成,羅妹秋,等.數學課程知識圖譜構建及其推理[J].計算機科學,2020,47(S2):573-578.
[5] 何政,葉剛.基于知識圖譜的C#課程學習導航系統研究[J].太原城市職業技術學院學報,2021(9):97-99.
[6] 楊娟,杜旭,李浩.自適應學習系統中教育知識圖譜? ?模型構建研究[J].中國教育信息化,2021(24):24-29.
[7] 朱鵬.基于Web文檔資源的課程知識圖譜構建及應用研究[D].昆明:云南師范大學,2019.
[8] 張吉祥,張祥森,武長旭,等.知識圖譜構建技術綜述[J].計算機工程,2021,48(3):23-37.
[9] 家明強.基于知識圖譜的課程學習系統設計與實現[D].昆明:云南師范大學,2021.
*項目來源:2021年度河南交通職業技術學院教學改革研究與實踐項目“基于知識圖譜的信息化教學研究與實踐”(課題編號:2021JG038)。
作者:劉歡,河南交通職業技術學院現代教育技術中心,講師,研究方向為計算機應用技術;張廣娜,河南交通職業技術學院交通信息工程系,高級工程師,研究方向為智能交通技術(450018)。