




[關鍵詞] 數字人文;知識圖譜;在線開放課程
[摘要] 隨著人工智能與教育深度融合,知識圖譜已成為人工智能教育應用的重要支撐,并為在線開放課程建設賦新能。基于此背景,本文嘗試厘清知識圖譜對在線開放課程建設的價值意義,并在“數字人文”在線開放課程建設中應用知識圖譜在本體知識建模、多模態資源語義化管理、個性化學習多路徑供給以及學生知識掌握和實踐能力的畫像構建等方面進行設計和實踐,旨在探索在線開放課程智能應用新路徑。
[中圖分類號]H19 G40-057[文獻標識碼]A[文章編號]1674-8174(2024)04-0079-07
1. 知識圖譜為在線開放課程建設賦新能
近年來,我國在線開放課程資源呈現出科學快速、高質高效建設的發展趨勢,“高等教育平臺上線優質慕課超過2.7萬門,持續引領世界教育教學數字資源建設”①,高等教育在線開放課程已成為我國高等教育數字化的重要組成部分。但是,隨著加快發展新質生產力迫切需要大批拔尖創新人才的高等教育發展戰略部署,通過人工智能深度融入在線課程資源建設、促進在線開放課程質量提升,已成為高等教育在線開放課程建設亟待解決的重要且急迫問題。
自2012年Google公司提出了知識圖譜(Knowledge Graph)后(馬新翎、何勝、熊太純,2017),知識圖譜與深度學習一起,已成為推動互聯網和人工智能發展的核心驅動力,并成為人工智能領域的研究熱點(李涓子、侯磊,2017)。知識圖譜的本質是一種運用語義網絡結構組織知識的知識庫,在自然語言理解、人機互動對話、語義化搜索、邏輯推理等方面,顯示出強大的優勢,被認為是人工智能技術取得突破性進展的重要組成部分,因此成為當前人工智能教育應用的新的賦能力量。2017年,我國《新一代人工智能發展規劃》特別強調“要研究知識圖譜構建與學習、知識演化與推理等關鍵技術,要構建覆蓋數億級知識實體的多元、多學科、多數據源的知識圖譜”②。教育知識圖譜分為靜態知識圖譜(Static Knowledge Graph,SKG)和動態事理圖譜(Dynamic Reason Graph,DRG)(李振、周東岱、王勇,2019),前者是指面向知識點的圖譜,后者是面向教學活動的動態事理圖譜,能夠追蹤學習者的知識掌握狀態,可視化展示個體和群體學習信息。因此知識圖譜將學習知識點關聯順序、知識點與學習目標關聯層次、知識點與資源關聯模態,把碎片式、分散的教學資源與相關實體關聯成一個語義網絡,成為教育知識引擎的核心部件,進而為智能教育應用提供強有力支撐。
知識圖譜成為實現教育智能化關鍵基礎設施和重要技術,是實現各種智能化教育信息服務的基礎(劉超、黃榮懷、王宏宇,2023)。教育部為拔尖創新人才培養筑基的基礎學科系列“101計劃”中,計算機領域已經搭建完成“核心課程+知識圖譜” 12門核心課程,形成了涵蓋110多個模塊、650多個關鍵知識點的核心課程知識圖譜①。隨著我國《高等學校人工智能創新行動計劃》《中國教育現代化2035》等文件相繼出臺,推進人工智能與教育深度融合,促動學習環境、教學方式、教育管理與評價等方面變革。高校在加快推進數字化轉型中,通過知識圖譜驅動的導航學習、智能化的教學資源推薦、基于人工智能技術的實踐自動評測、個性化智能助教等方面,實現數字化教育資源和算力資源的按需供給。由此可以看出,知識圖譜為人工智能教育應用提供重要的支撐工具,為在線開放課程建設提供了新的賦能力量。
2.“數字人文”課程設計
2.1 課程建設的重要性和迫切性
“數字人文”(Digital Humanities,DH)起源于20世紀50年代提出的“人文計算”(Humanities Computing),是在計算機技術、多媒體技術、網絡技術等支撐下開展的新型跨學科研究領域(劉煒、葉鷹,2017)。20世紀90年代開始,數字人文研究正式進入大規模真實文本處理的階段(馮志偉,2023),真正實現人文與計算機的交叉碰撞。進入21世紀后,國內外數字人文研究范式轉變明顯,發展迅速。隨著通用人工智能(AGI)時代的到來,智能技術迭代與人機互動發展不斷突破人們的認知邊界,人文學科研究領域不斷從歷史、文學、法律等傳統人文學科逐漸向美術、音樂、舞蹈等傳統和現代藝術領域擴展,研究范式逐漸向數字化與回歸人文轉變,這為數字人文研究迎來一個全新的發展時代。
數字人文作為一個牽涉面很廣的交叉學科,目前還很難給它下一個大家都認可的定義。前幾年國內曾專門召開過一次“定義數字人文”研討會,最終也沒能就“數字人文是什么”這個問題達成共識(陳靜,2021)。雖然數字人文難以定義,但其核心概念、歷史和現狀、研究框架等還是比較清晰的(詳見戴安德、姜文濤,2016;郭英劍,2018;孫輝,2018)。我們國家現在越來越重視數字技術在人文學科中的作用,2023年2月,教育部等五部門聯合印發了《普通高等教育學科專業設置調整優化改革方案》,明確提出要“推進文科專業的數字化改造”。2023年4月6日,教育部發布通知(教高函【2023】3號),公布了2022年度普通高等學校本科專業備案和審批結果,“數字人文”進入最新的《普通高等學校本科專業目錄》,歸入“文學”門類下的“中國語言文學類”,專業代碼為050110T。到目前為止,國內外的數字人文中心多為研究性機構,所開設的課程多為研究生課程(參見吳加琪等,2018)。就筆者初步調研所知,目前國內開設數字人文本科課程的主要高校有武漢大學和南京大學,課程類型都屬于公共基礎課。王濤(2018)結合其所授的《數字工具與世界史研究》課程對數字人文在本科階段的教育實踐進行了經驗總結和反思,這是目前國內為數不多專門討論數字史學課程建設的論文。
黨的二十屆三中全會審議通過的《中共中央關于進一步全面深化改革、推進中國式現代化的決定》提出“教育、科技、人才是中國式現代化的基礎性、戰略性支撐”。教育部部長懷進鵬指出,在高等教育領域,暢通教育、科技、人才的良性循環,要求強化“科技教育和人文教育協同”②。面向科技發展趨勢和國家文化數字化戰略的急需,在新文科所倡導的復合融通式的人才培養理念指導下,數字人文素養應成為中國語言文學下屬漢語言文學、國際中文教育、漢語言等相關專業學生的核心素養。對于新設“數字人文”專業的院校來說,數字人文課應該成為數字人文課程群中的骨干課程。對于尚未設置“數字人文”專業的高校文科院系而言,也應該根據各院校的實際情況有針對性地開設“數字人文”專業選修課或通選課,因為數字人文課程建設不僅是新文科建設的外在要求,同時也是文學、語言學等學科發展和人才培養的內在需要。
2.2 課程性質
從課程性質來看,“數字人文”既是一門介紹跨學科知識的“通論”課,也是一門教授數字人文常用方法與技術的入門普及課,兼有理論傳授和工具應用兩方面的特點。課程旨在提高漢語言文學、國際中文教育和漢語言等相關專業學生的數字人文研究意識和數字人文核心素養,培養學生成為文理兼通、通曉理論、知識系統、技能全面的復合型人才,滿足服務國家中文國際傳播戰略的人才需要。課程吸收了數字人文領域先進的理論、方法、工具和范式,重點開展文本語料庫、多模態語料庫、文獻計量分析、數字人文常用工具的理論學習和應用實踐。通過線上和線下相結合的課程講授和實踐,讓學生盡早了解本領域的前沿動態,并重點培養學生六項數字人文核心能力,使學生逐步形成數字人文的思維方式,從而實現數字人文賦能新時代下的人才培養目標。
2.3 課程理念和目標
作為一門以跨學科能力培養為核心的骨干課程,我們始終堅持以學生為中心,結合新文科所倡導的復合融通式的人才培養理念,強化實驗實踐環節,鞏固和深化傳統的人文學科的理論知識,培養數字化條件下文科學生的科學素養、實驗實踐能力以及社會應用的技能。課程的教學過程采用“理論學習→線上線下的實驗與實踐→數字人文知識與能力的積累→數字人文社會應用”遞進式教學(見圖1)。
根據以上課程理念,我們設立了思政、知識、能力和素質四項課程目標:
(1)思政目標:立德樹人,將中華優秀文化深度融入課程內容,以強化社會主義核心價值觀引領為導向,培養學生愛國主義精神,樹立“數字人文”意識,增強學生的文化自信。
(2)知識目標:“人文研究+數智技術”深度融合的理論和知識體系,以及數字化國際中文教育、中華優秀文化傳播的新技術、新方法、新模式。
(3)能力目標:一是通過文獻計量分析進行定量和定性分析,繪制知識圖譜;二是學習計量語言學的定律,用計量方法研究語言;三是掌握數據庫的基本操作和語料庫的檢索,建立文本數據庫;四是掌握語音采集和分析的能力,建立多模態語料庫;五是學習語言田野調查和社會調查的基礎知識和方法手段,采集分析語料;六是掌握現代信息技術的方法和技術,具有初步進行國際中文教育數字資源設計和文化數字傳播的能力。
(4)素質目標:數字人文的敏感性與洞察力、科學研判的專業素養、開放思維與國際視野、創新精神與創業意識。
2.4 課程內容體系構建
根據課程定位和課程目標,本課程將深入融合“人文研究+數智技術”,將課程內容劃分為理論、方法、工具和應用四個層次。理論層側重介紹語言學、文學、文獻學、人工智能原理、心理語言學等相關理論。方法層重點應用新型數字化技術,創新人文學科的研究方法與路徑,如語料庫建設、手寫識別、語音識別、圖像識別、眼動追蹤技術、腦電技術等。工具層主要通過深入應用新型軟件工具與網絡平臺,實現人文知識的生產、傳播與創新應用,如數據庫檢索和建庫工具、文獻知識圖譜等。應用層強調發現并研究由新型數字技術帶來的中文教育、數字文化等作品研發,如數字出版工具、可視化技術、虛擬現實技術等。課程內容重點圍繞方法層、工具層和應用層進行展開,并以定量研究范式為主體,讓學生能利用相關軟件或編程語言進行單一文本和多模態數據的處理,然后通過數據驅動的方式帶動相關理論的構建,并在此過程中逐步形成計算科學的思維方式,讓數字人文真正實現對人文研究的技術賦能。課程內容框架和體例如圖2所示,數字人文課程包括七大專題,每個專題由案例展示、專題概述、發展前沿、基本概念、技術方法和工具應用組成。
3.“數字人文”在線開放課程知識圖譜構建
3.1 知識圖譜構建流程
“數字人文”知識圖譜構建在明確的課程目標基礎上,針對本在線課程在多模態知識表征、資源語義化管理、個性化學習多路徑供給、學生知識掌握和實踐能力構建等方面智能化建設需要,課程知識圖譜構建從課程本體知識圖譜、多模態學習資源圖譜和學習活動圖譜三種知識圖譜構建(見圖3),并分別定義三種知識圖譜的實體類型、實體屬性和實體關系,構建語義信息。
3.2 本體知識圖譜構建
課程基于知識的內在關聯性構建本體知識圖譜,分4個階段來開展:(1)根據教學目標和知識體系構建知識圖譜框架;(2)根據教學目標,建立知識點多維知識關系(父子、前后、關聯等);(3)結合布魯姆認知模型中“記憶、理解、應用、分析、評價、創造”六大認知層次建立知識點與認知水平關聯;(4)根據教學目標,設置知識類型(事實性、概念性、程序性、元認知),圖4是課程部分內容的知識圖譜。
3.3 多模態知識圖譜構建
“數字人文”知識圖譜中的知識點不僅包含概念、定理、原理、理論、方法等,也涵蓋了課程知識點的資源、主題、案例、教學目標、教學問題、實驗素材、實驗、作業、測試等。“數字人文” 在線開放課程包含知識點約56個,微視頻資源共56個,關聯案例資源112個,作業習題約110個,學習資源541個,實驗42個,軟件工具、網站等非視頻資源約487個等。課程資源由文本、圖像、視頻、語音、動畫等多模態素材構成,抽取課程資源中的知識實體為節點,對知識點以及知識點多模態資源實體進行標注,構建資源關聯,定義多種模態實體間的語義關系,依據知識實體之間的關系生成“知識實體—實體關系—知識資源實體”,進而形成多模態知識圖譜,為實現多模態資源語義化管理提供有力支撐。
3.4 學習活動動態知識圖譜
動態知識圖譜也稱之為動態事理圖譜,以教學事件或教學活動為表征對象,以邏輯事理順承、因果、反轉、條件、上下位、組成等關系為邊,構成的多關系圖(李振、周東岱、王勇,2019)。本課程應用泛雅超星平臺和該系統的知識圖譜對數字人文課程內容資源進行碎片化重構和整合,形成橫向融通、縱向貫通的數字人文課程知識點脈絡及資源匯聚、歸納;對微視頻、案例、文獻、課件、討論、實驗素材、軟件、網站、作業、習題和測試等教學資源進行知識點標注,通過知識點的重組關聯,實現資源的有效關聯,為學生系統化、整體化、智能化學習提供全過程的動態支撐,可以實現個性化學習路徑及資源智能推薦,構建新文科的教學服務的新生態。由于課程資源與知識圖譜關聯,所有學習行為及其結果將與知識點關聯,學習路徑直觀可見,學習者畫像可視化, 如“數字人文”知識圖譜構建示例及學生學習情況的可視化圖譜(見圖5)。
為解決本科“教—學—測—評”脫節、過程管理缺失等當下較為普遍的問題,本課通過在線課程建設,基于課程知識圖譜、資源圖譜、案例圖譜、實驗實踐圖譜等實現全過程學業管理與評價一體化的“導—學—做—練—評—研”課程學習生態。課程評價考核突出兩方面的特點:(1)評價形式多元化,采用過程性評價和結果性評價。(2)評價主體多元化。課程成績來源于教師評價、生生互評、線上教學平臺評價統計數據三個方面。
4. 課程知識圖譜應用場景
作為一門新開設的文理交叉課程,其在線開放課程突出知識圖譜在課程知識體系構建、學習資源關聯、學習環境構建、服務學生、服務教師以及服務教學全過程中的作用。在課程內容上,基于知識圖譜構建“人文研究+數智技術”課程內容,將語言學、文學、文獻學、計算機科學、心理學交叉學科的知識內在關聯,深度融合,從而形成既相對獨立又開放包容的數字人文知識體系。在教與學環境上,基于知識圖譜提供學習的多種路徑,構建“導、學、做、練、評、研”動態數據支撐的智能學習環境。在課程資源上,基于知識圖譜形成清晰的專業知識點脈絡及資源語義網絡;通過知識點的打散重組,實現知識點圖譜、知識點資源圖譜、實驗圖譜等各類多模態學習資源的有效關聯。在課程服務上,應用知識圖譜優化知識表征,為學生提供清晰的學習狀態和過程,提供個性化學習多路徑及資源智能推薦與整合。教師可對學生的學習情況進行詳細了解和精準分析,包括每個學生對每個知識點的學習情況、掌握情況以及實踐能力,為教師針對性的制定教學策略因材施教提供支撐。在教學管理上,應用知識圖譜提供學生學習情況數據,實現備課、授課、實驗、實踐、作業、評價、試卷分析等全流程教學管理,從而優化教學管理流程,促進教學質量提升。
5. 總結與展望
面向科技迅猛發展趨勢和國家文化數字化戰略的急需,在新文科所倡導的復合融通式的人才培養理念的指導下,數字人文素養應成為中國語言文學下屬漢語言文學、漢語國際教育、漢語言等相關專業學生的核心素養。由于每個學校或學院都有自身的特色和發展需求,建議新設“數字人文”專業的院校應該將“數字人文”這門課確定為數字人文課程群中的骨干課程,對于尚未設置“數字人文”專業的高校文科院系,也應該根據各院校的實際情況有針對性地開設“數字人文”專業選修課或跨學院的通選課。“數字人文”既是一門介紹跨學科知識的通論課,也是一門教授數字人文常用方法與技術的入門普及課,兼有理論傳授和工具應用兩方面的特點。因此,在教學理念和教學目標的設計上,應充分考慮到傳統課堂的不足,主動采用線上和線下相結合的方式,充分利用知識圖譜在資源關聯和知識點連接中的優勢,用更靈活多變的方式將教學內容和考核方式融合到教學的全過程當中。
知識圖譜作為智能教育從“感知智能”階段向“認知智能”階段發展的基礎(李振、周東岱、王勇,2019),已成為人工智能教育應用的重要支撐工具,能夠在在線開放課程的本體知識建模、多模態資源語義化管理、個性化學習多路徑供給以及學生知識掌握和實踐能力的畫像構建等方面提供有力的支撐,為在線開放課程智能應用提供新思路。但是,其理論基礎、平臺構架和應用示范等方面,目前仍處于起步階段。為此,我們將繼續探索和深入研究數字人文課程知識圖譜的基礎理論和優化方法,為積極推進未來“數字人文”課程群的教育知識圖譜大平臺做好示范應用。
[參考文獻]
陳 靜 2021 “是什么”與“怎么辦”——“定義數字人文”研討會綜述[J]. 數字人文研究(1):16-20.
戴安德,姜文濤(撰),趙 薇(譯) 2016 數字人文作為一種方法:西方研究現狀及展望[J].山東社會科學(11):26-33.
馮志偉 2023 數字人文研究的四個層次[J].南京師范大學文學院學報(3):1-9.
郭英劍 2018 數字人文:概念、歷史、現狀及其在文學研究中的應用[J]. 江海學刊(3):190-197.
李涓子,侯 磊 2017 知識圖譜研究綜述[J].山西大學學報(自然科學版)(3):454-459.
李 振,周東岱,王 勇 2019 “人工智能 +”視域下的教育知識圖譜:內涵、技術框架與應用研究[J]. 遠程教育雜志(4):42-53.
劉 超,黃榮懷,王宏宇 2023 基于知識圖譜的新型教材建設與應用路徑探索[J]. 中國大學教學(8):10-16.
劉 煒,葉 鷹 2017 數字人文的技術體系與理論結構探討[J]. 中國圖書館學報(5):32-41.
馬新翎,何 勝,熊太純 2017 “科學知識圖譜”與“Google 知識圖譜”比較分析——基于知識管理理論視角[J]. 情報雜志(1):149-153.
孫 輝 2018 數字人文研究框架探析與思考[J]. 情報理論與實踐(7):7-13.
王 濤 2018 數字人文的本科教育實踐:總結與反思[J]. 圖書館論壇(6):37-41.
吳加琪,董梅香,趙子菲 2018 國外數字人文專業研究生教育調查[J].圖書館論壇(6):42-48.