李京杰


摘? 要 語義網(wǎng)是未來萬維網(wǎng)的一種趨勢,對教育資源建設有著重要意義。為了更好地把握語義網(wǎng)在教育資源建設領域的應用方向,采用文獻分析法,從發(fā)文量、研究內容、發(fā)表來源等方面,探究語義網(wǎng)在教育資源建設領域的研究現(xiàn)狀,總結當前存在的主要問題和趨勢,提出其在教育資源建設領域應用的建議。
關鍵詞 語義網(wǎng);教育資源;網(wǎng)絡教育;教育信息化
中圖分類號:G642? ? 文獻標識碼:B
文章編號:1671-489X(2019)04-0005-04
Abstract Semantic Web is a trend of the future World Wide Web, which is of great significance to the construction of educational resources. In order to better grasp the application direction of Seman-tic Web in the field of education resources construction, the paper uses literature analysis method to explore the research status of Se-mantic Web in the field of education resources construction from the aspects of volume of issuance, content of research, and source of publication. This paper summarizes the main problems and trends, and puts forward some suggestions on the application of Semantic Web in the field of educational resources construction.
Key words semantic web; educational resources; network educa-tion; education informatization
1 研究背景
現(xiàn)今教育信息化建設已取得顯著成就,而文字、圖片、視頻等異構性的學習資源,因其自身的模糊特性和數(shù)據(jù)格式的多樣性,僅適應于人們的閱讀需求,而無法被計算機檢索系統(tǒng)精確理解。由于這些信息間缺乏內在聯(lián)系,因此給學習者甄選有效資源帶來很多困難。人機交互障礙是造成網(wǎng)絡學習低完成率和高輟學率的一個主要問題。
如今一些學者提出Web 3.0概念,其最重要也是最被看好的一點就是語義網(wǎng)[1]。智能是語義網(wǎng)最基本的內涵,它能夠根據(jù)語義進行判斷,可以實現(xiàn)人機之間的溝通,這其實已涉及人工智能范疇[1]。與傳統(tǒng)網(wǎng)絡相比,語義網(wǎng)技術能通過搜索引擎進行語義推理,使分散于全球的獨立數(shù)據(jù)庫融合,解決各種資源的兼容和推廣問題。在大數(shù)據(jù)時代,學習者正在追求一種更加智能的方式以獲取有效的學習信息。語義網(wǎng)也為實現(xiàn)深度學習創(chuàng)造了良好的網(wǎng)絡環(huán)境,人性化檢索、個性化學習、跨語言共享、深度學習等理念已經(jīng)成為未來網(wǎng)絡教育的目標。
我國教育資源建設各自為政,存在嚴重的資源浪費和共享不均的情況。本研究旨在窺探語義網(wǎng)在教育資源建設中的積極意義,為更好地促進我國教育資源環(huán)境建設提供策略參考。
2 對語義網(wǎng)的理解
語義萬維網(wǎng)(Semantic Web,簡稱語義網(wǎng))由萬維網(wǎng)創(chuàng)始人Tim Berners-Lee提出,是當前Web的延伸和擴展,是一種能理解人類語意的智能網(wǎng)絡。語義網(wǎng)研究的主要目的就是擴展當前的WWW,使網(wǎng)絡中盡可能多的信息都具有語義,在Web世界中流動的不再是單純的數(shù)據(jù)流,而是機器可以理解的語義信息,從而更便于人和計算機之間的交互與合作[2]。
目前,Web網(wǎng)頁信息的呈現(xiàn)方式多種多樣,這些信息傳遞在給人們帶來豐富的視聽信息的同時,也給人們使用搜索引擎獲取信息帶來困難。從量大而雜的信息中甄選有效內容,大部分是人工進行的,因為計算機只能理解機器語言,如數(shù)據(jù)庫、程序符號和傳感器輸入等語言;而無法理解信息的語義,如對“母親”“娘”“Mother”,計算機會當作若干個獨立概念理解,這樣就加大了有效信息共享和獲取的難度。語義網(wǎng)的研究目的是改變現(xiàn)有互聯(lián)網(wǎng)共享資源的模式,實現(xiàn)信息在語義層次的交流共享或推薦。語義理念的出現(xiàn)將深化Web的服務范疇,使網(wǎng)絡變得更加人性化和智能化,使人更加高效地獲取信息。
3 研究樣本來源及研究方法
研究樣本來源? 本文的研究文獻資源來源為CNKI中國知網(wǎng)的中文全文期刊數(shù)據(jù)庫和優(yōu)秀碩博士論文數(shù)據(jù)庫。由于Tim Berners-Lee 2001年才正式提出“語義網(wǎng)”的概念,因此,本文將時間設定為2001—2018年,以“語義網(wǎng)”和“教育資源”為條件進行搜索,在剔除與主題無關和會議報道等文獻后,截至2018年8月,一共篩選出227篇文章為研究樣本進行文獻分析。
研究方法? 筆者首先利用中國知網(wǎng)的文獻分析工具對文獻信息文檔進行關鍵詞抽取分析,然后采用內容分析法對文獻研究主題進行歸類。研究過程中主要用到SPSS統(tǒng)計軟件、WordSplit分詞軟件以及詞云圖制作軟件等工具對文獻進行數(shù)據(jù)統(tǒng)計以及可視化分析。
4 語義網(wǎng)在教育資源建設領域的文獻分析
論文總量分析? 筆者對從知網(wǎng)篩選出的227篇文獻資料進行SPSS統(tǒng)計分析??紤]到2018年時間不到一年,以及知網(wǎng)收錄的遲滯性,因此不參與本文的討論。如圖1所示,從文獻數(shù)量上看,自2002—2009年呈現(xiàn)一個非常明顯的遞增趨勢;2010—2017年每年的文獻數(shù)量有一定波動,但是不低于14篇/年,相較2008年以前每年的文獻量,整體上仍然處于上升趨勢;其中2016年為語義網(wǎng)在教育資源建設領域文獻發(fā)布最多的一年,突破26篇。
由圖1可以看出,2002—2017年整體呈現(xiàn)波動遞增狀態(tài)。分析其原因,一是與國家教育信息化發(fā)展戰(zhàn)略密不可分。隨著教育信息化的推進,人們要求提供更加智能的網(wǎng)絡服務。目前“開放”正在成為一種價值,無論內容的開放、數(shù)據(jù)的開放、資源的開放,其本質上都是順暢獲取數(shù)據(jù)和信息[3]。網(wǎng)絡教育資源正向著更加“開放”和“智慧化”趨勢發(fā)展,要實現(xiàn)人—機語言的無障礙溝通,只有達到語義層次的搜索與共享,因此,語義網(wǎng)在教育信息化中的價值,在這個發(fā)展過程中引起教育界的關注。
二是語義技術逐步成熟。早期由于語義網(wǎng)概念剛剛提出,僅有少數(shù)理論介紹;近年來隨著語義網(wǎng)技術不斷成熟,語義網(wǎng)逐漸應用于各個主要領域,如圖情檔、互聯(lián)網(wǎng)建設服務、計算機科學、軍隊建設等[4]。在生活中不難發(fā)現(xiàn),現(xiàn)今幾乎所有大型的電子商務系統(tǒng),如Amazon、淘寶、當當網(wǎng)等,都不同程度地使用了各種形式的語義推薦技術。國外語義網(wǎng)在教育應用方面每年的研究成果數(shù)量自2000年以來一直在不斷增加[5],我國的文獻總量也在波動中整體呈上升趨勢,這說明語義網(wǎng)在教育領域得到越來越多的重視。隨著網(wǎng)絡向智能化方向發(fā)展,語義網(wǎng)的應用空間將變得更加廣泛。
研究內容分析? 對研究內容的分析有助于了解語義網(wǎng)在教育資源建設領域的研究現(xiàn)狀、研究熱點、發(fā)展趨勢及存在問題。筆者對227篇甄選文獻進行內容分析,應用分詞軟件對文獻進行分詞處理,并進行熱詞研究。通過對文獻內容的詳細分析,將文獻分為圖2所示幾個主要研究方向。
在數(shù)據(jù)統(tǒng)計過程中發(fā)現(xiàn),部分論文存在研究內容交叉現(xiàn)象,本研究根據(jù)論文實際的研究重點,將其歸入主要方向所屬的一類。如圖2所示,該領域研究內容集中在三個方向,分別是“教育資源本體構建”“檢索技術領域”“促進教育資源共享”,這三項研究內容總和達到所有研究領域的60%以上;此外,“理論介紹與歸納”“促進個性化學習”“學習環(huán)境構建”等領域文獻反映出人們對語義網(wǎng)在教育領域其他方向的應用實踐探索。
發(fā)表來源分析? 分析發(fā)表來源有助于了解哪類期刊或單位在關注該領域的研究。筆者將文獻來源一共分為五類:教育類雜志;計算機科學類雜志;圖書情報類雜志;學報類雜志;碩博士學位論文。對文獻的發(fā)表來源進行統(tǒng)計,結果如圖3所示,除了優(yōu)秀碩博士論文,教育類雜志的相關文獻所占比重排在所有雜志之首,這說明語義網(wǎng)在教育領域應擁有較高的研究價值和空間。
5 語義網(wǎng)在教育資源建設應用中的問題及趨勢
語義檢索技術研究成果有待投入教育領域實踐應用? 通過文獻分析總結得出,我國語義網(wǎng)在教育領域的實踐研究主要內容是:基于語義檢索的教育資源共享方案以及共享模式研究;基于語義的教育資源個性化推薦策略研究;基于本體的教育資源建設理論研究。在現(xiàn)有研究中,方案、模式、策略等理論性探索研究居多,而實踐應用性研究較少,研究成果實用性不強。語義網(wǎng)人性化的檢索技術在教育資源的共享和個性化服務方面比萬維網(wǎng)有著絕對的優(yōu)勢,語義檢索技術切實地投入教育領域實踐應用,促進教育資源共享,是未來在教育資源領域的一個新研究方向。
解決教育資源本體庫的具體建設問題? 教育領域本體作為教育知識領域的一種專門本體,應該能夠清晰地表示教育領域主要的概念術語、屬性以及相互關系,對教育領域活動所具有的屬性規(guī)律進行形式化的描述[6]。目前在醫(yī)學、電子工程、電子政務等多個領域進行了本體構建方法的研究和實踐,為語義檢索提供了本體資源基礎,但在教育本體方面的實踐研究較少,只在一些具體的學科構建了相應的本體[6]。由于目前沒有公認的設計與評價標準及質量保證體系,因而對本體的評價方法和本體的設計方法一樣存在多元化現(xiàn)象[7]。
教育資源本體的構建需要統(tǒng)一的標準。已有研究文獻中,很多研究者一直在倡導和呼吁確定統(tǒng)一的標準,也有一些研究者對確定標準或提高本體科學性做出了實踐性嘗試,雖然小范圍保證了數(shù)據(jù)的統(tǒng)一,但仍然不能宏觀上解決問題。本體能夠以明確的形式描述信息資源的概念以及資源之間的語義關系,構建教育領域本體則意味著建立計算機能夠理解的教育資源語義標簽庫,這為解決各種教育資源的兼容和推廣問題提供了有利條件。教育資源本體庫的構建是未來語義技術廣泛投入應用的基礎。但是如何建立教育領域本體統(tǒng)一標準,本體由誰來構建,怎么建構,如何實現(xiàn)更新擴展等,都是目前研究沒有解決的問題,在將來的研究中還將是該領域需要繼續(xù)探索解決的問題。
教育資源個性化服務的實現(xiàn)問題? 目前主要的個性化推薦技術有四類:基于協(xié)同過濾技術的推薦、基于內容的推薦算法、基于規(guī)則的推薦算法、基于聚類的推薦技術。這幾類技術在應用中存在各自的缺點。目前語義網(wǎng)廣泛應用于電子商務領域的個性化推薦系統(tǒng)并已經(jīng)取得良好的經(jīng)濟效益,這對教育學界有著很大的啟示。人們大膽設想將語義技術運用于教學領域,并且初步嘗試了各種研究,語義網(wǎng)在教育個性化的應用未來將有廣泛的空間。基于語義技術的個性化推薦服務的出現(xiàn),為教育資源個性化推薦的實現(xiàn)提供了更智能的選擇,但在目前的網(wǎng)絡環(huán)境下,準確地標識用戶興趣并進行合理歸類,是語義推薦技術實現(xiàn)的難點所在。語義服務實現(xiàn)有賴于教育本體的建立以及一個完善的支持語義技術實施的網(wǎng)絡平臺系統(tǒng)的建設完善。
6 語義網(wǎng)在教育資源建設應用中的建議
創(chuàng)建語義學習生態(tài)環(huán)境? Web從1.0到3.0不斷更新發(fā)展的過程,展示了用戶對未來網(wǎng)絡發(fā)展的一種人性化和智能化需求趨勢,人們不再滿足信息獲取是否海量,而是追求信息獲得的精準性和人性化。語義技術是Web 3.0時代顯著的亮點,也是其優(yōu)勢所在。然而語義網(wǎng)的實現(xiàn)需要良好的網(wǎng)絡平臺支持。目前我國主要存在的問題是支持語義技術的教育資源網(wǎng)站非常稀少。要成為學習者廣泛使用的網(wǎng)絡平臺,就必須要以提高基于語義網(wǎng)技術的教育資源網(wǎng)站的數(shù)量和使用范圍為前提,智能語義程序必須廣泛地應用于計算機、移動學習工具等終端設備上,形成一批與語義網(wǎng)相互依賴的“智能個體”,以它們組合而形成一個以學習為目的的智能語義生態(tài)環(huán)境,才能為語義網(wǎng)在教育實踐中廣泛應用提供實現(xiàn)的網(wǎng)絡環(huán)境。
構建完善的教育本體資源庫? 本體建設主體的確定是本體構建的首要問題,因為廣泛地征集本體庫元語是提供全面的本體庫數(shù)據(jù)資源之基礎。所以建立本體的主體不應該是個別專家學者研究的專利,而應由學習者、施教者、業(yè)界專家共同參與建構。此外,要實現(xiàn)非結構化資源的共享,筆者認為教育本體庫還需要有強大的寬容度和動態(tài)更新的能力。通過全面的本體構建主體參與建設,以及本體庫自身的兼容性和擴充性,從而實現(xiàn)用戶的“查全率”。此外,一個完善的語義檢索平臺不僅體現(xiàn)在“查全率”,還體現(xiàn)在“查準率”上。業(yè)界嘗試各種方法建立本體的文獻已很多,而對本體準確性評價的研究卻很少。面對復雜的數(shù)據(jù)環(huán)境中出現(xiàn)的大量歸類錯誤或重復的現(xiàn)象,對本體的科學確認和評價是在后續(xù)工作中必不可少的一項環(huán)節(jié)。在今后的研究中,研究者更多地關注本體準確性的評價研究,實現(xiàn)對構建本體的排查和維護工作,才能保證數(shù)據(jù)定義的準確性,建構科學的本體庫。
對已建成的異構教育資源進行“歸類打包”? 我國成熟的教育信息化標準較國外來說相對較晚,教育信息化技術標準體系(CELTS)到2012年才頒布系列標準,到目前為止,該標準仍在不斷的完善中。統(tǒng)一規(guī)范的標準在本體構建中發(fā)揮著主導作用。在權威的標準建立前,我國教育資源建設已大力開展;然而標準確立之后,教育資源建設各自為政,初具規(guī)模的教育資源仍然不夠規(guī)范,教育資源建設主體的多元化很難達到統(tǒng)一,此時也很難讓各個停留在“自治共享”層次上的教育資源重新規(guī)范一次。因此,目前在此情況下,對已建成的異構教育資源采用規(guī)范的語義標簽將其“歸類打包”,則能夠避免多元的教育資源重復建設造成的資源浪費,從而使其融入新的語義生態(tài)資源環(huán)境中,提高資源利用率。
7 結語
本研究通過文獻調查,分析了語義網(wǎng)在教育資源建設領域的應用現(xiàn)狀和發(fā)展趨勢,希望通過本研究的分析能夠對語義網(wǎng)在教育資源領域的應用研究起到拋磚引玉的作用。語義網(wǎng)與傳統(tǒng)網(wǎng)絡相比,更加符合未來學習環(huán)境對開放化和個性化的追求趨勢,語義識別技術讓不同時期、不同國家、不同語言的教育資源都可以進入一個超前融合的階段,其在教育資源建設中的價值召喚著更多的研究者去關注與開發(fā)。
參考文獻
[1]余燕芳,葛正鵬.終身學習平臺建設的理念與架構:從Web2.0到Web3.0[J].電化教育研究,2014(8):57-63.
[2]Robin D, Morris.Web3.0: Implications for Online Learning[J].TechTrends,2011(1):43.
[3]NMC地平線項目.2013地平線報告高等教育版(上)[J].廣州廣播電視大學學報,2013(2):1-6.
[4]劉明國.語義網(wǎng)應用研究的文獻計量學分析[J].圖書館界,2012(3):86-88.
[5]劉清堂,黃景修,吳林靜,等.基于語義網(wǎng)的教育應用研究現(xiàn)狀分析[J].現(xiàn)代遠距離教育,2015(1):60-65.
[6]馬捷,劉小樂,黃嵐,等.教育領域本體構建研究[J].情報理論與實踐,2012(7):104-108.
[7]田俊華.基于本體知識庫的教學資源自動采集技術研究[D].南京:南京師范大學,2011.