許艷丹,張前進
(安徽國防科技職業(yè)學院,安徽 六安 237011)
Drupal平臺下關聯(lián)數(shù)據(jù)在MOOC教育資源共享中的研究*
許艷丹,張前進
(安徽國防科技職業(yè)學院,安徽 六安 237011)
通過對MOOC教育資源的應用現(xiàn)狀與關聯(lián)數(shù)據(jù)在教育資源共享應用中的應用現(xiàn)狀研究,提出使用關聯(lián)數(shù)據(jù)解決MOOC課程資源碎片化、片段化的解決方案,并介紹了關聯(lián)數(shù)據(jù)應用的實現(xiàn)過程、體系框架。開源CMS內(nèi)容管理平臺Drupal對關聯(lián)數(shù)據(jù)的支持使預算較小的MOOC平臺進行教育資源共享成為可能。最后介紹了利用Drupal實現(xiàn)創(chuàng)建與發(fā)布關聯(lián)數(shù)據(jù)。
關聯(lián)數(shù)據(jù);內(nèi)容管理系統(tǒng);Drupal;MOOC
從2001年麻省理工學院實施的“開放式課件”(Open Courses Ware,OCW)項目到2002年聯(lián)合國教科文組織在巴黎召開的“開放課件對于發(fā)展中國家高等教育發(fā)展的影響”專題論壇上提出的“開放教育資源(Open Educational Resources,OER)”概念,開放獲取理念的運動已蓬勃發(fā)展了14年。網(wǎng)絡上的開放教育資源(特別是開放課程)日漸豐富[1]。2012年,大型開放式網(wǎng)絡課程,即MOOC(Massive Open Online Courses)快速成長。MOOC的出現(xiàn)是開放式課程發(fā)展到新階段的產(chǎn)物。MOOC是基于在線網(wǎng)絡平臺針對大規(guī)模不確定受眾的學習平臺,具有課程受眾面廣、參與自主性強、課程資源豐富、課程知識碎片化、課程服務個性化等特點。2012年以來,MOOC獲得了飛速發(fā)展,比較有代表性的有Coursera、Udacity、edX、FutureLearn、Open2Study等MOOC平臺提供商。這些平臺提供的課程數(shù)量也是逐年成倍增加,如2014年4月Courdera提供600多門,edX提供近200門,到了2015年9月Coursera提供1300多門[2],edX提供500多門[3]。國內(nèi)MOOC發(fā)展也是比較迅速,安徽省僅2014年省級資助立項MOOC達107門課程。這些數(shù)量巨大MOOC課程資源,一般是以松散性的知識點作為課程資源的組織方式。這樣就造成了MOOC課程資源以一種碎片化的狀態(tài)存在于各個MOOC平臺中,難以被用戶發(fā)現(xiàn)和重用。同時,碎片化的資源能夠為用戶提供更加多樣化的學習,哈佛大學的Peter K.Bol教授提出“我們的MOOC平臺反而要考慮如何提供更加碎片化和結構化的多樣選擇,比如以片段而不是課為單位[4]”。因此如何將大量碎片化、片段化、結構化并且具有相同主題的MOOC課程資源串聯(lián)起來,方便用戶進行課程檢索,同時能根據(jù)用戶的需求為其提供個性化推送服務是MOOC平臺需要改進的方向。
關聯(lián)數(shù)據(jù)描述了一種發(fā)布結構化數(shù)據(jù)的方法,該方法能夠讓數(shù)據(jù)相互關聯(lián),并通過語義查詢讓數(shù)據(jù)更有用。關聯(lián)數(shù)據(jù)是建立在比如HTTP、RDF和URIs標準的Web技術上,但并不是使用這些技術為人類讀者提供Web頁面,而是擴展它們實現(xiàn)能夠通過計算機自動閱讀來分享知識的方法[5]。通過關聯(lián)數(shù)據(jù)的概念描述可以看出基于關聯(lián)數(shù)據(jù)(Linked Data)的語義數(shù)據(jù)網(wǎng)絡可以使各個MOOC平臺中的課程資源有效關聯(lián)契合在一起,形成一個巨大的數(shù)據(jù)Web,對于MOOC課程資源的發(fā)現(xiàn)、重用、分享、融合、互操作具有重要作用。本文通過對關聯(lián)數(shù)據(jù)的研究,探討基于Drupal的關聯(lián)數(shù)據(jù)在MOOC教育資源Web應用開發(fā)中的應用。
目前最典型的數(shù)據(jù)關聯(lián)應用項目是2007年啟動的鏈接開放數(shù)據(jù)項目(Linking Open Data, LOD)。該項目目標是通過定義已存在并可公開使用數(shù)據(jù)集,根據(jù)關聯(lián)數(shù)據(jù)原則將其轉換為RDF并上網(wǎng)發(fā)布,進而改善數(shù)據(jù)網(wǎng)絡(Web of Data)[6]。由于該項目的開放性,參與者只要遵循關聯(lián)數(shù)據(jù)發(fā)布原則進行發(fā)布數(shù)據(jù)集并將其與已有數(shù)據(jù)集相關聯(lián)即可,因此項目進展迅速。圖1顯示了截至2014年8月LOD發(fā)布的數(shù)據(jù)集。LOD各個歷史版本包含的數(shù)據(jù)集個數(shù)如表1所示。

圖1 LOD云圖[7]

表1 LOD部分歷史版本[7]
根據(jù)CKAN的分析統(tǒng)計,截至2011年9月LOD云圖中的關聯(lián)數(shù)據(jù)集涵蓋了新聞媒體、地理、政府、新聞出版、交叉領域、生命科學、用戶內(nèi)容生成等七大領域[8]。盡管目前關聯(lián)數(shù)據(jù)集涉及的領域較廣,但是在教育資源領域應用的項目還不是很多。在實踐應用上,國外發(fā)展較快。如吳鵬飛[9]在國外關聯(lián)數(shù)據(jù)教育應用項目研究與啟示一文中介紹了SemTech[10](Semantic Technologies for Learning and Teaching)、mEducator[11]、LUCERO[12]等三個國外關聯(lián)數(shù)據(jù)在教育領域的典型應用平臺;黃永文[13]在關聯(lián)數(shù)據(jù)應用的系統(tǒng)框架及構建關聯(lián)數(shù)據(jù)應用的建議一文中提到的Talis Aspire[14]。目前國內(nèi)關聯(lián)數(shù)據(jù)教育資源領域的應用實踐項目多集中在圖書館應用上,如上海市中心圖書館名錄[15]。
2.1 關聯(lián)數(shù)據(jù)應用的體系框架
關聯(lián)數(shù)據(jù)應用框架由關聯(lián)數(shù)據(jù)發(fā)布層(Publication Layer)、數(shù)據(jù)網(wǎng)絡層(Web of Data)、數(shù)據(jù)訪問,集成和存儲層(Data Access,Integration and Storage Layer)、應用層(Application Layer)組成。關聯(lián)數(shù)據(jù)應用框架如圖2所示:

圖2 關聯(lián)數(shù)據(jù)應用體系框架[16]
關聯(lián)數(shù)據(jù)應用實現(xiàn)的過程:
第一步:通過關聯(lián)數(shù)據(jù)發(fā)布層依據(jù)關聯(lián)數(shù)據(jù)規(guī)則將數(shù)據(jù)通過標準的HTTP協(xié)議發(fā)布到數(shù)據(jù)網(wǎng)絡層。關聯(lián)數(shù)據(jù)的數(shù)據(jù)源可以是傳統(tǒng)的結構化數(shù)據(jù)、基于CMS的節(jié)點屬性描述的數(shù)據(jù)(如Drupal),也可以是文本/XML等非結構化數(shù)據(jù)。
第二步:在數(shù)據(jù)訪問,集成和存儲層通過數(shù)據(jù)訪問、術語映射等操作整合成統(tǒng)一的關聯(lián)數(shù)據(jù)集合。
第三步:應用層應用通過SPARQL(Simple Protocol and RDF Query Language)或者RDF API訪問RDF數(shù)據(jù)。
2.2 Drupal平臺下MOOC關聯(lián)數(shù)據(jù)的創(chuàng)建與發(fā)布
2.2.1 Drupal對關聯(lián)數(shù)據(jù)的支持
在Drupal核心的發(fā)展中RDF具有很長的歷史。2000年5月在Drupal誕生之初,在網(wǎng)站的根目錄便引入了一個RDF.PHP的文件[17]。該文件提供了一個基于RDF的面向對象XML解析器和一個RDF標題生成器。2008年在波士頓DrupalCon,Drupal項目的創(chuàng)始人Dries Buytaert將語義網(wǎng)納入到Drupal社區(qū)規(guī)劃,并將其作為Drupal核心的一部分。2009年的國際語義網(wǎng)大會上獲得最佳語義網(wǎng)應用實踐論文獎[18]。同年,Drupal6.X版本上支持關聯(lián)數(shù)據(jù)創(chuàng)建、發(fā)布的模塊陸續(xù)發(fā)布,如Resource Description Framework(RDF)模塊提供了全面的RDF功能和互操作性。到了2011年,在Drupal7中RDF相關模塊已經(jīng)作為Drupal的核心模塊發(fā)布。
2.2.2 Drupal對關聯(lián)數(shù)據(jù)互操作的支持
構建關聯(lián)數(shù)據(jù)應用目的:一是遵循關聯(lián)數(shù)據(jù)標準化規(guī)則生成標準RDF數(shù)據(jù)共享到數(shù)據(jù)云圖中,二是從數(shù)據(jù)云圖中消費數(shù)據(jù),然后再將數(shù)據(jù)關聯(lián)、整合到數(shù)據(jù)云圖中。從關聯(lián)數(shù)據(jù)提出的目的來看僅僅利于Drupal生成本地站點的RDF數(shù)據(jù)來構建Web應用是不夠的,其最終目的是實現(xiàn)數(shù)據(jù)的互操作。目前,大部分Web上的數(shù)據(jù)無法實現(xiàn)數(shù)據(jù)的互操作,如果將一個網(wǎng)站上的數(shù)據(jù)與另一個網(wǎng)站上的數(shù)據(jù)合并組合,需要編寫爬蟲程序來抓取自己需要的數(shù)據(jù)或者獲得訪問網(wǎng)站結構化數(shù)據(jù)的權限,然后編寫相關API來獲取相關數(shù)據(jù)。Drupal在誕生之初便已支持對RDF數(shù)據(jù)的發(fā)布,上文中已有所描述。在Web上最常用的開放利用RDF數(shù)據(jù)的方式是Web上公開的SPARQL查詢終端[19]。對于RDF數(shù)據(jù)的開放利用,Drupal7中也有相關模塊支持。如:SPARQL模塊。
2.2.3 利用Drupal實現(xiàn)關聯(lián)數(shù)據(jù)的創(chuàng)建與發(fā)布
在語義網(wǎng)絡中發(fā)布Linked Data的準則是使用HTTP URI作為任何事物的標識名稱[20],而不是ID或者其他標識符實現(xiàn)唯一性識別的。
1.使用RDF公開數(shù)據(jù)
RDF是一個“實體-屬性-值”(Entity-attribute-value)三元組。實體使用URI描述;屬性使用具有通用性理解的屬性名進行描述,也可以使用URI描述;值可以是URI也可以是字符串資源。如表2 Drupal站點中的RDF三元組描述示例:

表2 Drupal中RDF三元組示例
2.在Drupal中創(chuàng)建自定義RDF映射
Drupal中每一個內(nèi)容類型都包括標題(title)、內(nèi)容(Body)、創(chuàng)建者(Creater)、創(chuàng)建時間(Create Date)等字段。基于某個內(nèi)容類型發(fā)布的內(nèi)容,稱為節(jié)點(Node)。Drupal內(nèi)容類型模型與RDF三元組映射關系如圖3所示。

圖3 Drupal內(nèi)容類型模型與RDF三元組映射關系圖
在Drupal7中使用RDF Mapping API可以將內(nèi)容類型的任何格式的字段映射到一個RDF屬性,任何內(nèi)容類型映射到一個RDF類型。如,安徽國防科技職業(yè)學院網(wǎng)站上有一個學院新聞的內(nèi)容類型,則可以將其映射到類型mo∶colNews,字段可以映射到mo∶colTitle、mo∶colContent、mo∶colCreatedDate、mo∶colDep等。下面以創(chuàng)建安徽國防科技職業(yè)學院網(wǎng)頁設計與制作MOOC為例說明如何在Drupal中創(chuàng)建自定義RDF映射。
(1)創(chuàng)建模塊
Drupal中創(chuàng)建模塊的第一步是創(chuàng)建.info文件。該文件向Drupal系統(tǒng)提供模塊信息及其他依賴模塊信息。

(2)創(chuàng)建內(nèi)容類型和字段
內(nèi)容類型的創(chuàng)建通過實現(xiàn)hook_install鉤子函數(shù)完成,該函數(shù)在模塊安裝時被調(diào)用。

(3)將內(nèi)容類型映射到RDF
在.module文件中定義內(nèi)容類型、字段到RDF的映射。使用hook_rdf_mapping鉤子函數(shù)完成RDF映射。字段映射以MOOC內(nèi)容簡介和發(fā)布人為例,webDesign的RDF映射定義如下:


關聯(lián)數(shù)據(jù)在MOOC教育資源共享中的應用可以有效提高教育資源的利用率。Drupal作為CMS內(nèi)容管理平臺,對關聯(lián)數(shù)據(jù)的支持,使得預算較小的MOOC平臺網(wǎng)站也能夠將資源進行共享發(fā)布,同時,獲得Web網(wǎng)絡中的其他共享資源為己所用,為進一步解決教育資源分布不均,提高教育資源利用率作出了應有貢獻。
注釋及參考文獻:
[1]陳大慶,丁培,葉蘭.MOOC教育資源語義化關聯(lián)研究[J].圖書情報工作,2014(14):121-126.
[2]Coursera[EB/OL].[2015-09-21].https://www.coursera.org/.
[3]edX[EB/OL].[2015-09-21].https://www.edx.org/course.
[4]鳳凰網(wǎng)教育[EB/OL].[2014-05-15].http://edu.ifeng.com/gundong/detail_2014_05/15/36329165_0.shtml.
[5]維基百科:Linked Data詞條[EB/OL].[2015-09-22].https://en.wikipedia.org/wiki/Linked_data.
[6]潘有能,張悅.關聯(lián)數(shù)據(jù)研究與應用進展[J].情報科學,2011,(29):124-130.
[7]The Linking Open Data cloud diagram[EB/OL].[2015-09-22].http://lod-cloud.net/
[8]State of the LOD Cloud[EB/OL].[2015-09-22].http://lod-cloud.net/state.
[9]吳鵬飛,馬鳳娟.國外關聯(lián)設計教育應用項目研究與啟示[J].電化教育研究,2013(4):114-120.
[10]SemTech|ECS|Univerity of Sounthampton[EB/OL].[2015-09-24].http://www.semtech.ecs.soton.a(chǎn)c.uk.
[11]MEducator Multi-type Conten Repurposing and Sharing in Medical Education[EB/OL].[2015-09-24].http://www.meducator.net.
[12]The LUCERO Project[EB/OL].[2015-09-24].http://lucero-project.info/lb.
[13]黃永文,岳笑,劉建華.關聯(lián)數(shù)據(jù)應用的體系框架及構建關聯(lián)數(shù)據(jù)應用的建議[J].現(xiàn)代圖書情報技術.2011(9):7-13.
[14]Talis Aspire[EB/OL].[2015-09-24].http://www.w3.org/2001/sw/sweo/public/UseCases/Talis.
[15]上海市中心圖書館名錄[EB/OL].[2015-09-24].http://data.libnet.sh.cn:8080/.
[16]Tom Heath,Christian Bizer.Linked Data:Evolving the Web into a Global Data Space[M/OL].[2015-09-28].http://linkeddatabook.com/editions/1.0/.
[17]Benjamin Melan?on.RDF's long lineage in Drupal[OL].[2015-09-29].http://data.a(chǎn)garic.com/rdfs-long-lineage-drupal.
[18]About the RDF in Drupal 7 initiative[EB/OL].[2015-09-29].http://semantic-drupal.com/about.
[19]夏翠娟,劉煒,趙亮,等.關聯(lián)數(shù)據(jù)發(fā)布技術及其實現(xiàn)——以Drupal為例[J].中國圖書館學報.2012(1):49-57.
[20]Berners-Lee,T.Linked Data[EB/OL].[2009-06-18].http://www.w3.org/DesignIssues/LinkedData.html.
Research on the Linked Data in the Sharing of MOOC Educational Resources Based on Drupal
XU Yan-dan,ZHANG Qian-jin
(Anhui Vocational College of Defense Technology,Liu'an,Anhui 237011)
In this paper,the application of MOOC educational resources and related data in the application of educational resource sharing are studied.The solution to fragmentation of MOOC curriculum resources is proposed by using the linked data.And the realization process and the framework of the application of the linked data is introduced.Drupal-the open source CMS platform to support the linked data to make the budget of the MOOC platform for the sharing of educational resources becomes possible.Finally,the paper introduces the implementation of the Drupal to create and publish linked data.
linked data;CMS;Drupal;MOOC
TP391;G434
A
1673-1891(2015)04-0046-04
2015-10-19
安徽省質量工程項目-網(wǎng)頁設計與制作大規(guī)模在線開放課程(MOOC)示范項目(2014mooc088);安徽國防科技職業(yè)學院質量工程項目(gf2014xbjc10)。
許艷丹(1983-),女,河南周口人,講師,碩士,研究方向:數(shù)據(jù)挖掘、高職教育。