999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于元數據技術的教育資源共享平臺研究*

2014-11-27 12:12:14王秀慧王麗珍殷旭彪
中國教育信息化 2014年9期
關鍵詞:資源用戶教育

王秀慧,王麗珍,殷旭彪

(山西大同大學 教育科學與技術學院,山西 大同037009)

一、引言

目前,無論是在國家層面還是在各個院校、教育、培訓等部門都意識到了教育資源在全社會范圍內共享的重要性。教育資源共建共享的理念正逐步深入人心。實現教育資源的共建共享,對于推動全社會教育公平,促進教育平衡發展,提高國家教育質量,推進全國教育與社會發展具有重大現實意義。[1]基于這樣的背景,本研究開展了晉北地區教育資源共享服務平臺的構建工程。從2010年初至今,已經收集了來自晉北地區各個學校或培訓機構的數千條具有重要教學價值的教育資源。為了建構合理的教育資源庫,針對教育資源具有跨學科、多源異構、異質等特點,提出了基于元數據技術進行教育資源整合的方案,并在資源整合的基礎上開發了教育資源元數據共享服務平臺,為實現教育資源在全社會范圍內的共建共享提供途徑。同時針對教育資源元數據庫信息量大、檢索速度慢、無法為用戶提供有效服務的問題,提出基于FTC實現教育資源元數據的有效聚類。

二、教育資源元數據標準

教育資源往往具有多種表現形式,比如說文檔、網頁、圖片、視頻等。這些教育資源大多以非結構化形式存在,影響了數據的存儲,進而導致教育資源的共享難以實現,不同的教育部門或機構之間的溝通也無法得到保障。而建設教育資源數據共享工程、構建教育資源數據共享服務體系,必須要保證對教育資源數據共享技術體系架構有統一的標準。通過元數據標準來定義一致的數據資源描述框架,是使得教育資源在數據共享層面能納入統一框架的一種有效手段。

所謂元數據標準,指的是描述某類資源的具體對象時所有規則的集合。這里所指的資源就是教育教學資源。實現教育資源元數據的標準化,一方面能夠為資源提供方提供一個標準著錄格式,以便于其對所擁有的數據資源進行恰當描述。另一方面,有助于實現對教育資源的高效組織和管理,并幫助學習者快速的定位所需信息。再者,教育資源元數據標準的制定為實現不同教學系統間元數據的互操作提供技術支持。

目前,國際上常用的教育資源元數據標準主要有三類:IEEELOM、DC-Education和ADL/SCORM。其 中,IEEELOM是學習對象元數據標準,目的是完成學習對象的描述和管理。DC-Education又稱為都伯林核心教育元數據,是在DC的基礎上增加了一些新的元素并復用到DC-Education。ADL/SCORM稱為可共享內容對象參考模型,目的是實現教育資源的可重用性。[2,3]

結合我國各類教育資源的特點,本文以DC-Education作為元數據標準的基礎,并根據實際情況對其進行了部分調整。元數據是對原始數據結構特征的描述,學習者瀏覽元數據的最終目的是為了訪問原始數據資源。原始數據資源可能以文件形式提供,也可能以HTTP或FTP方式提供。為了便于學習者根據元數據定位到原始數據資源,本研究對DC-Education增加了文件服務、HTTP服務和FTP服務三個字段。這樣用戶在瀏覽元數據的時候,如果想對該教育資源有更進一步的了解,可以通過共享平臺提供的文件服務進行相關文件的下載,或者可以通過HTTP服務和FTP服務進行在線資源的跳轉訪問。

教育資源具有跨學科、多源異構、異質的特性,導致無法采用統一的數據結構進行有效存儲,阻礙了教育資源共享平臺的建設。而以上元數據標準的制定使得各種不同的教育資源都能夠用相同的模式去表示,對于建設教育資源共享平臺、實現教育資源的互操作都有極大的推動作用。

三、教育資源共享平臺架構設計

1.以元數據技術為核心的體系結構

一個服務上乘的教育資源共享服務平臺,不僅能夠通過元數據為學習者提供數據資源的發現、查詢、數據導航等功能,而且還要為資源提供方提供元數據的匯交、上傳和注冊等服務。可以說,作為數據共享中心的一個透明的中間層,元數據發揮著“一站式”服務的核心功能。以元數據為中心,結合教育資源數據共享的特點,本文把教育資源共享服務平臺的基本功能劃分為四大模塊,即教育資源的瀏覽和查詢、教育資源的發布、教育資源的訪問和在線分析服務。這些基本功能將在元數據的統一調度下完成教育資源的匯交、共享、查詢、瀏覽、下載和分析等數據服務。

(1)教育資源瀏覽和查詢。教育資源共享平臺依托主體元數據庫分類體系,為學習者提供元數據目錄,以此作為數據瀏覽的依據。為了更好服務用戶,提供了元數據查詢接口。查詢方式分簡單查詢和高級查詢。簡單查詢要求用戶鍵入感興趣的關鍵詞。高級查詢指用戶可以按學科、資源類型、資源發布者、時間等檢索項進行查詢。當然,在對用戶興趣點進行分析以后,平臺還可以根據用戶偏好為其提供個性化信息服務。

(2)教育資源發布。共享平臺為教育資源的發布提供兩種方式。其一:直接把元數據信息從已經收集到的原始數據資源中提取出來,并注冊到共享平臺的數據目錄服務中,保證學習者能夠瀏覽和查詢該數據資源;其二:資源提供者通過共享平臺提供的元數據匯交接口把數據資源提交到數據庫中心。匯交內容不但包括描述教育資源的元數據,同時也包括教育資源原始數據,在匯交的同時完成數據的注冊。數據提供者一旦把數據發布在教育資源共享服務平臺中,經管理員審核通過后,全球用戶都可以通過網絡發現和訪問這些數據資源。

(3)教育資源訪問。教育資源訪問通過兩種模式實現,一種是通過元數據瀏覽或查詢接口獲取相應的數據資源,如可以直接鏈接到數據,可以下載數據,還可以預訂數據。另一種是對平臺功能進行擴展,為用戶提供元數據接口調度信息服務功能,以此達到元數據瀏覽、分析和操作的目的。

(4)教育資源在線分析。為了更好的服務用戶,平臺提供數據分析功能。一方面,對所有用戶訪問信息進行統計分析,找出用戶感興趣的教育資源,對此類數據資源要加強更新,以滿足用戶連續性學習的要求。另一方面,對獨立用戶進行知識偏好統計,通過顯示的詢問方式或隱式的跟蹤用戶行為方式,分析其學習興趣所在,在此基礎上為其提供個性化信息服務。

圍繞上述功能,網絡平臺的結構框架如圖1所示。從總體結構上可分為五層,自底向上分為網絡平臺層、資源管理層、核心服務層、共享業務層、平臺門戶層。[4]每個層次各司其職,分別完成不同的任務。為了便于平臺實施開發,依據平臺的層次結構,把功能細分為13個相對獨立但彼此聯系的子系統。分別為平臺門戶和功能入口子系統、元數據匯交子系統、數據資源下載子系統、數據資源瀏覽查詢子系統、數據資源審查發布子系統、數據安全服務、元數據服務、數據分析服務、日志服務、備份管理、原始資源管理、元數據管理、用戶信息管理,如圖1所示。

圖1 教育資源共享服務平臺的結構框架

2.教育資源元數據匯交及審核發布

建好一個教育資源平臺,只有少數人能用,只有少數人參與建設,那不叫共建共享。資源建設中只有做到全員參與,全員使用,所創建的資源庫才能做到動態更新,才能成為活的資源庫,才能充分發揮所建資源庫或資源平臺的作用。為了實現真正意義上的共建共享,教育資源共享平臺為廣大用戶提供了元數據匯交接口,通過系統提供的元數據匯交界面,注冊用戶就可以方便的向共享平臺提交自己的數據資源。所以元數據匯交是該平臺的一個核心模塊。

用戶提交的數據資源有可能涉及非法言論,在正式發布之前需進行必要的審核。審核任務由系統管理員經平臺所提供的元數據管理模塊完成。

元數據匯交及審核發布系統為教育資源的共建共享提供技術支撐,保障了共建共享機制的完美實現。元數據匯交由注冊用戶完成,其流程如圖2所示,元數據審核發布由系統管理員完成,其流程圖如圖3所示。

圖2 元數據匯交流程

圖3 元數據審核發布流程

四、基于改進FTC的教育資源元數據聚類

教育資源共享平臺的開發要堅持以人為本、以學習者為中心,強調為學習者提供高效的資源獲取途徑。[5]隨著教育資源共享服務平臺的不斷完善以及用戶群的不斷擴展,教育資源信息量將會越來越大。當信息量超過一定的限度時,將導致檢索周期長、檢索速度慢的問題,學習者在檢索到的海量信息面前很難定位真正需要的教育資源。為了提高學習者檢索效率并幫助用戶快速定位所需資源,本文把數據挖掘中的聚類思想用于教育資源元數據的合理組織。把教育資源按某種聚類算法進行處理以后,學習者就能夠依據聚類結果,快速定位自己所需要的教育資源,這樣不僅大大提高了學習者信息的查準率,為學習者提供了一個良好的學習環境,也有利于對教育資源的充分利用,有效提高了教育資源在全社會范圍內的共享程度。

聚類是數據挖掘中一項重要的技術。傳統聚類算法像基于層次的CURE或基于劃分的K-MEANS都可以實現數據聚類,但是這些算法大多采用向量空間模型表示數據,容易產生“高維效應”,直接聚類效率及準確度。針對這樣的問題,Bei和Xu在文獻[6]中提出了一種基于頻繁項集的數據聚類方法FTC(FrequentTerm-based Clustering)。FTC算法對高維度數據聚類具有較強的處理能力,可伸縮性良好。該算法產生的簇標簽可以為用戶瀏覽或檢索數據資源提供方便。但是FTC會把一條元數據硬性的劃分到唯一結果簇中,而未考慮教育資源多主題性的自然屬性,因此不能獲取最優聚類結果。針對FTC算法在實現教育資源元數據聚類中存在的不足,本文進行了有效改進,定義了簇間相似度度量公式,以決定簇間是否應該存在重疊,合理實現了對候選簇的軟分離,保證了聚類結果全局最優。

1.FTC算法介紹

FTC算法的基本思路是:首先從元數據集合中把所有滿足最小支持度的頻繁項集全部找出,同時把包含相同頻繁項集的元數據集合作為一個候選簇,然后通過一種貪心算法,循環選擇與其他候選簇重疊度最小的作為結果簇,當結果簇集合覆蓋到所有元數據,則算法為止。

假定元數據集合D由D1,D2…Dm等m條教育資源元數據所組成,并用包含在元數據中的關鍵詞集合Ti來表示元數據Di,則有關鍵詞集在T上挖掘出滿足最小支持度的所有頻繁項集,得到頻繁項集集合對于其中任一個Fi,若其又k個頻繁詞組成,則把該Fi稱為頻繁k項集,對應的簇叫做k階簇。由于這k個頻繁詞存在于該簇的所有元數據內,能夠表達該元數據集的共同屬性,因此可以把Fi作為該簇的類別標簽使用。

考慮到一條元數據通常包含多個頻繁項集,因此它可能分屬于不同的候選簇,即簇間重疊現象比較嚴重。特定義了熵重疊度(entropyoverlap)EO(Ci),以作為衡量Ci與其它候選簇的重疊情況的標準,如公式(1)所示。

所包含的頻繁項集個數用j表示

熵重疊度能夠表達簇Ci所支持的頻繁項集在其它候選簇中的分布情況。從公式(1)可以看出,EO(Ci)值越大,Ci與其它候選簇的重疊越嚴重。特別的,值等于0時,所支持的元數據都不包含其它頻繁項集,表示Ci與其它候選簇之間不存在重疊。

輸出:結果簇集合C

(1)從元數據關鍵詞集T中把滿足最小支持度的頻繁項集F={F1,F2,…,Fm}挖掘出來,令Fi所支持的元數據集合組成了候選簇Ci。

(2)置聚類結果簇集C為空。

(3)計算所有Ci的熵重疊度。

(4)找出熵重疊度最小的簇Ci,并將之并入結果簇集C中。

(5)對于任一Dj∈Ci,若Dj同時也屬于其它簇Cj,則從Cj中直接刪除Dj。

(6)把Ci從候選簇集中刪掉。

(7)判斷結果簇C是否能夠包含所有元數據,若不能,則返回(3)重復執行,否則算法結束。

經過聚類處理以后,教育資源元數據可劃分為若干簇。每一個簇中所包含的關鍵詞可以作為類簇標簽使用,給用戶檢索數據提供方便。考慮到具有多主題性是教育資源的一個自然屬性,例如一條關于用戶聚類實現學習者個性化學習的教育資源,就應該歸入數據挖掘和教育技術兩個學科中。據FTC聚類算法的結果可知,該算法把每條元數據唯一的劃分到一個簇中,即只把該元數據劃分到一個學科中,是一種硬聚類,體現不出教育資源的多主題性。針對此點不足,本文對FTC進行了必要改進,如下文所示。

2.FTC算法改進

為了確定是否應該把一條教育資源元數據歸屬到不同的簇中,定義衡量簇間相似度的計算公式:

其中,Fi是表達簇Ci的頻繁項集所包含的關鍵詞集合,Ci對應的元數據集用doc(Ci)表示。從該式可以看出,sim(Ci、Cj)的取值范圍為[0,1],且取值越大,兩簇間相似程度會越高,特別的,等于1時,表示兩簇完全相同。

如前所示,在FTC實現聚類的第(5)步驟中,如果把Ci作為結果簇,則支持Ci的一條元數據Di,若同時也存在于其它候選簇Cj中,將會直接從Cj中把Di刪掉,而未考慮教育資源元數據多主題性的特點。為了避免FTC算法的此點缺陷,首先依據公式(2)計算出簇間相似度sim(Ci,Cj),若sim(Ci,Cj)小于實現確定的閾值ɑ,則表明兩簇的主題差異較大,Cj中的元數據Di應予以保留;如果sim(Ci,Cj)大于ɑ,表名兩簇主題相似程度很高,此時應把Cj中的元數據Di刪掉,采用這種方法合理的實現了軟聚類。

3.聚類結果評估

為了評估聚類結果的有效性,本文以晉北地區教育資源共享平臺為依托,分析對比了聚類前和聚類后的檢索效率,如圖4所示。

圖4 聚類前后檢索時間對比圖

從圖4可以看出,隨著數據量的逐漸增大,聚類前和聚類后的平均檢索時間都逐漸增大,但聚類前的平均檢索時間增大的更快一些,表明本文提出的基于FTC的教育資源元數據聚類策略,能夠在相當程度上提高學習者的檢索效率,減少了學習者不必要的等待時間。

五、總結

教育資源跨學科、多源異構、異質的特性導致了教育資源共享程度低、互操作性差的問題,阻礙了教育資源在全社會范圍內的共建共享。為了有效的利用教育資源,提出了采用元數據技術對其進行合理描述的方案,這種結構化的描述方式大大提高了教育資源的共享和集成程度。同時,為了提高學習者檢索效率、幫助學習者在海量信息面前快速定位到所需的資源,把基于頻繁項集的FTC聚類算法應用于教育資源的有效組織。實踐證明,這種組織方法大大提高其檢索速度,且算法生成的簇標簽非常便于學習者按類別瀏覽元數據,為學習者提供了良好的學習環境。

[1]張再富.教育資源共建共享建設的幾點思考[J].中國教育信息化,2012(22):81-85.

[2]鄭雯譯,吳開華,趙陽.國外教育資源元數據標準比較研究[J].圖書情報工作,2005,49(1):107-111.

[3]王昉,張曉林.面向教育資源的元數據[J].2002(7):37-39.

[4]張彥軍.基于云計算的華文教育資源平臺設計.現代教育技術,2012,22(10):11-113.

[5]孫守義.基于聚類的教育資源個性化信息服務[D].南京:南京師范大學,2008.

[6]Beil F,Ester M,Xu X.Frequent term-based text clustering[C].New York:Proceeding KDD'02 Proceedingsof the eighth ACM SIGKDD international conference on Know ledge discovery and datam ining,2002.

猜你喜歡
資源用戶教育
國外教育奇趣
華人時刊(2022年13期)2022-10-27 08:55:52
題解教育『三問』
當代陜西(2022年4期)2022-04-19 12:08:52
基礎教育資源展示
一樣的資源,不一樣的收獲
教育有道——關于閩派教育的一點思考
資源回收
辦好人民滿意的首都教育
資源再生 歡迎訂閱
資源再生(2017年3期)2017-06-01 12:20:59
關注用戶
商用汽車(2016年11期)2016-12-19 01:20:16
關注用戶
商用汽車(2016年6期)2016-06-29 09:18:54
主站蜘蛛池模板: 色偷偷男人的天堂亚洲av| 国产黄视频网站| 91精品国产一区自在线拍| 又粗又大又爽又紧免费视频| 国产麻豆福利av在线播放| 日韩国产一区二区三区无码| 国产成人成人一区二区| 午夜日b视频| 欧美日本在线| 日韩av高清无码一区二区三区| 黄色一级视频欧美| 中文国产成人精品久久一| 国产欧美高清| 久久黄色免费电影| 欧美在线视频a| 欧美国产日韩在线| 最新加勒比隔壁人妻| 国产精品亚洲一区二区在线观看| 欧美精品黑人粗大| 久草热视频在线| www成人国产在线观看网站| 国产精品亚洲专区一区| 99无码中文字幕视频| 免费福利视频网站| 五月天综合婷婷| 美美女高清毛片视频免费观看| 精品人妻AV区| 98超碰在线观看| 国产激情在线视频| 在线免费不卡视频| 2021国产精品自产拍在线| 亚洲午夜天堂| 午夜激情婷婷| 中文字幕色站| 久久久四虎成人永久免费网站| 色偷偷一区| 国产99在线观看| 在线a视频免费观看| 亚洲国产看片基地久久1024| 精品小视频在线观看| 欧美成人午夜在线全部免费| 麻豆精品在线| 欧洲日本亚洲中文字幕| 久草性视频| 日韩高清一区 | 另类重口100页在线播放| 9999在线视频| 日日噜噜夜夜狠狠视频| 亚洲国产精品无码久久一线| 不卡无码网| 欧美性天天| 青草精品视频| 伊人久热这里只有精品视频99| 国产一区自拍视频| 欧美自慰一级看片免费| 鲁鲁鲁爽爽爽在线视频观看| 潮喷在线无码白浆| 亚洲熟女偷拍| 亚洲国产成人精品一二区| 欧美第九页| 亚洲精品自拍区在线观看| 一级成人a做片免费| 国产一级精品毛片基地| 国产精品九九视频| 在线播放真实国产乱子伦| 久久精品人妻中文系列| 亚洲精品午夜无码电影网| 国产精品私拍在线爆乳| 日韩在线视频网| 亚洲欧美天堂网| 亚洲热线99精品视频| 亚洲色中色| 亚洲天堂网站在线| 国产91导航| 中文字幕无线码一区| 午夜电影在线观看国产1区| 自拍中文字幕| 国模极品一区二区三区| av色爱 天堂网| 亚洲欧美综合在线观看| 国产综合色在线视频播放线视 | 99久久精品无码专区免费|