李 湘 龔曉林
(湖南師范大學圖書館,湖南 長沙 410081)
為了適應新課改創新教學對于教學資源利用的需要,各高校圖書館開始研究廣泛服務于教育過程的教育資源共享[1-2],并將高校教育資源庫、高校精品課程網等教育信息化產品全面應用于教學實踐之中。但隨之其應用過程中的可利用性、可查找性問題凸顯[3]。其中一個重要的原因是教育資源數據的質量問題,如基礎數據源質量、元數據遺漏、冗余、錯誤以及語義、編碼規則等問題不僅會影響用戶對數據對象的判斷,造成數據的漏檢、誤檢,而且無法保證元數據在不同的應用環境下用戶服務的一致性,因而無法實現教育資源在不同系統之間的交流和共享。為規范教育產品的開發和設計行為,保證教育資源建設的質量,我國在對國際標準進行本土化擴展的基礎上,推出了諸如《學習對象元數據》(CELTS-3)、《教育資源建設技術規范》(CELTS-41)、《基礎教育教學資源元數據規范》(CELTS-42)等教育信息化技術標準。但到目前為止,國際上尚沒有可遵循的系統化的教育資源數據質量評估標準,也沒有可遵循的完整的教育資源數據質量評估體系[4]。筆者認為教育信息化行業需要有自己專業的質量標準,尤其是教育資源數據質量標準。所以,筆者希望在已有研究和參與教學資源建設以獲得實踐體驗的基礎之上,提取基于教育資源數據層質量元素,并盡可能多維度精確地實現對各質量元素的描述,以作為對教育資源數據質量控制的基本準則。
首先,人們所理解的數據質量是指數據的本征質量,如準確性、完整性和精確性。隨著數據的積累及其在實踐中的應用,人們開始從廣義上理解數據質量。Diane.M.Strong等人認為,數據質量除了本征質量之外,可獲得性、數據表達、用戶滿意度及其他動態信息也是衡量數據質量的重要標志[5]。后來的研究中關于數據質量的描述及質量元素的界定大都以這一理論為基礎。
數據質量描述是建立數據質量標準和數據評估體系首先要解決的問題。姜作勤在《數據質量研究與實踐的現狀及空間數據質量標準》一文中列出了國際上一些代表性的描述框架。聯邦政府對聯邦機構向公眾傳播的數據質量描述框架(OMB Guidelines,2003)為:實用性、客觀性、安全性。國際金融基金會統計部(Carol S.Carson,2000)提出從數據的完整性、概念一致性、準確度、服務性及可訪問性來描述數據質量。MIT的研究(Wang,R.Y.and Strong,1996)將數據質量描述分為4大類,包括本征質量描述,如可信度、準確度、客觀性、信譽;與應用有關的質量描述,如增值、關聯、適時、完整、合適的數據量;與表達方面有關的質量描述,如可解釋性、易懂性、一致性、簡明性;與可訪問性方面有關的質量描述,如可訪問、安全性[5]。黃剛等人在Alarcos研究團隊以及麻省理工大學Richard.Y.Wang教授、北京大學唐世渭教授等人的研究基礎之上,針對大型企業數據中心的數據質量問題,提出了一個通用的數據質量元模型框架結構,認為數據質量元素包括完整性(Integrity)、深度性(Depth)、及時性(Timeliness)、冗余性(Consistency)、一致性(Consistency)、關聯性(Relate)、準確性(Accuracy)7大類,并在此基礎之上構建了企業數據質量評估體系[4]。
為了實現對教育資源的質量控制,很多學者和機構開始了對于教育資源質量框架和質量評估標準的探索。保羅·川內受英聯邦學習共同體亞洲教育媒體中心的委托,開展了開放教育資源質量保證準則框架的專項研究,并在《開放教育資源質量保證準則——TIPS框架》一文中,提交了一份開放教育資源質量保證準則框架——TIPS框架。該框架涉及學習的5個領域(認知領域、情感領域、元認知領域、環境領域、管理領域),覆蓋了所有已知的教育目標[6]。王承冰等人針對我國目前開放教育資源項目過度重視發展規模而忽視質量保證的問題,開始了對英國開放大學OpenLearn項目的研究,以期為我國建立精品開放課程的內容質量保證體系提供啟發[7]。樂美兒在《虛擬平臺下英語教學信息資源質量標準體系》一文中討論了虛擬平臺下英語教學信息資源質量標準體系的構建過程[8]。馬玲玲等在《高校機構知識庫元數據質量控制問題研究》一文中提出通過引入OAI-PMH元數據收割協議和DC元數據來保證元數據的規范性[9]。
以上研究對不同領域數據質量進行了科學的界定和描述,或從用戶使用的角度提出對于教育資源數據質量框架的設計,我們可以從他們對于數據質量的定義、數據質量描述和數據質量元素的界定中得到啟示,結合我國教育資源建設實踐,抽取適合教育資源數據的質量元素,從教育資源原始數據層(即數據源)到元數據層形成完整的質量描述框架。
從中外開放教育資源的對比[3]以及國內高校教學資源庫的使用情況來看[10],我國教育資源的使用情況并不是很理想,其中一個主要的原因是教育資源本身的質量問題。如目前以精品課程為代表的開放課程資源在對課程的整體設計、資源與課程內容的耦合度、課程視頻錄像的表現效果以及大容量視頻資源的可訪問性都存在不同程度的問題,而通過學院呈繳或是網上挖掘的方式也很難保證在目前優質資源有限的條件下所獲取數據源的可靠性。因而,在定義教育資源的數據質量時,首先應該考慮教育資源數據源質量,即原始數據層的質量,它是決定數據存在價值的根本。針對目前我國教育資源建設和使用實際,筆者認為,原始數據層質量包括數據對象本身所含的本征內容、表達方式、可獲取的技術性質等幾個方面,它的數據質量元素可分為內容質量元素、表達質量元素及技術質量元素(見表1)。

表1 教育資源數據質量元素及其描述框架(原始數據層)
在數據加工時我們會面臨很復雜的局面,通過學院呈繳和網上挖掘所獲得的教學資源學科覆蓋面廣、內容豐富、專深復雜,資料類型眾多,各類型資料特征各異,所提交的基礎信息或對象文件往往很不完整規范,還有由于制作方法和文件格式多異而無法保證其在不同網絡環境下的正常使用,或是因為版權問題而導致使用上的障礙等。所以需要有規范優質的元數據以實現對資源的準確定位與描述,保證用戶對資源的準確識別與判斷,保證用戶對資源全面完整的檢索,保證資源正常開放的使用。同時實現對資源的組織與加工、管理以及長久保存。可以說,元數據質量是決定資源可否實現其“描述、解釋、定位、檢索、識別、管理以及保存數據功能”[11]的關鍵。因此,我們認為,對于教育元數據質量元素的界定,主要從可能影響到數據的查找、利用、管理以及保存的元數據加工管理的規范性、元數據指導標準和編碼體系的權威通用性、元數據標準及數據結構的完整性、元數據標引與描述的科學性、數據錄入的準確性等方面來加以考慮。我們還可以從國內外元數據質量控制理論[12-13]中尋求對于各質量元素具體的描述維度及描述方式(見表2)。

表2 教育資源數據質量元素及其描述框架(元數據層)
本框架是在已有理論和對教育資源建設的質量反思之上建立的,希望使用資源的師生能參與資源建設并加入到教育資源質量標準化的思考中來,希望在他們使用和建設的雙重反饋中修正和完善本框架。我們也希望教育資源建設項目的承建單位及其中的業務骨干能參與到教育資源數據質量標準化建設的討論中來,希望在更為廣闊的實踐中驗證并完善本框架,在與教育資源建設實踐的同步跟進中發揮其基本的質量保證價值。筆者也希望聽取專家學者和學科專家們的指導意見以使本框架更具權威性和說服力。最后,希望所有關于數據質量控制和關于教育資源質量控制的討論能得到行政主管部門和國家標準化組織的重視,通過對于用戶、資源建設者、項目負責人以及專家學者參與的調研會議和學術討論,逐步形成關于教育資源建設以及教育產品數據質量的系列標準,形成完整的教育資源質量驗收和量化評估的指導方法,讓大家在對標準的遵循中培植一種自上而下的質量文化,使我們在一種質量意識的自覺中生產出優質高效的教育信息化產品。
[1] 王志華,贠伍.對高校圖書館建立教育信息資源庫的戰略思考[J].現代情報,2008(3):61-64.
[2] 陳文東.依托數字圖書館建設教學資源中心的若干思考[J].科技情報開發與經濟,2012(5):3-5.
[3] 潘梁.中美開放教育資源質量比較研究[D].武漢:華中師范大學,2012.
[4] 黃剛,等.元數據驅動的數據質量評估體系架構研究[J].計算機工程與應用,2013(8):114-119,181.
[5] 姜作勤.數據質量研究與實踐的現狀及空間數據質量標準[J].國土資源信息化,2004(3):22-28.
[6] 保羅,等.開放教育資源質量保證準則——TIPS框架[J].中國遠程教育,2013(10):11-21,46.
[7] 王承冰,何濟玲,陳仕品.英國開放大學開放學習項目質量保證體系研究[J].中國電化教育,2013(5):37-41,98.
[8] 樂美兒.虛擬平臺下英語教學信息資源質量標準體系的規劃與設計[J].現代教育科學,2008(11):133-136,143.
[9] 馬玲玲,卞藝杰,梅俊.高校機構知識庫元數據質量控制問題研究[J].計算機技術與發展,2014(1):2013-11-12優先出版.
[10] 孟祥志.高校教學資源庫及其設計與開發研究[D].武漢:華中農業大學,2008.
[11] NISO Press.Understanding Metadata[EB/OL].[2014-04-25].http//www.niso.org/standards/resources/Understandin gMetadata.pdf.
[12] 李凌杰.特色數據庫建設中的元數據質量控制研究[J].圖書情報工作,2010(5):43-46.
[13] 曹月珍,馬建玲.國內外元數據質量控制的研究進展與發展趨勢[J].圖書與情報,2013(6):101-104.