收稿日期:2011-04-12
基金項目:全國高等教育自學考試文獻資源體系的建立與研究(課題編號:2010zkfh217)
〔摘要〕高等教育自學考試是中國改革開放以來教育制度的一項重要創新,在分析現有自考文獻資源建設不足的基礎上,提出基于知識本體的自考文獻資源體系的基本框架,闡述基于知識本體的自考文獻資源體系的構建過程,采用語義元數據對不同學科專業進行本體建模,給出農業經濟管理學科的知識本體實例,實踐證明,該方法可以完善自考文獻資源體系的共享機制,加大自考文獻資源的服務職能。
〔關鍵詞〕知識本體;自考;文獻資源體系;保障;構建
DOI:10.3969/j.issn.1008-0821.2011.08.011
〔中圖分類號〕G253 〔文獻標識碼〕B 〔文章編號〕1008-0821(2011)08-0044-03
Construction of Self-study Examination Document
Resources System Based on Knowledge Ontology
Liu Tao Jin Fang Cao Limeng Ma Liping Zhang Fang Zhu Zhaoping
(1.Library,Gansu Agricultural University,Lanzhou 730070,China;
2.School of Continuing Education,Gansu Agricultural University,Lanzhou 730070,China)
〔Abstract〕Self-study examination of higher education has been an important innovation of the education system since Chinas reform and opening up.On the base of the insufficient and analysis the existing literature resources,proposed the basic framework of Self document resources system based ontology knowledge,explained its construction process.Using semantic metadata to ontology modeling in different disciplines,give the instance for the knowledge of Economics and Management of Agriculture ontology.Practice has illustrated,the method can improve the sharing mechanism of literature resources system and increase the service functions of the Self literature resources.
〔Key words〕knowledge ontology;self-study examination;document resources system;guarantee;construction
1 自考文獻資源體系建設的背景和需求
高等教育自學考試是中國改革開放以來教育制度的一項重要創新,它是世界上規模最大、最能體現終身教育理念與學習型社會特點的教育形式。高等教育自學考試是對自學者進行以學歷考試為主的高等教育國家考試,是個人自學、社會助學和國家考試相結合的高等教育形式。自學考試學習模式多樣,高度開放,學習矛盾少,學習費用低,寬進嚴出,為更多的人接受高等教育提供方便條件和現實可能。特別是高等教育自學考試為社會弱勢人群提供了平等的接受高等教育的機會,較好地體現了教育公平性的原則。可以說,中國高等教育自學考試制度為世界高等教育發展提供了可供借鑒的一種形式。自考文獻資料建設[1],就是依據自考機構的服務任務與服務對象以及整個社會的文獻情報需求,系統的規劃、選擇、收集、組織管理自考文獻資源,建立具有特定功能的儲存體系的全過程。自考文獻資源建設就是要將分散、無序的文獻,組織成有序的整體系統。但是自考文獻資源的建設在國內尚屬空白,自學考試的科研工作更是停滯不前,這就需要從自學考試事業的大局出發,建立高效優化的自考文獻資源體系,重視自考文獻資源科學發展,滿足社會日益增長的知識情報需求,這也是國家信息化建設的重要組成部分。
2 構建自考文獻資源服務保障體系
自學考試是一種社會化的開放教育,其教育教學過程主要是通過應考者的自學和社會力量提供的學習服務完成的。推進自學考試服務社會化,建立自學考試社會化服務體系。筆者認為構建自考文獻資源服務保障體系應從以下3個方面著手:
2.1 信息需求
信息需求是國家信息化建設的主要推動力,最大限度地滿足用戶的信息需求是信息資源建設的直接目的。自考文獻資源體系的構建就是為了更好地滿足高校師生在自學考試過程中教學、科研和學習等眾多方面的信息需求。
2.2 制度規定
1999年《中共中央國務院關于深化教育改革全面推進素質教育的決定》(以下簡稱《決定》)中對自學考試的發展提出了具體的要求,《決定》指出“完善自學考試制度,形成社會化、開放式的教育網絡,為適應多層次、多形式的教育需求開辟更為廣闊的途徑,逐漸完善終身教育體系”。在這個背景之下,我們更應該構建自考文獻資源服務保障體系,重視自學考試制度,提升管理水平,使得自學考試為師生提供更好地保障性服務工作。
2.3 社會服務方面
建立自考圖書館,作為現代圖書館的一個分支,進一步加強自學考試文獻資源建設。在農村建立自學考試鄉鎮服務站,為農村考生提供活動場地、文獻資料、硬件設備等,舉辦形式多樣的短期輔導班,提供計算機及上網條件,聯絡考生,提供信息,為自學考試畢業生錄用、政策落實提供服務等。建立自考文獻信息學,為更多的學者提供全方位的自考文獻知識提供借鑒。
3 基于知識本體的自考文獻資源體系的構建意義
知識本體(Knowledge Ontology)是用來描述現實事物的本質,是一個實體概念化的明確描述,Ontology是一個以概念來構建的系統,當使用Ontology來描述特定領域的知識,可將Ontology表示是一種概念、屬性、實例與關系的組合[2]。用知識本體構建自考文獻資源體系通過系統分析與規劃,具有一定的參考價值和現實意義。
(1)探索、認知自考文獻資源體系的規律,為全國高等教育自學考試信息化研究提供可以借鑒的框架和成果。本體研究實質上是對思維規律的研究,是從理論的高度,系統地考察人類認識自然的過程,并將這種認識成果形成一定的思想方法。本體要解決的問題就是給出這一過程的形式化定義,以便消除歧義,并借助信息技術加以實現。
(2)知識本體可以幫助領域專家建立人性化的自考文獻資源信息管理系統與方法,提高資源利用率和自動化水平。本體通過對于形式化表示人類思維規律的研究,使信息的組織符合人類思維規律,使信息系統中的信息和人類用自然方式表達的信息可以相互轉換,使信息系統更加符合人的需要。
(3)整理現有的自考文獻資源體系結構,使之合理化并趨于嚴密。自考文獻資源體系的研究方法一直是以知識組織和知識構建為主,通過不斷地積累資源并歸納總結來提升自學考試的研究水平。這種研究方法可以形象地歸納為“收集加解釋”。利用知識本體進行資源體系的再組織,可以使得該學科的知識得以重新整合和結構化。其體系結構將更加符合人類發現自然、認識自然的客觀認識規律。
(4)從現有知識體系中挖掘新的知識。通過基于本體的系統,利用自動化手段,可以發現從前未曾關注到的,已有足夠理論和數據支持,但尚未形成結論的知識領域,從而為該領域發現新的知識。
4 自考文獻資源體系的構建過程
本體(Ontology)作為一種能在語義和知識層次上描述信息系統的概念模型建模工具,已在知識工程,數字圖書館、軟件復用、信息檢索和Web上異構信息的處理、語義web等眾多領域得到了廣泛的應用。對于ontology的構建和使用,在國際上已成為信息系統的研究熱點,在國內尚處在起步階段。但其研究將成為國內的情報檢索、數字圖書館等領域的熱點,成為一種新的情報科學與信息技術結合的研究方向[4-5]。本體建模是指對該領域中的知識、概念、實體及其關系進行明確規范的概念化描述的過程。本體建模的方法常用于知識表示、知識管理、知識共享和重用。創建自考文獻信息資源體系的本體模型,是這一領域知識交流、知識管理、知識共享與重用必不可少的工具之一,也是自考文獻信息資源數字化建設的重要基礎。
本文將知識本體引入到自考文獻資源領域,嘗試構建自考知識本體作為自考文獻資源加工、組織和利用中有力的語義工具來解決語義異構問題,使得自考知識概念得到明確惟一的定義。在師生和自考文獻資源之間建立起一座語義溝通橋梁,使得計算機不僅能夠充分理解師生的信息服務需求,而且可以明確自考文獻資源中各種概念的明確含義,提供具有語義的信息檢索服務。擬采用斯坦福大學醫學院開發的七步法,主要用于本體的構建[6-7]。7個步驟分別是:
第一步,確定本體的專業領域和范疇。先要明確幾個基本問題:
①構建的本體覆蓋哪些專業領域。
②應用該本體的目的:為了更好地挖掘本領域的深層信息。
③本體中的信息能回答哪些類型的問題。
④該本體的用戶與系統維護者是哪些人。
⑤確定領域本體可以“回答”的專業問題,即系統能力問題。
第二步,考查復用現有本體的可能性。如果自己的系統需要和其他應用平臺進行互操作,而這個應用平臺又與特定的本體結合在一起,那么復用現有的本體就是最行之有效的方法。許多本體都有電子版本,而且可以輸入到個人使用的本體開發系統中。即便一種知識表達系統不能直接以某種特殊的格式來工作。將本體由一種格式轉換為另一種格式并不困難。在Web上可以找到很多現成的本體文庫。
第三步,列出本體中的重要術語。列出一份所有術語的清單,清單中的術語是解釋給用戶的。首先,需要一份最全的術語清單,此時暫不考慮概念間會有屬性及表達上的重復。接下來的兩個重要步驟是完善等級體系和定義概念屬性,這兩個步驟是密不可分、互相交織的。二者必須同時進行。這兩個步驟在本體的設計進程中最為重要。
第四步,定義類和類的等級體系。主要分為自頂向下法、自底向上法和綜合法3種方法。每位研究者要采取什么方法主要依賴于個人對這一專業領域的理解程度和觀點。無論選擇哪種方法,都要從“類”的定義開始。
第五步,定義類的屬性。只有類的體系根本不足以提供系統能力問題所需的答案信息。一旦定義好了一些類,就必須開始描繪概念間的內在結構。
第六步,定義屬性的分面。一個屬性由多個“分面”組成。一個屬性的“分面”,就是屬性取值的類型、容許的取值、取值個數和有關屬性取值的其他特征。
第七步,創建實例。定義某個類的下屬實例需要:確定一個類,創建該類的一個實例,以及添加這個類的屬性值。
經過對以上步驟的詳細分析,確定自考文獻知識本體模型的構建步驟如下:
(1)確定自考文獻資源知識本體的專業領域和范疇。明確構建自考文獻資源知識本體的目的,為自考文獻資源數據庫提供快捷的查詢服務。
建模對象:本體中的概念為自考文獻資源的專有概念。概念的確定應參考相關的自考文獻敘詞表,但目前本領域的敘詞表無法找到,需要構建,暫時無法使用。敘詞表是一個詞匯庫,這些術語為知識本體中概念的創建提供指導。利用文本自動主題標引方法對候選概念進行篩選,以獲得該知識領域的核心概念。自考文獻資源元數據十分龐大,數據間關系錯綜復雜,為方便模型的建立,選擇其中結構較清晰的學科專業類概念作為建模對象。
系統能力:從系統的長遠需求來講,知識庫系統應能夠實現較深入的數據挖掘,回答用戶提出的相關問題。采用基于關聯規則挖掘方式從自考文獻資源中獲取知識本體的屬性關系,利用支持度和置信度等度量方法從自考文獻文本語料中獲取最相關概念。
(2)考查復用現有本體的可能性:這種可能性很小。一方面,自考文獻類還沒有出現相應成型的本體系統。另一方面,公開發行可以免費使用的通用(頂級)本體數量少之又少。網上可以免費使用的通用本體系統如OpenCyc、SUMO等,經過考察都不適于自考文獻的使用。因此,只能從零開始構建適合自考文獻數據庫使用的本體系統。
(3)列出本體中的重要術語。
(4)定義類和類的等級體系。本文采用自頂向下法,即由知識中最大的概念開始,再將這些概念細化。
(5)定義類的屬性。
(6)定義屬性的分面。
(7)創建實例。
筆者認為:自考文獻資源元數據包括三類概念:一是表達自考文獻類型的元數據,稱為類型元數據,包括紙質資源、電子資源、音響資料等;二是表達自考文獻來源的元數據,包括政策制度、發展方向、理論和方法等;三是表達自考文獻知識單元內容的元數據,稱為語義元數據,包括農學、工學、理學、文學、藝術等不同的學科專業,具體的劃分沒有統一的標準,具體應參照全國高等教育自學考試專業設置匯編及細錄。本文模型以“語義元數據”為核心概念集。現以甘肅農業大學高等教育自學考試的學科專業設置為例,共有草業科學、農業水利工程、農學、生物技術、植物保護與檢疫、現代園藝技術、農業經濟管理、畜牧獸醫、水利工程管理、動物科學等10大類。給出農業經濟管理學科本體的部分類。從圖中可以看出,用本體可以較好地呈現學科資源的內容結構和知識結構,它是一種有效的知識建模方法。
5 結 語
隨著信息技術的迅猛發展和網絡教學的不斷推進,教育思想、教育觀念、教學手段、教學模式也在發生深刻的變化,教學過程與信息資源的聯系越來越強,尤其是在自學考試文獻資源體系建設方面,更需要強大的信息推送和系統模型構建。就本體模型的應用范圍而言,可以應用于整個專業領域,也可以根據需要的不同而創建不同的模型。本文擬利用知識本體對概念進行語義描述,將目前的自考信息服務從關鍵詞層面提高到語義層面,提升高等教育自學考試公益服務的效率和精度。通過構建基于知識本體的自考文獻資源體系,完善自考文獻資源體系的共建共享機制,促進高校自考文獻資源服務體系的發展,同時加快了自考文獻資源體系在共建共享中的標準化進程。在某種程度上達到了知識共享和重用,提高了全國高等教育自學考試資源的利用效率。
參考文獻
[1]廣崇武.應當重視和研究自考文獻資源建設[J].教育與考試,2009,(5):25-29.
[2]江河.構建基于知識本體的教育領域知識庫初探[J].微計算機應用,2010,(10):70-75.
[3]張莉萍.基于本體論的知識組織與知識檢索[J].情報資料工作,2008,(6):27-30.
[4]蔣智剛,基于本體論在Web中的信息檢索[J].情報雜志,2007,(6):103-105.
[5]翁暢平,沈娟.基于Ontology的個性化語義檢索系統研究[J].圖書館理論與實踐,2009,(10):77-80.
[6]Natalya F.Noy and Deborah L.McGuinness.Ontology Development 101:A Guide to Creating Your First Ontology[EB].http://protege.stanford.edu/publications/ontologydevelopment/ontology101-noy-mcguinness.html,2001-08.
[7]夏立新,韓永青,張進.基于本體的情報檢索學科知識組織體系構建[J].現代圖書情報技術,2008,(12):80-85.