基金項目:廣東圖書館學科研課題(項目編號:GDTK1211)。
作者簡介:蔡焰(1976-),女,技術部主任,副研究館員,碩士,研究方向:數據庫技術及網絡信息技術。·信息咨詢與服務·
〔摘要〕本文主要介紹了基于網絡環境和基于圖書館的自主學習平臺建設方法,采用Web30中的語義網、概念圖相關理論與技術,將語義網技術與概念圖理論應用到數字圖書館中實現圖書館資源整合、個性化圖書推薦與個性化導航等自主學習平臺中,該個性化自主學習平臺包括個性化處理模塊、信息資源整合處理模塊、語義分析處理模塊、查詢模塊,為提高圖書館有效利用信息資源與提高讀者自主學習提供一種可行性解決方案。
〔關鍵詞〕Web30技術;語義網;概念圖;圖書館;個性化
DOI:10.3969/j.issn.1008-0821.2014.03.019
〔中圖分類號〕G2586〔文獻標識碼〕A〔文章編號〕1008-0821(2014)03-0082-05
Autonomous Learning Platform Construction Research in University
Library Under the Environment of Web30 TechnologyCai Yan
(Library,Shaoguan University of Guangdong,Shaoguan 512005,China)
〔Abstract〕Web30 design was mainly analysing of the semantic web technology,combined with the theory of concept map used in digital library management,built the model of autonomous learning platform for digital library framework based on Web30.In the model,the semantic web technology and concept map to digital library personalized autonomous learning in the platform,the personalized autonomous learning platform included personalized processing module,information resources integration processing module,semantic analysis and processing module,query module,to improve the effective utilization of library information resources and improve the reader provided a feasible solution of independent learning.
〔Keywords〕Web30 technology;semantic web;concept map;library;personalized
1高校圖書館信息服務平臺存在的問題
隨著互聯網絡技術的飛速發展,人類已經進入了信息化時代,互聯網已經深深地影響著人們的生活,數字圖書館就是在網絡技術快速發展的環境下產生。隨著數字化圖書普及,讀者很快被浩瀚的信息內容包圍著,如何在這些信息中提取出對自己有用的信息成了許多讀者最為關心的問題。而目前基于Web10或者Web20構建的高校圖書館自主學習平臺雖然基于高校圖書館作為學習資源進行構建,但無法實現不同信息間地來回跳轉,其信息搜索返回結果都是大量無關的信息。因此,在面對數字圖書館中的海量數據時,如何科學地組織讀者所需要的信息,如何提高Internet、Database推送服務能力與獲取最新消息方法是擺在人們面前的挑戰性難題[1]。
而作為以用戶為中心的Web30改變了傳統人們獲取信息的方式[2],從以前的大范圍信息獲取開始轉變為個性化信息獲取,通過對用戶檢索行為與偏好的匯總以及用戶對檢索結果的認可度構建以用戶為中心的個人知識庫,通過該知識庫實現信息主動推送、個性化服務等信息,這也是Web30的核心。
2Web技術概覽
21網絡環境下的自主學習
自主學習的定義是指在進行學習活動之前能預先確定課程學習目標,課程學習中又能對學習進程跟蹤處理并做出自我反饋,課程學習完畢還能進行自我檢查與評價的過程,是一種脫離教師、脫離課程的主動性學習過程。隨著網絡技術的發展,自主學習出現了基于網絡的自主學習形態,出現了由主體、客體、群體和網絡環境組成的網絡自主學習平臺。通過基于網絡交互界面進行自主交互學習,充分利用網絡資源中的文本、音頻、視頻等學習資源,通過在網絡交互環境下的群體知識共享與相互交流方式,打破學習的時間、空間、身份等限制。而圖書館作為學習資源集中地逐步成了自主學習平臺的核心,充分利用圖書館中的學習資源,配合網絡自主學習平臺中的適應性內容呈現、個性化學習過程監控、參與式信息交互、績效多元化評價等優點實現自主學習的最大化成效。
與此同時,在數字化圖書館方面,用戶已經從單向接受服務轉為接受與參與圖書館服務中,數字化圖書館服務也由單純的提供數字圖書逐步轉向以用戶為中心的服務。在Web30時代,在技術的智能化、人性化、交互性方面有了更進一步,實現智能化人與機器間的交流,通過自然語言的檢索就可以快速定位用戶需要的信息[3]。Web30的核心技術是語義網技術,通過該技術可以進行信息的智能化過濾與篩選、使信息檢索更加便捷。
22語義網本體研究
圖1語義網的層次結構[3]
Web30的核心就是基于網絡語義的研究而展開,通過在WWW文檔中加入機器能識別的網絡語義實現Internet信息交互。語義網的層次結構如圖1所示,其語義網總共由Unicode+URI、XML+NS+xmlchema、RDF+rdfchema+本體詞匯表、邏輯、證明、信任、數字簽名、字描述文檔、數據、規則組成。URI和Unicode編碼層主要是用于網絡資源標示與統一信息編碼格式以實現信息系統的跨平臺性;XML+NS+xmlchema主要負責數據包封裝與數據包解析,XML主要是負責數據內容封裝格式統一為XML的結構定義,實現文檔結構與文檔表現形式的分離[4],如圖書信息描述的文檔結構方法為:
public book RegexExample {
?public static void main(String[] args) {
?String str=″aaabc efg ABC″;
?String regEx=″aaa|fff″;
endprint
?Pattern p=Pattern.compile(regEx);∥編譯成模式
?Matcher m=p.matcher(str);∥創建一個匹配器
?boolean rs=m.find();
?if(rs) {
?System.out.println(″include!!!″);
?}
?else {
?System.out.println(″no include!!!″);
?}
?}
NS主要負責URI索引標識與文檔元素及屬性合規性校驗,xmlchema則主要進行XML文檔服務的解析與封裝,并在進行解析與翻轉過程中提供數據與格式校驗;在RDF+rdfchema中,采用RDF中的三元組描述信息資源以及資源間關系,RDF Schema則提供復雜詞匯的建模[5];本體層主要提供了一種描述應用領域的知識與描述各類資源間關系的語義,是RDFS的一種擴展;層級結構中的邏輯層、證明層、信任層則分別為推理規則提供邏輯分析、準確性分析、結論可靠性保證、輸出可靠性分析、判斷功能;數字簽名與加密主要負責使用數字簽名識別計算機信息來源是否可信任的判斷。
語義網的核心是本體論,通過該本體論實現客觀事物的系統描述[6],它主要是由類、關系、函數、公理、實例5個基本元素組成,同時在語義Web信息資源描述中,除了以上幾個元素外還需要有資源信息語義標注和語義擴展元素。因此在研究WEB語義中必須做好本體系統的構建,其構建原則必須滿足[7]:明確性與客觀性、完整性、一致性、可擴展性、最少約束性。
3圖書館自主學習平臺建設
31傳統學習平臺建設
語義網與圖書館兩者是不同事物,但兩者間具有相似的一面,都具有大量信息與信息資源合作的需要。某種意義上來說,在數字圖書館中引入語義網概念可以有效推動圖書館的發展。
在傳統學習平臺建設中,圖書館文獻資料檢索的條件基本采用關鍵字檢索,其文獻資料中的文件之間沒有任何的關聯關系,通過依靠關鍵字簡單的在數據庫中查詢其漏查率比較高。只是通過計算機簡單地進行語法匹配,然后把檢索結果又以簡單排序方式顯示給用戶,其輸出結果真實相關度非常低,根本無法滿足檢索用戶實際需求,這種方法還需要進行二次檢索才能提高其檢索率[8]。其傳統數據庫檢索流程如圖2所示。
圖2傳統學習平臺建設信息檢索模型
32基于Web30學習平臺建設
比起傳統學習平臺建設,基于Web30學習平臺加強了圖書館文獻資料檢索效率,在Web30技術中,其數據檢索方法是基于語義知識進行檢索,通過語義級別的表達實現理解讀者意圖,最終實現良好的人機交互。本文在對Web語義網、概念圖、Onotlogy信息檢索等理論基礎上構建基于Web30高校數字圖書館自主學習平臺模型。其基于語義知識檢索框架模型結構如圖3所示。
圖3基于語義知識檢索模型
基于語義知識檢索的自主學習是通過對用戶登錄后個人信息、個性偏好、所使用過的關鍵詞、信息瀏覽記錄等信息進行長期記錄與跟蹤,并對該記錄進行自動化分析總結,從而在信息檢索時基于用戶個性偏好來提供信息。在對讀者興趣模型創建與維護中可以采用概念層次模型,并通過計算文檔相似度來實現相似度計算,同時將語義網中的節點由(Ej,Wj)分別表達節點中的特征詞與權重,然后采用文檔相似度計算公式進行文檔相似度檢索。通過相似度計算來構建讀者模型中的興趣愛好,其具體流程是:首先用戶登錄并輸入信息,然后系統自動與個性偏好庫進行匹配,若匹配正確則接著在讀者模型中進行匹配,并將最后檢索結果展示給用戶,同時讀者可以對反饋結構進行滿意度評議,并把評議結果記錄更新到個性模型中。若不匹配個性庫則對讀者以前的行為記錄進行匹配,若對歷史記錄匹配正確則直接輸出檢索結果,若不匹配則作為用戶新的查詢更新模型[10]。
33基于Web30學習平臺功能結構
基于語義網技術的圖書館自主學習平臺(如圖4)總共有三大模塊:讀者自主學習管理、輔助學習管理、圖書館資源管理,讀者自主學習管理主要是指讀者個人信息管理模塊,其內容包括在線考試、個人信息管理、信息訂閱與收藏、學習計劃、學習筆記、協作學習、討論交流;輔助學習管理主要是輔助與指導模塊,其內容包括FAQ、表單查詢、實時咨詢、教師博客、遠程助教系統、課程專業頻道、網絡課程、在線課堂;圖書館資源管理模塊包括讀者行為記錄管理、圖書信息資源整合、語義分析處理、個性化檢索與導航。在圖書館資源管理中通過自主學習平臺收集與記錄用戶學習行為并存入讀者行為庫中,當用戶在圖書資源管理模塊時系統將結合讀者行為庫進行信息資源呈現。這種新的模式比起傳統圖書館資源管理與檢索更能有效利用高校圖書館資源。
331讀者自主學習管理
讀者自主學習管理主要功能有在線考試、個人信息、信息推薦與收藏、學習計劃、學習筆記、學習過程監控、討論交流。這個模塊主要是學生管理個人信息、掌握學習進度、與其他學生協作交流之用,還可以通過信息訂閱實現信息推送功能。學生最終可以通過多種方式完成自主學習,并記錄其學習情況,還可以根據課程策略完成對學生學習定量評價。
對于讀者自主學習管理中的學習過程監控模塊,它主要是負責用戶學習進度、用戶交互信息、讀者學習狀態變化采集,然后把采集信息寫入到讀者行為庫中,根據用戶學習過程記錄實現系統適應性內容呈現,如信息推薦模塊的信息呈現,并指導讀者下一步學習操作行為,形成新的學習計劃管理。
對于在線考試模塊主要是根據用戶學習過程監控采集到的數據進行針對性在線測試,其測試內容根據用戶學習行為庫中的學習記錄變化而變化,最終實現鞏固學習結果的目的。
332輔助學習管理
輔助學習管理主要用于學生自主學習評價管理之用,模塊支持互聯網協作學習與遠程輔助學習管理,功能上包圖4圖書館自主學習邏輯結構
括FAQ,表單咨詢、實時咨詢、教師博客、遠程助教系統、課程專業頻道、網絡課程、在線課堂。實時咨詢以及常見問/答(FAQ),Web表單與E-mail咨詢等服務方式,學生可以根據自己的需要選擇不同的咨詢方式。實時互動咨詢采用同步、實時交流技術來模擬面對面參考服務的問詢環境,彌補E-mail咨詢中的不足。系統不僅提供文字交互功能,還提供同步瀏覽服務,利用這種功能,咨詢員可以邊演示邊回答讀者的提問,這與傳統的參考咨詢服務極為近似,館員和讀者之間可以同步信息交流和共享網絡信息,共同瀏覽多種格式的文件,滿足遠程教學和輔助教學的需要。網頁同步瀏覽功能可以大大提高讀者服務的效率和質量。在線課堂以類似于視頻直播和在線點播的方式實現通過網絡觀摩遠程課堂的功能。
在輔助學習管理中的FAQ主要是進行學習效果評價,系統采用多元智能相關理論構建自主學習質量評價,對該模塊讀者可以自由修正,實現自主學習平臺對學習者的學習過程實施動態評價,為學習過程監控模塊提供控制反饋信息,其評測模型如表1所示。
333圖書館資源管理
圖書館資源管理主要是學習資源管理,功能上包括讀者行為庫管理、圖書信息資源整合管理、語義分析處理管理、圖書信息檢索與導航管理,為自主學習平臺提供所需表1學習評價模型
評價類別形式自評子系統自我評價網絡筆記,博客,總結反思他評子系統終結性評價單元測試,課程測試形成性評價登錄統計,頁面停留時間,共享知識點擊率,學習社區交互統計群體評價學伴評價,作品集,問題解決
endprint
要的各種教學資源,其資源信息包括教材庫、習題庫、案例庫、視頻庫、圖片庫、素材庫等,同時該模塊支持多用戶集中管理、圖書信息檢索與導航等,模塊是自主學習平臺的核心,其資源檢索模型就是基于Web30技術而實現,其優越性是傳統資源檢索無法比擬的。
讀者行為庫主要由讀者行為記錄、讀者知識網絡兩個模塊構成,主要用于記錄學生自主學習過程中圖書信息檢索、自主學習過程跟蹤,為讀者提供圖書推薦等功能。
圖書信息資源整合處理模塊主要是指通過信息資源合理的機構化組織提高信息檢索效率。通過成熟的圖書分類體系、主題詞表達工具以及Web30中的語義網(XML、RDFS、OWL)、概念圖等技術詳細描述圖書館中的信息概念,并創建本體模型與本體知識庫。其本體構建過程中,首先對圖書館信息資源元數據信息進行數據挖掘,通過數字圖書館中成熟的元數據(MARC、DC等)與XML文檔來組織與整合讀者偏好元數據信息。其具體過程是[11]:首先對圖書館資源整合,實現信息資源結構化和統一格式存儲,接著通過(MARC、DC)元數據標準進一步規范文檔,并進行有效元數據挖掘,將挖掘出的有效元數據通過XML重新組織,并存入元數據庫中。XML很好地進行了文檔信息的結構化,實現了本地類層次關系描述。
語義分析處理模塊主要負責本體知識庫創建,并將本體映射為概念圖。本體通過三元組進行事務屬性與關系描述,它是一種特殊概念圖,由此可以通過概念圖的方式來描述事物本體,并在語言分析處理模塊進語義級別的搜索。例如:若讀者喜歡大氣科學類期刊,就可以直接用自然語言“大氣科學的期刊種數有多少”進行信息檢索,語義分析處理模塊通過表達式抽取關鍵詞、詞性標注、句法分析、概念識別等操作抽取檢索式中的詞語,并轉換為概念圖模型。在對讀者信息進行抽詞處理時,通過現有抽詞工具和知識本體庫含有的專業詞匯進行數據挖掘,并把檢索表達式中的無意義的詞刪除處理。抽取詞后進行詞性標注,并進行語法分析與概念識別,采用概念圖匹配算法在語義試題庫中進行匹配[12],其過程如圖5所示。
圖5信息需求處理流程〖〗
圖書信息檢索與導航模塊是指對讀者提出的檢索需求進行自主化學習查詢定義,在對檢索需求分析處理上構建概念圖模型,然后通過概念圖匹配算法實現語義信息實體庫快速查詢,并把該概念圖的相似度計算與讀者偏好庫匹配,通過排序后展示給用戶。其具體過程是首先為用戶構建個性偏好庫實現自主化學習查詢界面,自主化學習查詢界面作為讀者信息查詢與瀏覽的窗口,實現讀者與系統之間的人機交互,用戶在信息檢索窗口進行信息查詢,并與后臺個人信息庫進行匹配,同時在偏好庫中增加權重,并對讀者行為庫進行更新,查詢模塊對讀者查詢在知識本體中進行語義擴展,并生成對應的概念圖,接著通過該概念圖在語義信息試題庫中采用概念圖匹配算法進行相似度計算與信息匹配。
4總結
本論文介紹Web10、Web20、Web30的特點與發展及其相關概念,在此基礎上分析Web30中核心語義網概念與相關技術,并將語義網與概念圖結合應用到數字化圖書館中,構建基于Web30數字圖書館自主學習平臺框架模型,語義網能夠理解字符中所包含的語義,從而更加有利于信息資源的共建共享,方便人們與計算機進行交流,做到人機對話與協同工作。
參考文獻
[1]鄭貞愛.在大學外語教學中培養學生自主學習能力[J].遼寧教育行政學院學報,2011,(1):163-164.
[2]Mingzhang Zuo,Lixin Diao,Xiaomei Liu.Research on the Construc-tion of Network Study Platform Based on Blended Learning[C].MProc.of 2009 Second International Conference on Education Technology and Training,Sanya China,2010:224-226.
[3]趙姍,李門樓,郭嘉,等.基于1NET的課程自主學習平臺的設計與實現[J].計算機工程與設計,2008,29(15):4067-4069.
[4]李門樓,李晴.基于Web的研究生英語自主學習平臺的構建及實施[J].中國教育信息化,2012,(1):45-47.
[5]惠麗,張凝,徐輝.基于Web20下網絡自主學習平臺關鍵技術研究[J].黑龍江大學自然科學學報,2011,26(1):72-74.
[6]馬啟花.基于Web30的高校圖書館圖書采訪智能化決策設想[J].現代情報,2009,29(4):117-119.
[7]朱勤,陸志明.基于信息隱藏的外包數據庫版權保護系統[J].計算機科學,2010,37(1):163-167.
[8]曾慶田,段華,等.面向知識處理的領域本體及其應用研究[J].情報學報,2006,25(6):713-719.
[9]黃坷萍,蔣昌俊.基于本體的城市交通的知識分析和推理[J].計算機科學,2012,20(2):12-18.
[10]陳剛,基于領域知識重用的虛擬領域本體構造[J].軟件學報,2011,36(6):1-11.
[11]朱益瓊,蔡鴻明,姜朋紅.基于領域本體的多層次服務綜合匹配[J].計算機工程與應用,2009,33(14):22-28.
[12]Studer R,Benjamins VR,FenselD.knowledge Engineering,Prinei Plesand Methods[J].Data and Knowledge Engineering,2012,25(122):161-197.
(本文責任編輯:馬卓)
endprint
要的各種教學資源,其資源信息包括教材庫、習題庫、案例庫、視頻庫、圖片庫、素材庫等,同時該模塊支持多用戶集中管理、圖書信息檢索與導航等,模塊是自主學習平臺的核心,其資源檢索模型就是基于Web30技術而實現,其優越性是傳統資源檢索無法比擬的。
讀者行為庫主要由讀者行為記錄、讀者知識網絡兩個模塊構成,主要用于記錄學生自主學習過程中圖書信息檢索、自主學習過程跟蹤,為讀者提供圖書推薦等功能。
圖書信息資源整合處理模塊主要是指通過信息資源合理的機構化組織提高信息檢索效率。通過成熟的圖書分類體系、主題詞表達工具以及Web30中的語義網(XML、RDFS、OWL)、概念圖等技術詳細描述圖書館中的信息概念,并創建本體模型與本體知識庫。其本體構建過程中,首先對圖書館信息資源元數據信息進行數據挖掘,通過數字圖書館中成熟的元數據(MARC、DC等)與XML文檔來組織與整合讀者偏好元數據信息。其具體過程是[11]:首先對圖書館資源整合,實現信息資源結構化和統一格式存儲,接著通過(MARC、DC)元數據標準進一步規范文檔,并進行有效元數據挖掘,將挖掘出的有效元數據通過XML重新組織,并存入元數據庫中。XML很好地進行了文檔信息的結構化,實現了本地類層次關系描述。
語義分析處理模塊主要負責本體知識庫創建,并將本體映射為概念圖。本體通過三元組進行事務屬性與關系描述,它是一種特殊概念圖,由此可以通過概念圖的方式來描述事物本體,并在語言分析處理模塊進語義級別的搜索。例如:若讀者喜歡大氣科學類期刊,就可以直接用自然語言“大氣科學的期刊種數有多少”進行信息檢索,語義分析處理模塊通過表達式抽取關鍵詞、詞性標注、句法分析、概念識別等操作抽取檢索式中的詞語,并轉換為概念圖模型。在對讀者信息進行抽詞處理時,通過現有抽詞工具和知識本體庫含有的專業詞匯進行數據挖掘,并把檢索表達式中的無意義的詞刪除處理。抽取詞后進行詞性標注,并進行語法分析與概念識別,采用概念圖匹配算法在語義試題庫中進行匹配[12],其過程如圖5所示。
圖5信息需求處理流程〖〗
圖書信息檢索與導航模塊是指對讀者提出的檢索需求進行自主化學習查詢定義,在對檢索需求分析處理上構建概念圖模型,然后通過概念圖匹配算法實現語義信息實體庫快速查詢,并把該概念圖的相似度計算與讀者偏好庫匹配,通過排序后展示給用戶。其具體過程是首先為用戶構建個性偏好庫實現自主化學習查詢界面,自主化學習查詢界面作為讀者信息查詢與瀏覽的窗口,實現讀者與系統之間的人機交互,用戶在信息檢索窗口進行信息查詢,并與后臺個人信息庫進行匹配,同時在偏好庫中增加權重,并對讀者行為庫進行更新,查詢模塊對讀者查詢在知識本體中進行語義擴展,并生成對應的概念圖,接著通過該概念圖在語義信息試題庫中采用概念圖匹配算法進行相似度計算與信息匹配。
4總結
本論文介紹Web10、Web20、Web30的特點與發展及其相關概念,在此基礎上分析Web30中核心語義網概念與相關技術,并將語義網與概念圖結合應用到數字化圖書館中,構建基于Web30數字圖書館自主學習平臺框架模型,語義網能夠理解字符中所包含的語義,從而更加有利于信息資源的共建共享,方便人們與計算機進行交流,做到人機對話與協同工作。
參考文獻
[1]鄭貞愛.在大學外語教學中培養學生自主學習能力[J].遼寧教育行政學院學報,2011,(1):163-164.
[2]Mingzhang Zuo,Lixin Diao,Xiaomei Liu.Research on the Construc-tion of Network Study Platform Based on Blended Learning[C].MProc.of 2009 Second International Conference on Education Technology and Training,Sanya China,2010:224-226.
[3]趙姍,李門樓,郭嘉,等.基于1NET的課程自主學習平臺的設計與實現[J].計算機工程與設計,2008,29(15):4067-4069.
[4]李門樓,李晴.基于Web的研究生英語自主學習平臺的構建及實施[J].中國教育信息化,2012,(1):45-47.
[5]惠麗,張凝,徐輝.基于Web20下網絡自主學習平臺關鍵技術研究[J].黑龍江大學自然科學學報,2011,26(1):72-74.
[6]馬啟花.基于Web30的高校圖書館圖書采訪智能化決策設想[J].現代情報,2009,29(4):117-119.
[7]朱勤,陸志明.基于信息隱藏的外包數據庫版權保護系統[J].計算機科學,2010,37(1):163-167.
[8]曾慶田,段華,等.面向知識處理的領域本體及其應用研究[J].情報學報,2006,25(6):713-719.
[9]黃坷萍,蔣昌俊.基于本體的城市交通的知識分析和推理[J].計算機科學,2012,20(2):12-18.
[10]陳剛,基于領域知識重用的虛擬領域本體構造[J].軟件學報,2011,36(6):1-11.
[11]朱益瓊,蔡鴻明,姜朋紅.基于領域本體的多層次服務綜合匹配[J].計算機工程與應用,2009,33(14):22-28.
[12]Studer R,Benjamins VR,FenselD.knowledge Engineering,Prinei Plesand Methods[J].Data and Knowledge Engineering,2012,25(122):161-197.
(本文責任編輯:馬卓)
endprint
要的各種教學資源,其資源信息包括教材庫、習題庫、案例庫、視頻庫、圖片庫、素材庫等,同時該模塊支持多用戶集中管理、圖書信息檢索與導航等,模塊是自主學習平臺的核心,其資源檢索模型就是基于Web30技術而實現,其優越性是傳統資源檢索無法比擬的。
讀者行為庫主要由讀者行為記錄、讀者知識網絡兩個模塊構成,主要用于記錄學生自主學習過程中圖書信息檢索、自主學習過程跟蹤,為讀者提供圖書推薦等功能。
圖書信息資源整合處理模塊主要是指通過信息資源合理的機構化組織提高信息檢索效率。通過成熟的圖書分類體系、主題詞表達工具以及Web30中的語義網(XML、RDFS、OWL)、概念圖等技術詳細描述圖書館中的信息概念,并創建本體模型與本體知識庫。其本體構建過程中,首先對圖書館信息資源元數據信息進行數據挖掘,通過數字圖書館中成熟的元數據(MARC、DC等)與XML文檔來組織與整合讀者偏好元數據信息。其具體過程是[11]:首先對圖書館資源整合,實現信息資源結構化和統一格式存儲,接著通過(MARC、DC)元數據標準進一步規范文檔,并進行有效元數據挖掘,將挖掘出的有效元數據通過XML重新組織,并存入元數據庫中。XML很好地進行了文檔信息的結構化,實現了本地類層次關系描述。
語義分析處理模塊主要負責本體知識庫創建,并將本體映射為概念圖。本體通過三元組進行事務屬性與關系描述,它是一種特殊概念圖,由此可以通過概念圖的方式來描述事物本體,并在語言分析處理模塊進語義級別的搜索。例如:若讀者喜歡大氣科學類期刊,就可以直接用自然語言“大氣科學的期刊種數有多少”進行信息檢索,語義分析處理模塊通過表達式抽取關鍵詞、詞性標注、句法分析、概念識別等操作抽取檢索式中的詞語,并轉換為概念圖模型。在對讀者信息進行抽詞處理時,通過現有抽詞工具和知識本體庫含有的專業詞匯進行數據挖掘,并把檢索表達式中的無意義的詞刪除處理。抽取詞后進行詞性標注,并進行語法分析與概念識別,采用概念圖匹配算法在語義試題庫中進行匹配[12],其過程如圖5所示。
圖5信息需求處理流程〖〗
圖書信息檢索與導航模塊是指對讀者提出的檢索需求進行自主化學習查詢定義,在對檢索需求分析處理上構建概念圖模型,然后通過概念圖匹配算法實現語義信息實體庫快速查詢,并把該概念圖的相似度計算與讀者偏好庫匹配,通過排序后展示給用戶。其具體過程是首先為用戶構建個性偏好庫實現自主化學習查詢界面,自主化學習查詢界面作為讀者信息查詢與瀏覽的窗口,實現讀者與系統之間的人機交互,用戶在信息檢索窗口進行信息查詢,并與后臺個人信息庫進行匹配,同時在偏好庫中增加權重,并對讀者行為庫進行更新,查詢模塊對讀者查詢在知識本體中進行語義擴展,并生成對應的概念圖,接著通過該概念圖在語義信息試題庫中采用概念圖匹配算法進行相似度計算與信息匹配。
4總結
本論文介紹Web10、Web20、Web30的特點與發展及其相關概念,在此基礎上分析Web30中核心語義網概念與相關技術,并將語義網與概念圖結合應用到數字化圖書館中,構建基于Web30數字圖書館自主學習平臺框架模型,語義網能夠理解字符中所包含的語義,從而更加有利于信息資源的共建共享,方便人們與計算機進行交流,做到人機對話與協同工作。
參考文獻
[1]鄭貞愛.在大學外語教學中培養學生自主學習能力[J].遼寧教育行政學院學報,2011,(1):163-164.
[2]Mingzhang Zuo,Lixin Diao,Xiaomei Liu.Research on the Construc-tion of Network Study Platform Based on Blended Learning[C].MProc.of 2009 Second International Conference on Education Technology and Training,Sanya China,2010:224-226.
[3]趙姍,李門樓,郭嘉,等.基于1NET的課程自主學習平臺的設計與實現[J].計算機工程與設計,2008,29(15):4067-4069.
[4]李門樓,李晴.基于Web的研究生英語自主學習平臺的構建及實施[J].中國教育信息化,2012,(1):45-47.
[5]惠麗,張凝,徐輝.基于Web20下網絡自主學習平臺關鍵技術研究[J].黑龍江大學自然科學學報,2011,26(1):72-74.
[6]馬啟花.基于Web30的高校圖書館圖書采訪智能化決策設想[J].現代情報,2009,29(4):117-119.
[7]朱勤,陸志明.基于信息隱藏的外包數據庫版權保護系統[J].計算機科學,2010,37(1):163-167.
[8]曾慶田,段華,等.面向知識處理的領域本體及其應用研究[J].情報學報,2006,25(6):713-719.
[9]黃坷萍,蔣昌俊.基于本體的城市交通的知識分析和推理[J].計算機科學,2012,20(2):12-18.
[10]陳剛,基于領域知識重用的虛擬領域本體構造[J].軟件學報,2011,36(6):1-11.
[11]朱益瓊,蔡鴻明,姜朋紅.基于領域本體的多層次服務綜合匹配[J].計算機工程與應用,2009,33(14):22-28.
[12]Studer R,Benjamins VR,FenselD.knowledge Engineering,Prinei Plesand Methods[J].Data and Knowledge Engineering,2012,25(122):161-197.
(本文責任編輯:馬卓)
endprint