徐天偉 甘健侯 李金緒等
[摘要]結合民族教育信息資源建設的科學研究、受教育者對民族教育信息資源獲取和應用的具體需求,文章介紹了基于e-Science的民族信息資源服務平臺總體設計,并對民族教育信息資源基礎數據、應用服務、科研協同平臺建設進行了研究。
[關鍵詞]科研信息化;民族教育信息資源;服務平臺
[中圖分類號]G40-057[文獻標識碼]A[論文編號]1009-8097(2012)01-9107-03
引言
國家中長期教育改革和發展規劃綱要(2010-2020年)明確提出:全面提高少數民族和民族地區教育發展水平;公共教育資源要向民族地區傾斜;加強優質教育資源開發與應用。加強網絡教學資源體系建設;建立開放靈活的教育資源公共服務平臺,促進優質教育資源普及共享。
云南是民族文化資源大省,聚集了全國近一半的少數民族,是我國少數民族的主要聚居地之一,如何有效地保護、傳承其優質的民族文化遺產、開發民族教育信息資源是當前面臨的重要研究課題。考慮利用當前國際前沿的信息處理技術,融合民族學、教育學等方面的知識,針對不同的民族特色和民族文化資源特點,以本體理論為基礎,結合受教育者、大眾對民族教育信息資源獲取和應用的具體需求,研究如何綜合集成信息技術和手段,研發支持跨學科的科研合作,跨越時間、空間、物理障礙的資源共享與協同工作的軟件平臺和工具。構建民族教育信息資源服務平臺的目標是滿足受教育者和大眾對民族教育信息資源檢索和知識服務需求,它是構建“科研人員+大眾+基礎數據平臺+應用服務平臺+協作共享平臺”的綜合平臺,它能全方位、網絡化、綜合性的服務大眾和科研人員,以此滿足用戶的多元化需求。
一、e-Science概述
e-Science由英國在2000年提出,是為了應對當時各學科研究領域所面臨問題的空前復雜化,利用新一代網絡技術(Internet)和廣域分布式高性能計算環境(Grid)建立的一種全新科學研究模式,即在信息化基礎設施支持下的科學研究活動。此后,該理念便席卷世界各科研領域,大家都試圖用它來解決本學科在研究過程中遇到的種種難題。
e-Science的意義:(1)使得全球性的、跨學科的、大規模的科研合作,跨越時間、空間、物理障礙的資源共享與協同工作成為可能;(2)這將改變科學家們從事科研活動的方法和模式,極大地促進交流合作,推動科學研究的發展;(3)科研信息化是下一代互聯網絡技術及信息基礎設施在科研領域的率先應用。
e-Science的特點:(1)開放式的科學研究;(2)資源共享,包括高性能計算機、實驗數據、科學儀器等資源共享;(3)協同式的科學研究。協同式科研可以無空間障礙進行合作研究,并且可以是跨越多個領域的復雜的協同工作。
隨著信息技術的發展,科研人員之間的合作和交流更加密切,需要根據科研活動和研究任務的需求,方便、靈活地創建虛擬組織,進行資源分配和共享,有效地組織開展相關活動。民族教育信息化科研協同包括虛擬工作臺、數據集成與共享工具、學科文獻檢索與交流工具、協作工具集等模塊。通過構建民族教育信息化的科研協同環境,可以開展系統性、集成性、綜合性的科學研究,拓展科研能力。通過信息化的手段改善和優化科研人員開展科學研究的方法,使用信息技術促進科研人員進行跨學科、跨地域、跨組織的交流和協作,提高科研效率和拓展科研能力。
二、民族教育信息資源服務研究現狀和研究意義
隨著人們對資源建設重要性認識的深入,愈來愈多的學校、企業、機構涉足于這一領域,目前國內教育信息資源服務平臺的開發模式主要有以下幾種類型:(1)由學校或個人創辦的學科資源或專題學習網站;(2)基于校園網的教學信息資源庫;(3)由企業研發的大型數據資源系統;(4)分層開發的區域性教育資源庫。
民族教育信息資源庫建設雖然取得很多成果,但考慮基于e-Science的民族教育信息資源語義化融合管理與創新服務的研究還不多見。云南省民族教育信息資源服務相對落后。要緊跟信息時代的步伐,必須轉變和創新服務模式。網絡化和語義化融合管理可以解決邊疆地區民族教育信息資源服務的共享和網絡虛擬化,可以幫助改善和優化傳統的民族教育信息資源服務研究方式。這項研究對民族教育信息資源服務和提高教育服務水平具有重要意義。
三、基于e-Scionce的民族信息資源服務平臺的設計
基于e-Science的民族教育信息資源服務平臺是構建“科研人員+受教育者+大眾+基礎數據平臺+應用服務平臺+協作共享平臺”的綜合平臺,它能全方位、網絡化、綜合性服務大眾和科研人員,以此滿足用戶的多元化需求。該平臺能夠使研究內容迅速有效的協作與交流,使研究成果在社會公眾中得到快速傳播。
民族教育信息資源服務平臺主要基于數據庫技術、數據挖掘技術、機器學習、本體技術、知識工程等先進技術與方法,對民族教育信息資源進行組織、管理與服務應用。民族教育信息資源服務平臺包括五層:基礎設施層、基礎數據層、服務平臺層、用戶應用層和協作共享層。基于e-Science的民族信息資源服務平臺總體設計如圖1所示:

基礎設施層包括網絡設施、服務器、存儲器、超級計算機和Internet,它為民族信息服務綜合集成平臺的基礎性數據通訊、計算、存儲和管理提供基本的硬件支持。
基礎數據層包括民族信息資源數據庫、領域本體知識庫、民族信息資源文檔庫和其它資源數據庫。涵蓋了民族信息資源的所有數據,是整個系統的核心。數據的獲取主要通過民族信息文檔及文獻資源等。
服務平臺的技術支撐包括數據庫應用、數據挖掘、文檔挖掘、本體獲取與映射、日志挖掘和決策支持。
用戶應用層包括用戶信息檢索、民族信息資源網站和個性化推薦;技術支撐包括個性化推薦技術、可視化技術、智能搜索技術、知識推理與服務、網站自動生成。
協作共享層包括電子郵件系統、視頻桌面系統、VOIP系統、在線通訊系統和協同工作平臺。擴展服務層在民族信息資源服務的基礎上,將現有的、成熟的應用系統無縫集成到平臺中,方便用戶使用。
四、民族教育信息資源服務平臺基礎數據建設
民族教育信息資源獲取來源于Internet和Web頁面、數據庫應用系統中現有的與民族教育信息相關的資源和應用采集設備獲取的數字化民族教育信息資源,采取的內容包括文字資源、圖書資源、圖片資源、音視頻資源;民族教育信息資源獲取、采集和組織管理機制是核心工作。
基礎性數據獲取是該課題的基礎性工作,采集途徑多種。重點在信息模型的建立上。獲取的渠道主要有:(1)直接從云南省、州市、縣現有的民族教育信息資源數據庫系統獲取數據,并與之保持信息的一致性;(2)利用各種人工方式和途徑采集和更新民族教育信息資源;(3)利用互聯網實現面向民族教育信息資源搜索和挖掘技術,獲取民族相關信息資源;(4)利用文獻搜索和挖掘技術獲取民族教育信息資源。
基于本體工程方法論Methontology,根據前期工作積累的大量民族教育信息資源,提取民族領域基本術語,分析民族教育信息資源中概念和概念之間的關系,研究了民族教育信息資源中概念和關系的表示形式,定義與概念相關的詞匯和實體,并構建一組該領域內的公理、定理和規則,構成形式化的民族教育信息資源本體知識。
五、民族教育信息資源服務平臺的應用
1.民族教育信息資源檢索技術
(1)基于本體的民族教育信息檢索技術
基于查詢擴展和關系代數擴展的語義檢索:從用戶查詢到語義查詢的轉換規則,使用轉換之后的查詢檢索數據庫;利用本體知識庫中的公理和規則來替換查詢中的概念或關系,以擴大檢索范圍;將語義關系代數操作,如并、交、投影、連接等,應用到不確定知識的檢索,實現對民族教育信息的復雜檢索。
將民族教育信息資源知識本體作為知識描述和檢索的語義基礎,利用本體推理,研究查詢請求的規范化處理、查詢請求的沖突檢測、語義查詢擴展等內容,實現對查詢請求及其隱含語義的檢索。
(2)民族教育檢索自動生成網頁技術
建立基于本體的科學家信息資源網站自動生成模型,主要包括:個性化主題圖導航學習,智能化知識獲取與學習。智能化知識獲取與學習可以在海量數據中進行智能知識獲取,系統能自動地把檢索的內容,組裝成為一個界面,相當于一個門戶網站。這個界面不是線性的羅列,它可以大大地提高用戶的效率。
2.基于語義的民族教育信息資源知識服務
(1)本體知識庫與數據庫的集成技術
民族教育信息資源建立的本體知識庫和現有的民族數據庫管理信息系統,兩者的集成能夠為知識服務對象提供更多的資源信息,采用一定的機制基于數據庫實現知識庫的存儲和推理。
將數據庫中的數據轉為語義Web格式的文檔數據(如RDF、OWL等),從而可以利用語義Web查詢機構進行查詢或推理;將數據庫模式用更具有明確語義的本體來表示,在數據庫模式與本體之間構建映射關系,可以將對本體的查詢轉換為對數據庫的查詢;使數據源在更高的抽象層進行語義交互,有助于不同系統之間的數據交換和融合。
(2)民族教育信息資源知識服務技術
民族教育信息資源知識服務技術主要包括:基于知識獲取與學習的民族信息資源網站個性化推薦技術、可視化技術等。
個性化推薦技術:通過收集用戶信息進行用戶喜好的判斷,用戶信息收集方法包括顯式收集和隱式收集。顯式收集主要是依靠用戶自己的個人信息輸入,收集數據可能有用戶的出生年月、婚姻狀況、工作狀況以及個人興趣等。隱式收集則獲取用戶訪問記錄、日志等信息。考慮構建個性化推薦系統,把民族信息資源按需求推薦給用戶。
可視化技術:在知識發現服務中使用可視化技術,可以用圖像、表格來顯示信息,讓用戶對信息含義的理解更加深刻。通過不同的展示機制將檢索結果用可視化技術很直觀的呈現給用戶。
六、結語
結合民族教育信息資源建設的科學研究、大眾對民族教育信息資源獲取和應用的具體需求,研究如何綜合集成信息技術,研發支持跨學科、跨時空的資源共享、信息檢索的軟件平臺和工具;并且滿足科學研究、受教育者、大眾對民族教育信息資源檢索和知識服務需求,這就是構建基于e-Science的民族教育信息資源服務平臺的目標。
基金項目:本文受民族教育信息化教育部重點實驗室開放基金項目;云南省人才計劃項目(2009C1062);云南省應用基礎研究計劃面上項目(2011)資助。
作者簡介:徐天偉,云南師范大學信息學院教授,在讀博士。研究方向:教育管理、智能信息處理。
收稿日期:2011年9月6日
編輯:小西