●宋 文,張士男(中國科學院 國家科學圖書館,北京 100190)
我們正處于數字化時代,數字信息環境已經滲透和影響了社會生活、經濟、文化、科研、教育等各個領域,改變著傳統的信息發布、獲取和交流模式。數字科研信息環境也正在形成并逐漸成熟,在這樣一個時代背景下,我們有幾個基本的判斷:
科研綜合數字信息環境有幾個典型特征。首先,一切科研對象,如科研人員、科研機構、科研設備、科研項目、科研基金、科研成果等科學研究過程涉及的對象都越來越多地是用數字化表征并可通過網絡查詢。第二,科研人員更多地采用網絡和數字信息平臺進行科學交流。如科研人員用個人博客發表論文和觀點,開展討論;跨區域的合作研究項目用門戶平臺發布科研成果,開展合作與交流;科學家群體用MailingList對某個科學問題進行討論,用ARP、ERP進行科研管理,用科學工作流系統進行科研過程的管理等等。第三,數字信息資源的類型極大豐富。綜合數字信息環境下信息資源類型已大大超越傳統數字圖書館的電子期刊、論文、電子圖書、會議論文等有限的類型,科研綜合數字信息環境下信息資源的類型包括各種類型的科學數據(白色數據、暗數據、灰色數據、管理數據等)、人物數據、機構數據庫、網站、博客、郵件列表、RSS、PPT、會議信息、研究項目及相關資料、機構知識庫等,還包括教育資源(如課件、課程計劃、課程管理系統、講座、可視化資料、教學/學習工具等),軟件資源、儀器設備資源(包括各種實驗儀器、存儲設備、通信設備、各種圖像捕獲設備等)、計算資源,其他新型資源如動植物種質、微生物菌種、生物標本、遺傳基因、巖石礦石化石土壤、標準物質、實驗材料、試劑、傳感器、觀測活體、實驗活體、保護區、產品、樣品,等等。[1]在這樣一個綜合數字信息資源數量和類型急速增長的趨勢下,如何有效地組織、開發、集成利用綜合科技信息資源已成為迫切需要研究和解決的關鍵問題。
用戶的信息需求是隨著信息環境的發展而變化的,一個階段難以滿足的關鍵需求在另一個階段可能就是容易滿足的常態需求。如果說20世紀90年代,用戶需求的主要矛盾是在文獻信息資源獲取方面,尤其是外文文獻資源的獲取是我國科研、教育領域的一個關鍵問題,那么經過NSTL國家科技圖書文獻中心大規模的文獻資源建設,通過中科院、高校系統的大規模資金投入用于建設電子文獻信息資源,應該說,科研、教育領域對文獻資源的需求已基本得到滿足。但是在綜合數字信息環境下,用戶信息需求的突出矛盾已演變為用戶科研過程中綜合科技信息資源的快捷、準確、方便的發現和獲取問題,演變為用戶科研過程中實時的綜合科技信息的發布、實時的成果共享交流等方面的問題,演變為用戶如何能在科研過程中集成利用各種類型科研資源的問題。
搜索引擎在用戶信息發現方面做出了巨大的貢獻,但是網絡資源浩如煙海,廣泛散布,即使利用目前最為強大的搜索引擎,其涉獵的網頁也不超過15%。其次,所檢索的結果也無法適應不同用戶(研究者、教師、學員等)的特殊要求。[2]
如何構建緊密融入用戶科研過程的個性化知識環境,并通過這一環境有效地采集、集成多類型的綜合科技信息資源,并基于這一環境提供知識化服務已經成為信息服務領域面臨的關鍵問題。
一方面網絡數字信息資源的極大豐富,使得搜索引擎已成為人們獲取信息的首選工具;[3]數字化出版使得出版商不再單純地賣文獻,而是將文獻、數據、服務包裝成一個系統直接提供用戶使用;數字學術交流也已經可以不通過圖書館這一中間環節,圖書館賴以生存的核心價值正面臨極大的挑戰。另一方面,由于信息的過量和泛濫,造成信息無序和大量干擾信息,用戶無法快速、準確、全面獲取所需要的信息;科研用戶科研過程中的大量數字信息資源迫切需要全面的管理和保存;數字學術交流需要信息服務者用一種嶄新的模式參與其中使其更加高效,這些需求是大量的、嶄新的、變化的。文獻信息機構不管是從自身生存發展的需要出發,還是從用戶需求出發,都需要進行服務能力的創新和再造,實現從傳統圖書館向融入用戶團隊、融入用戶科研過程的知識化服務轉變。信息時代賦予圖書館新的歷史使命和發展機遇,建設專業領域知識環境正是中科院國家科學圖書館為滿足科技創新的需求而啟動的新的服務能力建設的一個具體措施。
為了滿足科研一線綜合科技信息發布、組織、管理和利用的需求,中科院國家科學圖書館開始啟動專業領域知識環境的建設工作。
專業領域知識環境(SubjectKnowledgeEnvironment,SKE)通過集成和個性化定制數字圖書館公共文獻服務體系資源,通過搜索采集遴選集成社會網絡中的相關資源,形成面向研究所、課題組、研究領域的個性化知識環境。一方面專業領域知識環境與研究所文獻集成平臺、機構知識倉儲共同構成了研究所數字知識環境,另一方面專業領域知識環境又與遠程會議系統、虛擬研究社區、科學工作流系統等共同構成了用戶科研信息環境。
專業領域知識環境的愿景是面向科研一線,支持融入科研過程的用戶自主靈活地構建個性化的知識環境,支持知識資源和知識服務的動態聚合和智能發現,支持對領域知識資源的發布、交流、組織與利用。[4]具體來說:
(1)支持科研機構、科研團隊和科研人員科研過程中快速靈活構建個性化知識環境,實現即時的知識發布、知識交流與知識管理。
(2)支持集成融匯、信息采集等先進技術的應用,支持對領域知識資源的集成,支持圖書館專業人員和用戶合作的領域知識資源的遴選、采集、集成組織和利用。
(3)支持圖書館員面向重點研究領域、重大項目、重要研究團隊提供實時的、個性化的綜合科技信息服務和增值的知識化服務。
(4)支持科研用戶按照其需求和使用偏好對知識資源的個性化組織,支持圖書館專業人員協助進行知識資源的描述、組織與管理。
(5)支持基于一個或多個專業領域知識環境的集成的知識挖掘、知識發現、知識推理,支持知識資源的結構化、可視化呈現和關聯導航。
專業領域知識環境由三層技術體系支撐:集成層、存儲層和Web服務層。
集成層實現多來源異構數據的采集集成,經過對象識別、元數據轉換、語義映射等處理,將重要的綜合科技信息資源按本體結構存儲到統一的知識庫中。集成層需要解決的關鍵問題是目標信息源的自動搜索發現,WWW上大量非結構化或半結構化異質數據對象的智能識別和抽取,多來源數據的語義轉換和映射。
存儲層的核心組件是知識庫和本體引擎,知識庫又包括科研本體和綜合科技信息資源實例。本體引擎可以看作專業領域知識環境的內核,負責本體和知識庫的存儲管理,負責對知識庫的檢索推理和各種基于本體的計算。Web服務層通過本體引擎實現對知識庫的操作。本體引擎通過開放的API接口,提供第三方應用系統對知識庫內容的檢索、存取操作。
Web服務層直接面向終端用戶提供服務。通過Web服務層,用戶可以按本體語義模型進行知識的發布,可以基于本體邏輯實現知識的瀏覽、導航、關聯檢索,以及知識的推理和知識發現。
在中國科學院創新經費的支持下,國家科學圖書館建立了專業領域知識環境關鍵技術研究項目組,對專業領域知識環境建設的關鍵技術進行研究并開發試驗系統,開展試點應用。項目組經過調研,決定以康奈爾大學的vitro系統為基礎系統,對其進行本地化改造和擴展功能開發,來構建專業領域知識環境平臺(SKE平臺),項目從2008年底啟動,目前專業領域知識環境已達到了以下服務能力:
SKE平臺提供了一個基于統一的平臺,可靈活定制個性化知識環境構建的解決方案。SKE平臺根據中國國情,在系統中實現從發布管理到服務的知識資源生命周期中的管理機制,融入了以用戶為主導的,資源建設人員和學科館員作支撐的知識環境建設機制。SKE平臺采用“一個平臺,多個門戶”體系結構,支持用戶基于SKE平臺自主建立面向重大科研項目、重點研究領域、特定研究機構(研究所、實驗室或課題組)的個性化知識環境。
在一個平臺、多個門戶的體系框架下,實現知識資源的動態發布、更新,實現門戶與門戶之間即相互獨立,又共享合作的知識資源管理模式。基于目前SKE平臺能力,用戶可以動態發布關于科研人員、科研項目進展情況、科研成果等科研過程中涉及的知識資源的信息,用戶也可以隨時集成網絡相關資源、RSS新聞等內容,這樣一個平臺將會成為用戶科研過程中必備的知識管理、知識交流和知識發現工具。
在SKE平臺中,注冊用戶可在權限范圍內發布、共享、編輯、刪除、管理、評價資源記錄,確定資源記錄允許公開/修改的程度及范圍,并選擇記錄是否發布至公共門戶,同時可在權限允許范圍內瀏覽、編輯、管理本門戶其他用戶發布的信息,共同管理、豐富本門戶的信息資源,構建大家熟悉的信息交流方式,形成領域研究的學術社區,從而實現團隊內部知識的嚴格控制與共享,領域知識的合作發行與交流。圖書館員可以通過SKE平臺向用戶推薦經過評價遴選的領域知識資源,并通過添加RSS源,實現相關信息網站、核心期刊等資源的動態采集,達到實時跟蹤、獲取科研最新進展的目的。
SKE平臺是一個本體驅動的語義門戶,其資源組織基礎是底層的科研本體。科研本體涵蓋了科研人員、科研機構、研究項目、學術活動、科研成果、科學數據、[5]科技新聞、科研動態公告、設備與技術服務、文獻資源、招生招聘、科技政策規劃、資助與合作等科研過程中的資源類型。科研本體總計包括120個概念類,92個對象屬性和95個數值屬性。在科研本體的基礎上,SKE平臺實現了知識資源的關聯瀏覽、智能檢索和基于本體的結構化呈現,我們也初步嘗試了基于本體的知識發現和推理,并取得了一定的效果。
在試驗平臺基本完成后,項目組與研究所圖書館和科研人員合作,開展了試點應用,建立了三個試驗性的知識環境:中科院專業領域知識環境,[6]西南生物多樣性知識環境,[7]生物醫學與健康知識環境。[8]
SKE試點應用過程中,得到科研人員的很好反饋和積極參與、響應,許多科研人員都表示希望能盡早使用SKE這個信息服務工具,認為“SKE平臺的建設,能夠很好的滿足項目組進行科學交流和項目展示的目的,項目組很需要這樣的平臺”,“SKE是一個宣傳科研人員自己工作成果的新的窗口,同時也能夠呼吁大家共享信息,是一個很好的平臺”。
隨著系統建設和試點應用的推進,我們發現用戶對SKE的需求已經從功能需求,逐漸轉變到對系統易用性、展示性及其他特殊的需求,這從側面反映出SKE的系統開發和建設的關鍵技術研究已經實現。在SKE平臺建設中,項目組雖然取得了一定的成果,但也有一些未能很好解決的問題。如當前本體距離通用科研本體的建設目標還有一定距離;如何構建可靠的、長期的、合理的SKE應用和推廣機制、協調機制、管理機制、建設機制;隨著應用范圍的不斷擴大,如何保證合理范圍內最大限度的滿足科研人員的特殊功能和服務需求;如何與研究所的其他信息建設平臺/系統實現科學的定制和融合;如何更好的實現信息的自動采集等等,這些方面的問題有待繼續探索和解決。
從項目建設和試點應用整個過程,我們深切地感受到,為用戶構建一個健壯、穩定、易用、智能的知識服務系統,是科學研究的迫切需要,也是文獻信息機構應該承擔的職責。
[1]孫坦,等.知識資源的生產、收集、組織與利用發展趨勢[R].2008.
[2]祝智庭,胡小勇.ODL科研信息環境的概念設計框架[J].遠程教育雜志,2003(4):7-10.
[3]CathyDR,etal.PerceptionsofLibrariesandInformation Resources:A Report to the OCLC Membership.[R/OL].[2009-04-06].http://www.oclc.org/re-
[4]宋文,等.院所協同機制下的專業領域知識環境建設[J].圖書情報工作,2010(7):116-120.
[5]黃金霞,等.中國科學院專業領域知識環境的建設與應用[J].圖書情報工作(S2),2010:337-341,352.
[6]中科院專業領域知識環境[EB/OL].[2010-12-18].http://ske.las.ac.cn.
[7]西南生物多樣性知識環境[EB/OL].[2010-12-18].http://sbke.las.ac.cn.
[8]生物醫學與健康知識環境[EB/OL].[2010-12-18].http://health.las.ac.cn.ports/pdfs/Percept_all.pdf.