李 坤
(湖南文理學院圖書館,湖南 常德 415000)
CNKI是中國知識基礎設施 (China National knowledge Infrastructure)的英文縮寫。CNKI工程的宗旨就是建設一個進行知識收集、傳播、擴散的供個人與機構利用的知識信息資源系統和交互網絡平臺,為全社會提供一個知識信息共享的服務平臺和協同工作平臺,為各行各業的各類機構對本單位的知識收集、傳播、擴散進行有效管理提供適用的知識管理平臺,二者結合起來,實現知識服務之目標[1]。CNKI工程于1995年正式立項。在國家領導以及教育部、中宣部、科技部、新聞出版總署、國家版權局、國家計委的大力支持下,在全國學術界、教育界、出版界、圖書情報界等社會各界的密切配合和清華大學的直接領導下,CNKI經過多年努力,采用自主開發并具有國際領先水平的數字圖書館技術,建成了世界上中文信息量規模最大的 “CNKI數字圖書館”。 CNKI數字圖書館集知識信息資源精華之大成,基于知識網絡與知識服務網絡而建造超大型期刊、圖書、博碩士論文、會議論文、專利、報紙等數據庫,一覽浩瀚知識信息資源;引文鏈接、知識元鏈接,將知識內容點點關聯,對知識發現、發展脈絡步步跟蹤;用戶遍及全國和歐美、東南亞、澳洲等各個國家和地區,實現了我國知識信息資源在互聯網條件下的社會化共享與國際化傳播,使我國各級各類教育、科研、政府、企業、醫院等各行各業獲取與交流知識信息的能力達到了國際先進水平。
“中國知網”是CNKI的一個門戶網站,該網由中國學術期刊光盤版電子雜志社、清華同方知網北京技術有限公司主辦,是基于《中國知識資源總庫》的全球最大的中文知識門戶網站,具有知識的整合、集散、出版和傳播功能。CNKI自1995年起建設至今已有近15年的歷史,其技術產品發展過程經歷了光盤版時代(《中國學術期刊《光盤版》1996年12月一1999年5月)、網絡版時代(中國期刊www.chinajournal.net.cn,1999年6月一2001年8月)和知識服務平臺時代 (中國知網 www.chki.net,2001 年 9 月至今)[2]。前兩個時期CNKI的文獻產品比較單一,只有期刊全文數據庫一種,是典型的提供文獻型數據庫。而現在的CNKI己擁有期刊論文、學位論文、會議論文、報紙、年鑒、圖書等多種文獻類型的數據庫,并己將所有數據庫資源統一置于“中國知網”網絡服務平臺上,開始實現從信息服務到知識服務的轉變。“中國知網”現階段整合上網的文獻、信息、知識的數字化資源有“CNKI知網數字圖書館”、“中國期刊網”、“中國研究生網”、“中國社會團體網”、“電子圖書網”、“中國名師教育網”、“《問答與導學》名師多媒體輔導網”、“中國醫院數字圖書館”、“中國企業知識倉庫系列”、“中國城建知識資源網”、“CNKI中國農業知識資源網”、“中小學多媒體數字圖書館”、“CNKI英漢/漢英詞典”和“中國知識資源總庫”。其中,《中國知識資源總庫》是中國知網的核心資源,涵蓋CNKI所有自制資源及加盟資源,是基本源數據庫,其它各種專業知識數據庫大多由其衍生出來。
CNKI工程作為國家級重點新產品重中之重項目,經過不斷培育和發展,長期致力于知識信息資源的全社會共建共享,致力于利用互聯網進行互動協同學習、工作平臺的建設,通過與全國期刊界、博碩士培養單位、學術界、新聞出版與圖書情報等社會各界的廣泛合作,目前已經建設、積累了大量的知識信息資源,開發了一系列的信息服務、知識服務與知識管理技術,搭建了基于互聯網和衛星網覆蓋全球的“CNKI數據庫交換服務中心”,實施了標準化改造,初步完成了從信息服務到知識服務的模式轉變。在贏得國內外高校科研、黨政機關、企業、醫院廣大用戶高度認可的基礎上,為了全面實現國家“十五”計劃制定的知識信息資源全社會共享的目標,促進高校數字圖書館建設、科研文獻信息保障體系、電子政務工程、教育信息化、醫院信息化、企業信息化以及各行各業創新與知識管理戰略的實施,近日,CNKI工程做出決定,正式向全社會各類機構和個人開始實施個性化知識服務[3]。
從CNKI平臺結構功能及其知識構建程度可知,該平臺是一個集信息搜集、知識加工、存貯、檢索為一體化服務的數字圖書館整體解決方案。基于此平臺上的CNKI數字圖書館也必須具備網絡虛擬化、分布協同工作、統一管理等基本特征,具備下列知識服務功能[4]。
CNKI數字圖書館通過知識網站管理系統為用戶單位提供了專門的數據接口,經過《總庫》出版者的許可,可以將用戶單位所需知識資源從不同子庫中抽取到本地,重新組合建庫發布;也可以揉和以自身特有資源,作為內容豐富的特色數據庫為本單位提供更好的服務。
面對分布異構的網絡數據庫,CNKI數字圖書館利用知識網站管理系統,為用戶提供了分布異構統一檢索系統(USP),在網絡數據庫和用戶之間搭起了知識服務的橋梁。
作為知識創建與出版者,圖書情報機構應能將本館的特色館藏有選擇的揭示出來,或對某一領域的知識進行深入挖掘,依法解決作品著作權使用許可之后,即可作為本館創建發行的特色知識庫提供給用戶。根據知識來源不同,特色知識庫的建設有紙質資源電子化、現有電子資源整合、互聯網信息資源整合三種類型。
網絡視頻會議系統和網上協同工作平臺可以實現視頻傳輸和音頻交互,支持多路視頻同時傳送;支持多人同時操作電子白板;具有程序共享功能;具有文字聊天、資源同步與共享、實錄回放、會議控制及管理、服務器級連等多種功能,而且可選擇多種模式,如分組會議、廣播會議、研討會議、兩點會議等。
2.5.1 網上授課系統
針對不同學科建立教師推薦參考書庫、教學素材庫、教師教案講義庫;答卷/作業提交系統及試題/作業庫;問/答系統及問題答案庫。
2.5.2 咨詢服務系統
該系統能夠自動回答一些提問頻率較高的常見問題,問題庫于日積月累并逐漸擴充,此種咨詢方式可以24小時響應終端提問。如果在咨詢服務系統中找不到答案,用戶可以進一步利用Web表單與E-mail咨詢系統提問,在有限工作日內咨詢員將做出答復。
2.5.3 個性化服務系統
個性化信息服務系統能夠為不同用戶提供不同的服務,以滿足不同的需求;通過收集和分析用戶信息來研究用戶的興趣和行為,從而實現主動推薦的目的;充分提高站點的服務質量和訪問效率,從而吸引更多的訪問者。
在上述功能支持下,CNKI數字圖書館便可為用戶提供如查新服務、遠程傳送、引文索引、推送服務、個性化服務和數字參考服務等多種增值服務內容。
CNKI平臺是在網絡時代人們檢索信息的繁瑣與不便的背景下產生的,它除將大量的知識資源進行數字化外,最重要的是將信息進行了知識挖掘和專業分理,使人們能更加方便、有針對性地在浩如煙海的信息中找到所需內容。其具有以下優勢。
CNKI針對人們的需求提供解決具體問題的方案,大幅度提高了人們獲取知識的能力。我們可與標準化建設同步,對CNKI現有的信息資源和技術加以提升、改造,建立起產業化知識服務模式,盡快實現從信息服務到知識服務的跨越式發展。
從CNKI數據庫的作者庫中,可以得到描述、評價、管理我國各學科專業研究隊伍的專業知識;從期刊和碩博士論文的引文數據庫中,可以得到學科相關的知識、成果評價的知識、核心期刊的知識等;由全文文獻的智能化聚類,可以得到專業細化、面向課題的知識等等。
利用網絡會議可以將人們隱含于頭腦中的知識,在“思維碰撞”過程中開發出來,經語音識別、文字整理后建成知識庫。利用分布式知識庫建庫系統,隨時將人們在工作、學習、生活中產生的知識,建成個性化的知識倉庫,在特定的管理之下共享利用。
從全文數據庫中提煉出能夠明確表述一個知識內容的知識元,形成相互印證、相互關聯的“網絡化知識元數據庫”,并與各種數據庫的全文進行鏈接,構成內容廣泛的知識網絡,為用戶提供方便的知識獲取途徑。
基于CNKI平臺的數字圖書館應用是網格技術在信息資源管理領域的嘗試,與原來的基于Web的信息資源相比,其具有一些明顯的優勢,但是,它并沒有充分實現知識網格平臺上知識的完全共享和資源的高效利用,距離滿足真正意義上的知識需求仍存在著較大差距。
基于CNKI平臺的數字圖書館可提供兩種個性化服務,即面向機構用戶和面向個人。對機構的個性化體現在建立CNKI專業知識庫上,面向個人的個性化指根據用戶具體需求、定期或及時將最新數據發送給用戶、為用戶提供個性化的知識服務頁面及內容等。不管是專業數據庫,還是最新數據,這兩種個性化服務僅僅只能滿足用戶對顯性知識的需求,無力于滿足用戶對隱性知識的需求,這些服務只能算是個性化服務的前提,并不是真正意義上的個性化服務。
針對人們的需求提供解決具體問題的方案,仍處于從信息服務走向知識服務的過渡階段。
知識間的鏈接主要是通過知識元鏈接和引文鏈接將文獻間的知識關聯起來,雖然開發知識元數據庫,但是,知識間的關系仍是建立在孤立的知識元基礎之上。這些知識元均是顯性知識的記錄,知識元間的相互印證、相互關聯仍是局限于詞匯的層次,并沒有深入到語義層面。
雖然在信息資源開發利用中清華同方(CNKI)敢干大膽探索,應用先進信息/知識技術構建了CNKI平臺,在邁向知識服務的道路上走在國內的前列,但是面對著日益增長的知識需求,還顯得力不從心。所以,對CNKI平臺的知識構建程度改進已成為當務之急。筆者認為,改進CNKI平臺知識構建程度應從以下幾點出發。
知識技術可解決知識構建中的知識采集、知識模型化、知識檢索、知識重用、知識提供和知識維護這六個挑戰。可見,加快知識技術的應用,可以從根本上改進CNKI平臺的知識構建程度,從本質上提升CNK數字圖書館知識服務水平。網格技術為知識構建提供了知識管理支持,而語義Web技術為知識構建奠定了知識集成基石。正因為兩者在知識構建的作用各有側重,要解決CNK數字圖書館知識服務系統中在語義上的互聯性、在存儲上的分布性和在組織上的異構性的統一問題,CNKI平臺需要融合這兩種技術的優勢來提高知識構建的效率與質量。為此,CNKI平臺應將語義網格技術納入其知識構建之中,作為提高CNKI數字圖書館知識服務功能的新基點。
知識構建是建立在知識元全面挖掘、鏈接和語義互聯的基礎上。而CNKI平臺僅對文本中的關鍵詞、作者及其單位等進行了有限的知識元抽取與鏈接,尚未對文本中所包含的最有價值的大量知識元和知識單元進行挖掘建庫。這就需要組建各學科的知識工程師,對比較成熟的學科進行知識元歸類分析、標引規則建立和人工抽取實驗,并在條件成熟的情況下實現計算機軟件知識元自動抽取和人工修改,建立起知識元本體庫,實現人類知識在語義上的互聯和在實體上的鏈接,通過數字圖書館便可達到對任何知識的求索。
[1]http://www.cnki.net/index.htm.2009-12-10.
[2]趙蓉英,邱均平.CNKI發展研究[J].情報科學,2005(4):627-634.
[3]http://www.dl.cnki.net/gycnki/daobao/cnkidao bao6/txtdaobao01.htm.2010-2-5.
[4]戴鐵成.面向知識管理的知識元數據庫.June,18,2004.http://www.edu.cnki.net/gycnki/gycnki05_15.htm.