曹 嵐,陳建梅
(浙江省電力試驗研究院, 杭州 310014)
電力信息化
浙江電力數字圖書館建設
曹 嵐,陳建梅
(浙江省電力試驗研究院, 杭州 310014)
數字圖書館的開發與應用為電力行業信息資源的全面整合與共享提供了平臺。介紹了浙江電力數字圖書館的建設情況,針對其功能模塊、關鍵技術、發展方向進行了探討。
數字圖書館;資源整合;異構數據庫;統一檢索
浙江電力科技信息網站始建于 2003 年, 是省內最大的電力科技資訊網,為廣大電力企業、用戶提供快捷、方便、全方位的電力信息服務。截至 2009 年底, 網站擁有各類期刊、 會議論文1119.3 萬篇 , 博 /碩士論文 近 20 萬 篇 , 電 力科 技信息近 2 萬條, 國內外技術 標準全文 1.6 萬 條,全國電力科技成果信息3萬余條。
隨著時間的推移和信息化技術的飛速發展,該網站也暴露出一些問題,制約了科技信息資源的有效利用,如:資源管理平臺已經落后,不能實現一站式檢索;行業數字資源不足,難以滿足電力科技人員對國內外高層次專業信息資源的需求等。為此,提出了升級電力科技信息網,建設浙江電力數字圖書館的設想,以進一步拓展本省電力企業數字信息資源的層次和覆蓋面。
數字圖書館是 20 世紀 90 年代伴隨著互聯網發展而產生的,是以信息資源為基礎,以分布式計算機為操作手段,由遠程通信系統連接的、結構有序的集成化信息網絡系統[1]。 數字圖書館憑借其資源豐富、使用便捷的巨大優勢而得到迅猛發展。
電力數字圖書館大多以行業專業數字資源和讀者服務為主要信息模塊。經過多年的建設和積累,電力行業已擁有數量可觀且類型多樣的數字圖書館,并在此平臺上建設了大量特色數據庫。其中影響最大的是集中體現行業資源優勢的國家電網公司數字圖書館,資源涵蓋電力動態、電力期刊、會議文集、技術標準、法律法規、科技報告、考察報告、科技成果、圖書手冊等,數據量達 860 萬頁, 其應用軟件系統、 數字化系統、 信息防擴散系統的設計也十分先進,信息資源分類編碼體系的設計符合電力行業特點。
近年來,為了構建以總部為核心的公共信息資源共享體系,進一步推廣應用國家電網數字資源,提高行業資源利用率,各地網省電力公司紛紛新建、改造數字圖書館系統。據了解,這一輪數字圖書館建設大致有以下幾種模式:
(1)直接引入國家電網數字圖書館方式, 包括軟件平臺和數字資源,僅對主頁面進行修改。頁面風格、欄目設置基本與國家電網數字圖書館一致。
(2)一般已有網絡化科技信息服務基礎, 購置過一些外部數字資源,或自建有特色數據庫。采用的模式為:在引入國家電網數字圖書館的基礎上,利用其檢索管理平臺,對原有信息資源進行統一管理。這種模式構建的數字圖書館延續國家電網數字圖書館風格,功能以提供數字化資源和數據庫檢索為主。
(3)開發自成特色的科技信息服務平臺或知識管理平臺,將國家電網數字資源和其它數字資源進行整合。這種模式構建的數字圖書館,除了提供數字化的資源庫外,還為讀者提供電力行業動態資訊,進行個性化服務,實現知識管理等功能。浙江電力數字圖書館采用的就是該模式。
浙江電力數字圖書館的建設目標是:開發構建一個高穩定性和先進性的電力科技信息資源服務平臺。實時跟蹤、采集國內外電力科技動態資訊;及時發布最新電力科技、標準信息;展示本省電力科技信息服務產品,如信息專遞、安全生產信息等;對用戶提交的各種信息需求進行處理,包括科技查新管理、信息咨詢管理、刊物投稿管理等。
在數字資源方面,保留原有的維普中文期刊、萬方學位論文、萬方學術會議論文、中電海山國際標準、書生數字圖書等公共信息資源,增加同方數字資源(包括期刊、 博/碩士論文、 會議論文等);引入國家電網公司數字圖書館的電力行業信息資源;補充完善浙江省電力試驗研究院自建的特色資源,如技術標準、電網科技成果、國際大電網會議論文、館藏文獻等。建成后的數字圖書館將涵蓋國內外電力動態、全國電力科技成果、 中/外文期刊、博/碩士學位論文、學術會議論文、科技報告、國家電網考察報告、國際大電網會議論文、國內外電力技術標準、 IEC 標準、ISO 標準、 電子圖書手冊、 法律法規等全文數據資源。
在上述海量數字資源基礎上建設的浙江電力數字圖書館,必須具有強大的信息搜索功能,能同時滿足上百并發用戶的檢索和瀏覽。對來自不同服務商的異構數據資源,必須通過數據庫平臺整合技術,將基于不同平臺的數據庫集成到統一的平臺上,為用戶提供異構資源統一檢索,實現跨數據庫查詢、跨數據庫鏈接全文,并在此基礎上開發個性化的延伸服務。
最終構建完成的浙江電力數字圖書館將是兼具海量資源和便捷檢索優勢的行業數據中心與科技信息服務平臺,為全省電力科技進步工作奠定系統化、專業化的信息資源基礎。
3.1 網站架構
浙江電力數字圖書館采用 B/S(Browse/Server, 瀏覽器 /服務器)架構進行數據瀏覽并結合 C/ S(Clent/Server, 客 戶端 /服務器)加工管 理數據 ,能夠同時管理文字、圖片、多媒體等信息,并提供全文檢索服務,支持網頁的動態發布。
系統平臺涵蓋了數據獲取、數據管理、數據共享、數據服務以及網站安全保障體系和運營維護體系等多方面內容,總體構架如圖1所示。

圖1 網站總體架構
(1)系統支撐層
包括支撐各類應用運行的網絡環境、網絡設備和主機設備、各類操作系統、基礎數據庫在內的基礎系統軟件等。
(2)數據層
信息網展現出的數據來源主要包括各類技術標準、期刊全文、會議論文、學位論文,《浙江電力》期刊和安全生產信息,以及一些其他數據。
(3)技術支撐層
技術支撐層主要包括數據抽取、數據交換、數據遷移、數據集成及數據發布等應用服務的技術支 撐 , 支 持 OAI, Web Service 等 協 議 , 以 及 海量非結構化數據管理、結構化數據管理、全文檢索、整合檢索、知識挖掘、日志統計分析、任務調度和流程驅動等核心服務支撐。
(4)表現層
表現層借助數據層和技術支撐層向用戶提供網絡化、集成化和個性化知識服務,具備良好的信息導航、用戶管理和信息服務等功能,同時提供交互性強、表現形式多樣、簡捷方便的用戶訪問界面。
(5)安全體系
安全體系指涉及系統各個層面的完整的安全技術和措施。安全保障體系為整個系統提供鑒別、訪問控制、抗抵賴和數據機密性、完整性、可用性、可控性等安全服務,形成集防護、檢測、響應、恢復于一體的安全防護體系,實現實體安全、應用安全、系統安全、網絡安全、管理安全,以滿足整個系統各層次的安全需求。
(6)標準和規范
網站遵循 J2EE, XML, JDBC, EJB, SNMP,HTTP, TCP/IP, SSL 等業界主流標準。
3.2 異構資源整合解決方案
異構資源整合平臺以 DC元數據標準為基礎,支持元數據倉儲和異構資源實時整合兩種模式,采用以元數據倉儲為主、標準協議整合為輔、頁面分析為補充的技術路線。元數據倉儲可提供高質量、高效率整合檢索服務,同時利用元數據信息挖掘知識服務,是目前最好的一種整合方式。
如圖2所示,資源整合解決方案是從后臺數據層的資源組織配置、數據采集存儲,到中間業務邏輯系統的信息加工、數據集成,再到前臺展示系統的知識服務和信息分析的一個有機整體。
針對浙江電力數字圖書館中的各類異構數字資源,異構統一檢索系統通過以下3個方案滿足需求:

圖2 異構資源整合技術原理圖
(1)應用各種成熟先進的資源整合模式和技術路線,結合資源特點,研發具有廣泛資源適應性的資源整合引擎,提供穩定、高效、統一的檢索服務。
(2)解決文摘資源與全文資源關聯、 本地資源與互聯網資源互補、電子資源統一檢索與軟件業務系統對接等問題,并形成新的資源開放的系統開發服務平臺。
(3)提供包括統一導航、 統一認證、 統一檢索、統一瀏覽、全文下載、鏈接整合、服務集成、開放平臺、個性化服務等功能的服務網站,方便用戶快速查找信息,并提供個性化服務。
3.3 異構平臺部署
異構統一檢索平臺支持多層次分布式異構部署。 將 Web服務器、 應用服務器、 負載均衡服務器、檢索服務器隔離,系統可擴展性強,可根據負載動態增加檢索服務器, 其中,Web服務器性能要求較高, 其他則可采用普通 PC 機。 采用多檢索服務器后,可以在提高檢索響應速度的同時避免出現單臺主機超量訪問。
平 臺 前 后 臺 通 訊采 用 面 向 服 務 的 XML Gateway 集成,可方便部署到多種有安全限制的工作環境中。 異構平臺系統拓撲見圖3。
4.1 專業、 海量的數據資源

圖3 異構平臺系統拓撲圖
建設完成的浙江電力數字圖書館配置了專業、海量的全文數據資源。現已擁有各類中文期刊、 會議論文超過 2254 萬篇, 博/碩士論文近 78萬篇,外文期刊文獻 16萬篇,國內外技術標準36 萬項, 法律法規 40 余萬項, 國內外電力動態信息近 60 萬條, 電子圖書手冊近 12 萬冊,全國電力科技成果信息4萬余項。
4.2 異構資源統一檢索
浙江電力數字圖書館實現了異構資源的統一檢索功能, 目前已整合了來自不同數據商的 26個數據庫。用戶可以通過網站首頁的統一檢索區對期刊、標準、論文、網站新聞等異構資源進行分類快速檢索,實現跨越多種數據庫、多種信息的聯合檢索。 也可從導航條上的“數字圖書館”進入異構資源列表,選擇目標數據庫進行個性化檢索,實現各類數據的一站式檢索,并鏈接全文。系統為用戶提供統一的檢索結果展示界面。
4.3 安全性
浙江省電力數字圖書館的安全性滿足 GB/T 22239-2008《信息系統安全等級保護基本要求》和《國家電網公司“SG186”工程信息系統安全等級保護驗收標準》中對二級應用的有關要求。 系統實現模塊身份驗證,保證用戶的唯一性;利用密碼技術進行會話初始化驗證,限制用戶訪問的最大并發會話數。同時跟蹤和統計用戶的操作及系統功能的執行,避免統計信息被刪除和修改。使用 IP 限制以控制用戶的訪問。 通過后臺代碼控制,提高了網站整體安全級別,實現防止 SQL 注入、跨站腳本漏洞、上傳腳本或可執行文件、用戶繞過權限直接訪問、重要文件泄漏等,保證整個網站系統的安全性。
目前,浙江電力數字圖書館系統已基本建設完成。專業性更強,信息量更大,外購資源更豐富,學科覆蓋面更廣,是兼具海量資源和便捷檢索優勢的行業數據中心與科技信息服務平臺,也將成為全省電力系統職工的知識庫和資源庫。
如何使資源優勢轉化為服務優勢,構建網絡環境下電力科技信息服務的新模式,是數字圖書館未來的發展方向。初步考慮可以從以下方面加強建設:
(1)在信息服務流程管理方面, 在數字圖書館平臺上構建查新自助委托管理系統、《浙江電力》網上投稿系統等;建立網上咨詢臺等在線客服機制,更好地為讀者做好網絡化信息服務。
(2)從個性化服務入手, 向個人網上數字圖書館推進。如通過建立電子書架等方式讓讀者自主收藏感興趣的電子資源; 由讀者定制 “專題”,系統進行多種方式的信息推送服務。
[1]徐魯.對電力企業數字圖書館模式的探討[J].華東電力, 2003(12)∶18-20.
[2]呂 云 , 趙 道 標.福 建 省 電 力 數 字 圖 書 館 的 設 計 與 開 發[J].福建電力與電工,2005(1)∶32-33.
[3]李 圓 ,沈 志 朝.論 電 力 行 業 數 字 圖 書 館 的 特 色 建 設[J].河南電力,2008(2)∶39-42.
[4]郭梅.圖書館的新模式——個人數字圖書館[J].西安電力高等專科學校學報,2009(34)∶156-157.
[5]周 育 忠.電 力 企 業 數 字 圖 書 館 建 設 的 探 討 [J].廣 東 電力,2009,22(9)∶66-68.
(本文編輯:龔 皓)
Construction of Zhejiang Electric Power Digital Library
CAO Lan, CHEN Jian-mei
(Zhejiang Electric Power Test and Research Institute, Hangzhou 310014, China)
The development and application of digital library provides a platform for integrating and sharing information resources in electric power industry.This paper introduces the construction of Zhejiang Electric Power Digital Library and discusses the functionmodule,key technology and development target.
digital library; resources integration; heterogeneous database; unified retrieval
TP392
: A
: 1007-1881(2011)02-0053-04
2010-11-16
曹 嵐(1969-), 女, 浙江嘉興人, 高級工程師,主要從事電力科技信息服務及管理工作。