[摘 要]本文總結了戰略情報研究對數據資源信息化建設的實際需求以及信息化建設為戰略情報研究帶來的效用,同時分析目前情報調研數據資源的現狀,針對其中資源不易共享的問題,提出一套通過信息化建設來改進、改善該問題的設想。通過構建數據資源的原型系統,對“調研得到的國外創新型國家各項創新指標數據”進行加工、存儲、檢索與利用,以這個范例來探索設想的可行性,嘗試通過該系統實現情報研究團體內部戰略情報研究數據資源統一的存儲、管理與共享。在該系統的基礎上根據實際應用的需要,可以擴充統計分析、授權管理等功能,還可以集成第三方數據分析軟件,并轉換成B/S體系結構,最終形成情報研究成果呈繳與共享、數據管理與分析的平臺。
[關鍵詞]情報調研;數據資源;信息化;共享
[中圖分類號]G352 [文獻標識碼]C [文章編號]1008-0821(2010)02-0109-04
Data Resource of Information Study for Informatization ContructionWang Jun Han Tao
(National Science Library,Chinese Academy of Sciences,Beijing 100190,China)
[Abstract]This article was based on data resources of the information investigation and study unification processing,the memory,construct the storehouse,the retrieval and the use,took each innovation target data of overseas innovation country as the model,through the construction of data resources prototype system,attempting to establish the memory,the management of resources and the sharing mechanism,further to construct the top level application mechanism to lay the foundation.
[Keywords]information investigation and study;data resource;informatization;sharing
我國的信息化建設已有20余年歷史,得到了政府、科研機構和產業部門的廣泛響應。從全國到地方,從高校到圖書館,從稅務征繳到國土資源管理,各地區、各部門、各行業都紛紛提出信息化、數字化計劃,取得了巨大的進步[1]。在信息化建設滲透在各行各業的大環境下,本文站在戰略情報研究的角度,總結戰略情報研究對信息化建設的實際需求以及信息化建設為戰略情報研究帶來的效用,在此基礎上以“國外創新型國家各項創新指標數據”的調研項目為范例,構建情報研究調研數據的管理信息系統,嘗試通過該系統實現戰略情報研究數據資源的存儲、管理與共享。
1 情報研究中問題以及信息化的作用
情報研究部門經過多年的建設與實踐,形成了大量的研究成果,其中尤其是各種調研數據數量巨大,種類繁多,而且隨著部門業務量的增加,數據資源也以驚人的速度與日俱增。然而,這些通過調研、整理、匯編而得到數據資源通常是以表格的形式分散在各種各樣的文件(如Word文檔、PDF文檔、Excel文檔等)中,并由課題組中各研究人員獨自保管。這種狀況使得課題組中的數據管理和共享面臨了一定的困難,也在一定程度上影響著情報研究的交流范圍,影響了情報研究的工作效率。由于情報研究人員各自具有一套數據格式,情報研究人員通過調研各自掌握的數據資源異構,導致這些數據無法積累形成一個不斷增加、格式統一的數據資源,因此這些資源也無法在今后的工作中被重用,當然就更談不上對這些數據資源進行深度的統計分析。
隨著戰略情報研究中情報調研廣度和深度的提升以及情報研究隊伍的日益壯大,將情報研究過程中沉淀積累下的研究成果進行整合,實現有效的管理與共享,這樣的需求越來越強烈,而這正可以借助信息化技術得以解決。結合目前的現狀來說,情報研究中數據資源信息化有以下幾點作用:
1.1 研究報告數據(指標數據)集中存儲在數據庫中實現統一管理規劃好數據的存儲形式后,把各類研究數據分門別類地集中入庫,一個集中管理的數據庫既是資產也是信息化的基礎,同時通過備份來保護這些數據是容易完成的。而且隨著數據的逐年增長,數據庫的優異管理能力也會更加凸現。
1.2 便捷、安全地調閱各類報告數據,方便共享
在數據庫上構筑基于DBMS的上層應用,借助分布式計算技術并發完成對各類數據進行加工、索引與授權控制,從而實現各類數據的快速檢索和權限范圍內的共享。
1.3 隨時統計分析,生成相關圖表
查詢數據庫中歷年各類數據,方便地對某些指標進行統計分析,生成報告。也可在最終報告中整合進各類圖表從而更直觀地表達這些結果,以輔助進行決策。
1.4 與第三方數據分析軟件的適配、集成
第三方數據分析軟件(如德溫特分析家(TDA),我館與北理工共建的戰略情報分析工具)均有自己要求的特定數據格式。為系統開發適配接口,直接將庫中需要分析的數據導出成這些第三方分析軟件所需的格式,并使用這些軟件進行更深入的分析。
信息化的內涵圍繞著數據統一存儲、共享而展開,這也是一個制定數據結構、數據格式的過程,起到了對調研專題數據修訂、完善、標準化的作用。
期情報資料的信息化建設實踐Feb.,2010Vol.30 No.22 信息化實施步驟與系統構建[2-3]
2.1 實施步驟
2.1.1 數據庫規劃
選擇一個功能強大,易于使用,對應用開發有較好支持且成本低廉的數據庫管理系統(DBMS)是實現信息化的第一步。接著規劃數據存儲空間,以容納未來若干年的數據。并由于數據庫及數據的重要性、安全性,那么就需要專人(DBA)對其管理與維護、定期備份。
2.1.2 應用開發
只有開發出基于數據庫的相關應用功能,才能方便操作者查詢自己關心的數據、報告并將日常調研數據入庫。此時需要開展應用系統需求調研,使系統的開發與未來的使用者之間進行互動,既完善應用系統功能,又利于日后的系統推廣。
2.1.3 系統運行維護
有了基于數據庫的應用系統,需要廣泛聽取使用者意見,以便改進系統使之更貼近于用戶操作習慣,更適合于當前工作模式,從而切實發揮信息化的作用,滿足對數據、經驗進行管理、積累、沉淀、共享的初衷。
2.2 系統原型定義與構建
2.2.1 系統原型定義
系統原型是向正式系統過渡的中間產物,定義一個系統原型有助于大家理解未來系統,并可據此展開討論,為以后系統的迭代開發提供參考。信息管理系統應具備的基本功能包含數據類別、指標定義、數據錄入、檢索、瀏覽打印報表數據,匯總數據等等:
①調研前期,調研人員應可使用系統自由地制定信息類別與衡量指標,形成調研數據規范。
②調研期間,調研人員應可根據已經制定的數據規范,使用系統進行已錄數據查詢和數據樣本錄入。這些數據均應集中存放在一個統一數據庫中。
③調研期間,系統應允許調研人員修改已有指標和創建新的類別與指標,以更好地完善數據規范。
④系統應可以對已經入庫的數據進行綜合條件的檢索與統計,并出具可能的圖表,提供給調研人員作為參考。
數據集中存放的意義就在于能夠管理、積累、分析、與共享,這也是系統應該著重實現,充分挖掘的功能。
2.2.2 系統原型的初步構建[4-6]
基于以上系統原型定義,嘗試以“調研國外創新型國家各項創新指標數據”為范例,進行系統的初步構建,開發出一套數據管理原型系統——“科技信息數據管理系統”。以此嘗試盡可能地佐證數據資源信息化建設的可行性。該系統目前采用C/S模式,基于Java開發;允許多用戶同時訪問并將數據統一存儲在指定的SQL Server服務器上;只需要在本地機器上安裝JRE作為運行環境即可。該原型系統主要具有以下功能。
①類別指標管理,即調研數據規范制定,輔助操作者完成數據規范的制定,并約束此后的調研數據錄入。如圖1所示。
②數據綜合查詢,根據時段、國家/地區、數據類別與指標進行數據查詢、數據導出、圖表分析。如圖2所示。圖1 類別指標管理 圖2 數據綜合查詢 ③科技數據處理,對調研信息的采編,進行數據的查詢與錄入。如圖3所示。
④信息引文管理,對調用信息數據的來源進行分類別、分指標地管理。如圖4所示。
通過上述介紹,可以看到情報研究人員使用類別指標管理功能輔助制定課題調研指標,調研過程中,使用科技數據處理功能錄入數據樣本,使用引文管理功能保存引文信息。當然,也可能隨著調研需求的明確,會對類別和指標進行反復調整,最終會得出一套課題的規范數據標準(元數據)。
在這個工作流程中,數據規范(類別指標)被嚴格定義,數據按規范被存儲,并可被檢索分析,操作員可以查詢到其他使用者建立的規范與數據。這初步起到了信息化中數據存儲、信息共享、有效管理的目的,并為以后可能的數據挖掘奠定了基礎。圖3 科技數據處理 圖4 信息引文管理 3 系統功能迭代與展望
通過該系統可以基本實現戰略情報研究中數據資源的統一管理和有效共享。在該原型系統的基礎上,根據實際應用的需要,可擴充統計分析及授權管理(人員管理、角色管理及系統授權)等功能,還可以將第三方數據分析軟件整合其中。最終建設成B/S結構,形成情報部門成果呈繳與共享、數據管理與分析的平臺。
參考文獻
[1]李景文.國土資源信息化體系結構及相關技術[J].桂林工學院學報,2005,25(3):313-316.
[2]王珊.數據倉庫技術與聯機分析處理[M].北京:科學出版社,1998.
[3]王珊,劉怡,晉良穎,等.數據組織與管理[M].北京:經濟科學出版社,1996.
[4]李曉,張曉輝,李祥勝.SQL Server 2000管理及應用系統開發[M].北京:人民郵電出版社,2003.
[5]徐國智,汪孝宜,等.SQL Server數據庫開發實例精粹[M].北京:電子工業出版社,2006.
[6]Cay S.Horstmann,Gary Cornell.Java 2核心技術(第6版)[M].程峰,黃若波,章恒羽中,譯.北京:機械工業出版社.