張銳
摘 要:筆者研發的科技查新輔助查新工具是針對中國知網、萬方、維普、中國知識產權局專利檢索與服務系統設計的,通過編程實現基于EXCEL平臺的查新輔助工具,該工具能夠讀取各數據庫不同格式的數據、對數據進行去重、并在去重時抽取不同數據庫的內容融合成最完整的數據進行保留,最后按照統一要求的查新格式導出。該工具相較于時下流行的輔助查新軟件,其輸出內容更完全,同時還具有方便快捷、無需安裝、操作簡單易學等特點。
關鍵詞:查新 去重 EXCEL 數據融合
中圖分類號:TP311 文獻標識碼:A 文章編號:1672-3791(2014)11(c)-0005-03
Based on Data Fusion Technology for Development of Novelty Search Auxiliary Tool
ZhangRui
(Library of Fujian Agriculture and Forestry University)
Abstract:The novelty search tools is aimed at deleting duplicate in the serch results of CNKI, WanFang and VIP database, The system based on EXCEL platform, and can read the database data in different formats, and delete duplicate, finally export the result according to the novelty format. This method is more convenient and quick compared with the popular novelty search software, and don't need to install, and easy operation etc., also can make up for the inadequacy of existing software at the same time.
Keywords:Novelty Search;Delete Duplicate;EXCEL Data fusion
隨著文獻數據的不斷增長,科技查新工作變得越加復雜和重要。計算機輔助查新系統不僅可以幫助查新員節約大量重復工作的時間,還可以修正查新員在大工作量下容易犯的錯誤。
目前,國內的查新輔助軟件主要集中在在線委托與查新檔案的管理方面[1-13],檢索結果去重和統一查新格式導出方面的軟件較少,僅見哈爾濱工業大學圖書館應用JAVA語言開發了《圖書館中文查新智能去重系統》[14]。雖然許多收費軟件如NoteExpress和NoteFirst均有查重去重功能,但購買費用較高,且在各大數據庫所提供的基于NoteExpress和NoteFirst格式的數據字段不全的情況下,無法按照查新員需求輸出符合規范的查新結果。一些國外收費軟件如EndNote由于使用習慣不同,也不太符合國內查新員的需求。另一方面,國內的文獻數據庫檢索平臺的檢索結果格式不統一,同一檢索式得到的結果存在許多重復,若要人工一一篩選去重、整理格式,則費時費力,且容易出錯?!?br>