張銳
摘 要:筆者研發(fā)的科技查新輔助查新工具是針對中國知網(wǎng)、萬方、維普、中國知識產(chǎn)權(quán)局專利檢索與服務(wù)系統(tǒng)設(shè)計的,通過編程實(shí)現(xiàn)基于EXCEL平臺的查新輔助工具,該工具能夠讀取各數(shù)據(jù)庫不同格式的數(shù)據(jù)、對數(shù)據(jù)進(jìn)行去重、并在去重時抽取不同數(shù)據(jù)庫的內(nèi)容融合成最完整的數(shù)據(jù)進(jìn)行保留,最后按照統(tǒng)一要求的查新格式導(dǎo)出。該工具相較于時下流行的輔助查新軟件,其輸出內(nèi)容更完全,同時還具有方便快捷、無需安裝、操作簡單易學(xué)等特點(diǎn)。
關(guān)鍵詞:查新 去重 EXCEL 數(shù)據(jù)融合
中圖分類號:TP311 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2014)11(c)-0005-03
Based on Data Fusion Technology for Development of Novelty Search Auxiliary Tool
ZhangRui
(Library of Fujian Agriculture and Forestry University)
Abstract:The novelty search tools is aimed at deleting duplicate in the serch results of CNKI, WanFang and VIP database, The system based on EXCEL platform, and can read the database data in different formats, and delete duplicate, finally export the result according to the novelty format. This method is more convenient and quick compared with the popular novelty search software, and don't need to install, and easy operation etc., also can make up for the inadequacy of existing software at the same time.
Keywords:Novelty Search;Delete Duplicate;EXCEL Data fusion
隨著文獻(xiàn)數(shù)據(jù)的不斷增長,科技查新工作變得越加復(fù)雜和重要。計算機(jī)輔助查新系統(tǒng)不僅可以幫助查新員節(jié)約大量重復(fù)工作的時間,還可以修正查新員在大工作量下容易犯的錯誤。
目前,國內(nèi)的查新輔助軟件主要集中在在線委托與查新檔案的管理方面[1-13],檢索結(jié)果去重和統(tǒng)一查新格式導(dǎo)出方面的軟件較少,僅見哈爾濱工業(yè)大學(xué)圖書館應(yīng)用JAVA語言開發(fā)了《圖書館中文查新智能去重系統(tǒng)》[14]。雖然許多收費(fèi)軟件如NoteExpress和NoteFirst均有查重去重功能,但購買費(fèi)用較高,且在各大數(shù)據(jù)庫所提供的基于NoteExpress和NoteFirst格式的數(shù)據(jù)字段不全的情況下,無法按照查新員需求輸出符合規(guī)范的查新結(jié)果。一些國外收費(fèi)軟件如EndNote由于使用習(xí)慣不同,也不太符合國內(nèi)查新員的需求。另一方面,國內(nèi)的文獻(xiàn)數(shù)據(jù)庫檢索平臺的檢索結(jié)果格式不統(tǒng)一,同一檢索式得到的結(jié)果存在許多重復(fù),若要人工一一篩選去重、整理格式,則費(fèi)時費(fèi)力,且容易出錯。……