郝曉春,李躍青,付改俠,劉素梅,張創軍,楊曉哲
(西安近代化學研究所,陜西西安 710065)
科技查新咨詢是一項以文獻檢索為基礎,以文獻分析為手段,從科學技術發展的宏觀角度對所檢索文獻運用綜合分析和對比方法,為評價科研立項、成果鑒定、專利和基金申請等的新穎性和先進性提供文獻依據的一種公眾性信息咨詢服務工作[1-2]。同時,科技查新也是一項比較復雜的信息服務工作,在進行查新的過程中,需要查新人員、查新審核人員、相關專家具備較高的專業化的文獻檢索能力、高度的工作責任感和多學科的專業知識素養,綜合運用文獻分析、對比、歸納等查新手段,為查新委托人提供一個明確并且客觀的文獻事實綜述。其目的是為科技管理部門和評審專家提供立項選擇、鑒定成果的客觀文獻依據,從而提高科研項目立項、科研成果鑒定的準確性和評價結論的可信度。
火炸藥科技查新是伴隨著中國科技查新特別是國防科技查新的產生、發展而發展的。由于歷史的原因,中國的國內外火炸藥技術資料分散地保存在國防各大部委的情報所如兵器、航天、航空、船舶、電子、核能、國防科技情報所等相關情報機構,以及相關部委主管的大學、研究所、重點大企業中[3-4]。
火炸藥科技查新檢索經歷了從手工檢索,翻找紙質資料,到計算機通過專線遠程檢索固定的數字化的文獻數據庫查尋信息,再到計算機通過光盤、光盤塔檢索,直到現在的多種手段檢索過程。國外數字化的文獻數據庫起步較早,從20 世紀六十年代就開始了。其代表就是始建于1963 年的美國的DIALOG 數據庫系統。國內的聯機檢索系統開始于20世紀80 年代末,90 年代初開始提供文獻信息檢索服務。其代表如:由中國科技情報研究所研發的萬方數據,由國防科技情報所研發的國防科技情報檢索系統。目前通過國防科技情報檢索系統就可以檢索兵器、航天、航空、船舶、電子、核能、國防科技情報所等單位收藏的國防科技信息。
火炸藥技術是國防關鍵的技術之一,是先進的高技術武器的核心技術,其發展水平直接制約著高技術武器的發展。因此世界各國特別是發達國家均對火炸藥技術的發展給予高度重視,投入了巨大的人力、物力。
目前網絡上以及在大型的綜合數據庫中查找信息主要還是使用主題詞/關鍵詞進行查找。另外,火炸藥技術的應用專業性很強,但火炸藥技術涉及面又很廣,這個特殊性決定了火炸藥技術的最新信息資料的來源分散,分布很廣。網絡檢索往往得到的信息量非常大,在海量的信息中如何快速找到所需的內容,目前仍然需要一定的經驗和技術。即在目前的技術條件下,火炸藥技術查新仍然面臨著查找技術信息不準、不易分辨的問題。
在科技查新的實踐中,出現過個別的查新委托人員為了某種目的,在與查新人員共同分析相關文獻與查新課題的異同點時,利用查新人員專業知識、專業外語不強的弱點刻意回避一些文獻,誘導查新人員做出對其有利的查新結論[5]。
為了有針對性的解決上述問題,筆者們借助先進的計算機技術、網絡技術、數據庫技術,結合對規范的科技查新流程數字化的研究,特別是結合火炸藥科技查新的專業特點,構建了火炸藥科技查新系統,將現有規范的查新工作集成在計算機平臺系統中[6-7],將火炸藥科技查新過程以工作流的形式呈現、操作和管理。結合先進的數據庫技術,利用權威的《兵器科學技術敘詞表》(兵器工業出版社1995 年版)構建了火炸藥主題詞數據庫,以幫助查新人員在檢索資料時選取權威、準確、專業的關鍵詞,提高檢索文獻的正確性。
同時,筆者們將相似度算法引入查新流程中,利用計算機強大的運算能力,對檢出的文獻進行相似度排序,提高查新人員、查新委托人員對相關文獻的分辨、鑒別能力,提高查新的正確性和準確性。
目前的科技查新工作已經形成了規范的流程,如圖1 所示。

圖1 現有科學查新流程
筆者們在現有的查新流程中集成和應用智能處理技術,將火炸藥技術主題詞數據庫和文獻相似度排序算法集成到查新系統中。從技術手段入手,提高查新中文獻檢索的準確性,同時提高查新人員對相關文獻相似度的判斷能力,確保科技查新的準確性和客觀性。提出的新查新流程如圖2 所示。

圖2 火炸藥科技查新流程
對比新舊查新流程,可以看出新流程增加了智能處理環節,依托新增的火炸藥主題詞庫和集成現有的相似度排序算法,對查新主題詞的選擇、相關文獻的判斷,提供技術手段的智能化支撐,從技術上對查新檢索的準確性、相關文獻選擇的準確性提供保障。
主題詞分類數據庫是為解決檢索的準確和全面而設,所以其詞源的選擇就必須以檢索文獻的準確和全面來考慮。為選擇合適的主題詞源,筆者們考察了《現代科學技術詞典》(上海科學技術出版社1980 版)、《科學技術主題詞典》(北京文獻服務處1980 版)、《國防科學技術敘詞表》(軍事科學出版社1992 版)和《兵器科學技術敘詞表》(兵器工業出版社1995 年版)。就其權威性和準確性來講,前三個各有所長,它們都是老一輩情報人多年研究、編輯的成果,其權威性和準確性不容置疑。但由于其編輯時間較早,涵蓋的學科較多,所以其火炸藥詞匯的同義詞近義詞等明顯比《兵器科學技術敘詞表》的少,這不利于查全。另外《兵器科學技術敘詞表》在編輯時參考了上述三個詞典,吸收了它們的長處。在考慮了查準和查全兩方面的因素后,確定采用權威的《兵器科學技術敘詞表》(兵器工業出版社1995 年版)中的火炸藥技術相關的詞構建了火炸藥主題詞數據庫,以幫助查新人員在檢索資料時選取權威、準確、專業的關鍵詞,提高檢索文獻的正確性和全面性。在設計主題詞表時,不僅考慮到主題詞的中英文表達及其同義詞的中英文表達,還根據火炸藥中化學材料名稱,將美國化學文摘社給每個成分確定的化合物編的化學物質登記號引入主題詞表中。考慮到在查新檢索時,經常會檢索專利信息,所以在主題詞表中,還引入了國際專利分類號。
將相似度排序算法引入查新文獻分析環節,對題目、關鍵詞、文摘等字段設置了各字段的權重。題目字段的權重值最大,文摘字段次之。按照檢索詞在各個字段出現的頻率,乘以各字段的權重值,再將相應的計算分值相加,按照所得分值的大小,對檢索到的文獻加以排序。這里表示的相似度是在所檢索的文獻中,與已檢索策略表示的檢索主題的相似程度。在以后的實際運行中還可以對權重值進行調整,還可以根據以后技術發展的情況增加新的運算字段,以進一步提高系統的相似度排序的相關性、準確性。這樣就能確保系統的技術與時俱進。
該功能主要用于對檢索文獻的分析,幫助檢索和課題委托單位的研究人員客觀的確定相關文獻,減少人為因素對相關文獻分析的影響,提高查新對比的客觀性和準確性。
根據上述思路,研究提出了模塊化的火炸藥技術科技查新系統。從查新人員的角度出發,研究設計了系統的各功能模塊的關系,如圖3 所示。

圖3 系統各功能模塊關系
火炸藥科技查新系統是采用瀏覽器/服務器(B/S)的形式,運用純Java 語言編寫的,可跨系統運行的平臺。它在現有成熟的操作系統環境中,采用先進的工具軟件構建的。
系統的各部分均采用模塊化設計。其主要部分“查新工作”所包含模塊及其各模塊的關系如圖4 所示。

圖4 查新系統構成模塊關系示意圖
火炸藥查新系統規范查新管理,從根本上實現查新工作流程及查新管理工作的自動化和科學化,達到了提高查新工作效率的目的。且其利用權威、規范的主題詞數據庫對檢索詞進行補充和規范,利用計算機的運算能力對檢索的相關文獻進行相似度排序,提高了查新人員對相關文獻的判斷力。