連麗艷 李楊 張靜 遼寧省科學技術情報研究所查新檢索科室,沈陽110838
基于神經網絡的查新報告質量評價方法
連麗艷 李楊 張靜 遼寧省科學技術情報研究所查新檢索科室,沈陽110838
針對科技查新報告質量的評價易受多種因素影響的情況,提出了一種基于神經網絡的查新報告質量評價方法,避免了人為確定權重,減少了評價過程中的隨機性和評價人員主觀上的不確定性,使評價結果更公平、更有效、更客觀。
神經網絡;查新報告;質量評價
科技查新是在科技文獻檢索和科技咨詢基礎上發展起來的一項新型的科技信息服務業務。科技查新是指科技查新機構根據查新委托人提供的需求查證其新穎性的科學技術內容,利用各種文獻檢索手段和文獻分析方法,按照科技查新規范操作,從文獻的角度對所查證的科學技術內容作出新穎性判斷,從而為科研課題的立項、科研成果的評判等提供科學依據,為國民經濟的發展提供快速、全面的文獻信息服[1]。查新報告是查新工作的主要體現形式,是查新質量的重要反應[2],是查新機構以書面形式就查新事項及結論向查新委托人所做的正式陳述[3]。查新報告是否科學、客觀、公正、嚴密直接關聯著情報查新工作的質量、科研立題和成果批準問題,事關重大,必須嚴肅認真對待。利用科學方法,現代化技術手段對查新報告質量給出客觀真實的論證和評價,是查新機構生存和發展的重要保證。
查新報告質量評估現在尚無統一標準和模式,這是一項“軟指標”,較難用數字表示,報告質量的優劣又與諸多因素有關,而且各因素影響的程度也不同,評價結果難以用恰當的數學解析表達式來表示,屬于復雜的非線性分類問題,神經網絡以其能夠充分逼近任意復雜的非線性關系,能夠學習與適應嚴重不確定性系統的動態特性;有高度的魯棒性和容錯能力開辟了新的評價途徑,本文將BP網絡引入查新報告評價體系中,既克服了人為主觀因素對評價結果的直接影響,又建立了全面合理的綜合評價指標體系。
BP (Back Propagation)神經網絡,即誤差反向傳播算法的學習過程,由信息的正向傳播和誤差的反向傳播兩個過程組成。輸入層各神經元負責接收來自外界的輸入信息,并傳遞給中間層各神經元,中間層是內部信息處理層,負責信息變換,根據信息變化能力的需求,中間層可以設計為單隱層或者多隱層結構,最后一個隱層傳遞到輸出層各神經元的信息,經進一步處理后,完成一次學習的正向傳播處理過程,由輸出層向外界輸出信息處理結果。當實際輸出與期望輸出不符時,進入誤差的反向傳播階段。誤差通過輸出層,按誤差梯度下降的方式修正各層權值,向隱層、輸入層逐層反傳。周而復始的信息正向傳播和誤差反向傳播過程,是各層權值不斷調整的過程,也是神經網絡學習訓練的過程,此過程一直進行到網絡輸出的誤差減少到可以接受的程度,或者預先設定的學習次數為止。BP包括輸入層(input)、隱含層和輸出層。其結構如圖1所示:

圖1 BP網絡模型
(1)輸入層神經元的個數的確定。影響查新質量的主要有7項指標,因此取輸入層神經員數n=7個.
(2)輸出層神經元個數的確定。評價結果作為網絡的輸出,因此取輸出層個數m=1.
(3)網絡隱含層數的確定??紤]到三層BP網絡已經具有逼近任意非線性函數的能力,故本文選用一個3層的BP的網絡開始進行訓練。
(4)隱含層神經元個數的確定,一般來說,隱層的神經元越多,結果越精確,但是隱層的神經元過多會大大的加大訓練時間,同時隱層的神經元的增加會造成網絡的容錯能力下降,經不同的試算,本文中隱含層取5個神經元比較好。
(5)傳輸函數的確定。本文采用了s形函數來訓練

(6)網絡精度設定為0.001。
查新報告是查新工作質量的具體反映,是整個查新工作的綜述。本文將文獻檢索資源、查新人員的溝通能力、關鍵詞的確定、檢索策略的制定、相關文獻的篩選、對比分析描述、查新結論的表述總結能力等因素作為輸入指標,設計了基于神經網絡的查新報告質量評價方法。
首先以文獻檢索資源、查新人員的溝通能力、關鍵詞的確定、檢索策略的制定、相關文獻的篩選、對比分析描述、查新結論的表述總結能力等7個指標作為網絡的輸入因子,以報告質量作為輸出因子,選取一組數據作為訓練樣本,得到系統的神經網絡權值,再采用一組測試樣本數據對BP神經網絡模型的精度和泛化能力進行檢驗(本文章的訓練樣本和檢驗樣本為查新審核員根據以上指標進行打分并通過歸一化來獲得),BP網絡輸出的評價值和實際評價值之間的誤差見表1,該網絡模型的輸出值與實際輸出值之間的誤差很小,能準確地根據各評價指標來描述報告質量的好壞。

表1 BP網絡輸出的評價值和實際評價值之間的誤差
仿真結果表明將神經網絡應用于查新報告質量的測評中,減少了評價過程中的隨機性和評價人員主觀上的不確定性,提高了評價的可靠性,使評價結果更有效、更客觀,使查新報告的考評更加科學合理化。
[1]李紅梅.科技查新對技術創新的促進作用[J].現代情報.2009.29(8).188-190
[2]曾召.科技查新報告質量控制探析
[J].圖書館論壇.2009(2).109-111
[3]謝新洲,滕躍.科技查新手冊[M]北京:科學技術文獻出版社.2004.7
[4]馬景娣, 繆家鼎.關于查新報告質量評定標準的探討[J].情報科學 2005.23(11).1681-1684
[5]何玉彬,李新忠.神經網絡控制技術及其應用[M]. 北京:科學出版社. 2003
A Quality Evaluation Method on Novelty Retrieval Reports Based on Neural Network
Lian Liyan Li Yang Zhang Jing Liaoning Institute of Science and Technology Information Shenyang 110838
In this paper, according to quality evaluation on Science and technology novelty retrieval is effected with a number of factors , a quality evaluation method on the reports based on neural network is proposed to avoid the human factor and reduce randomness of the evaluation process.
Neural Network; Novelty Retrieval Reports; Quality Evaluation
G35
A
10.3969/j.issn.1001-8972.2011.07.112
連麗艷 女 1978年4月16日 碩士 館員遼寧省科學技術情報研究所查新檢索中心。