999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于前向?qū)ο騻鞑ド窠?jīng)網(wǎng)絡(luò)的信息檢索技術(shù)研究

2012-06-09 10:25:42余素雅
電子設(shè)計工程 2012年19期
關(guān)鍵詞:信息檢索信息

余素雅

(空軍航空儀器設(shè)備計量總站 北京 100070)

信息檢索(Information Retrieval)廣義的定義是指信息按一定的方式組織起來,并根據(jù)信息用戶的需要找出有關(guān)的信息的過程和技術(shù)。 狹義的信息檢索就是信息檢索過程的后半部分,即從信息集合中找出所需要的信息的過程,即信息查尋(Information Search或Information Seek)。信息檢索是獲取知識的捷徑,是科學(xué)研究的向?qū)В墙K身教育的基礎(chǔ)。信息檢索的全過程包含兩個方面,一是信息標(biāo)引和存儲過程,二是信息的需求分析和檢索過程。人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)是一種模仿動物神經(jīng)網(wǎng)絡(luò)行為特征,進(jìn)行分布式并行信息處理的算法數(shù)學(xué)模型。這種網(wǎng)絡(luò)依靠系統(tǒng)的復(fù)雜程度,通過調(diào)整內(nèi)部大量節(jié)點之間相互連接的關(guān)系,從而達(dá)到處理信息的目的。人工神經(jīng)網(wǎng)絡(luò)是通過直觀性思維方式模擬人的思維,是一種非線性動力學(xué)系統(tǒng),將分布式存儲的信息綜合起來,在忽然間產(chǎn)生想法或解決問題的辦法。這種思維方式的根本之點在于信息是通過神經(jīng)元上的興奮模式分布儲在網(wǎng)絡(luò)上,并且通過神經(jīng)元之間同時相互作用的動態(tài)過程完成信息處理。將人工神經(jīng)網(wǎng)絡(luò)應(yīng)用于信息檢索技術(shù)中,可以建立一種更高效的信息檢索模式。

1 信息檢索技術(shù)概述

1.1 信息檢索的基本概念

1.1.1 檢索的意義

信息具有共享性,信息資源共享 (Information Resource Sharing)是當(dāng)今社會的一個熱點問題。為了分享人類共同的知識財富、研究成果,人們必須通過一種科學(xué)的方法從取之不盡的信息源中去識別和獲取所需要的那部分信息,即檢索(Searching)。信息的檢索、利用和創(chuàng)造是一個循環(huán)和增值的過程,通過工具(數(shù)據(jù)庫)檢索獲得信息,經(jīng)過處理篩選出需要的部分,在利用信息的過程中又創(chuàng)出新的信息,這些信息經(jīng)過核準(zhǔn)后又被標(biāo)引、組織進(jìn)檢索工具(數(shù)據(jù)庫),再提供人們使用,信息在這個循環(huán)的處理過程中不斷得到擴(kuò)充。

1.1.2 信息檢索的基本原理

信息檢索的基本原理是指用戶信息需求與文獻(xiàn)信息集合的比較和選擇,是兩者匹配(Match)的過程,它既是用戶的信息需求,也是組織有序的文獻(xiàn)信息集合。信息檢索從用戶特定的信息需求出發(fā),對特定的信息集合采用一定的方法、技術(shù)手段,根據(jù)一定的線索與規(guī)則從中尋找出相關(guān)的信息。信息檢索原理如圖1所示。

圖1 信息檢索原理Fig.1 Principle of information retrieval

1.1.3 信息檢索的對象

1)文獻(xiàn)檢索(Document Retrieval):以文獻(xiàn)(包括題錄、文摘和全文)為檢索對象的檢索,分為全文檢索和書目檢索。

2)數(shù)據(jù)檢索(Data Retrieval):以數(shù)值或數(shù)據(jù)(包括數(shù)據(jù)、圖表、公式等)為對象的檢索。

3)事實檢索 (Fact Retrieval):以某一客觀事實為檢索對象,查找某一事物發(fā)生的時間、地點及過程的檢索。

1.2 信息檢索方式

信息檢索從技術(shù)上分為手工檢索 (Manual Retrieval)(手檢)和計算機檢索(Computer-based Retrieval)(機檢)兩大類。

1.2.1 手工檢索

手工檢索使用的多為印刷型或書本型檢索(Paper-based Retrieval)工具,早期有檢索卡片,現(xiàn)在使用最多的是檢索刊,它定期地將最新收集到的信息、文獻(xiàn)加以匯總、組織和報道。手工檢索的技術(shù)要求不高,以人的勞動為本,由人來翻閱、比較、選擇、完成匹配。手工檢索工具能提供的檢索點十分有限,檢索結(jié)果往往不盡人意。

1.2.2 計算機檢索

計算機檢索是通過數(shù)據(jù)庫系統(tǒng)實現(xiàn)的,其檢索系統(tǒng)包括計算機主機設(shè)備、外部存貯器、輸入輸出設(shè)備、終端設(shè)備、通信設(shè)備等硬件設(shè)施,還需要控制、提供檢索的軟件系統(tǒng),包括通信軟件、操作系統(tǒng)、應(yīng)用程序等,以實現(xiàn)對數(shù)據(jù)庫的信息存取。計算機檢索過程是在人與機器的合作、協(xié)同下完成的,它們經(jīng)常用實時(Real Time)、交互(Interactive)的方式從計算機存貯的大量數(shù)據(jù)中自動分揀出用戶所需要的信息。計算、比較、選擇的匹配任務(wù)由機器執(zhí)行,而人則是整個檢索方案的設(shè)計者和操縱者。計算機檢索的性能明顯優(yōu)于手工檢索,主要表現(xiàn)在檢索的信息量大、數(shù)據(jù)更新快、檢索功能強、檢索結(jié)果輸出的多樣性等方面。

1.3 信息檢索的4個要素

1.3.1 信息意識

信息意識是信息檢索的前提,它是指人們利用信息系統(tǒng)獲取所需信息的內(nèi)在動因,具體表現(xiàn)為對信息的敏感性、選擇能力和消化吸收能力。信息意識含有信息認(rèn)知、信息情感和信息行為傾向這3個層面。

1.3.2 信息源

信息源,及信息的來源,它是信息檢索的基礎(chǔ),其構(gòu)成按文獻(xiàn)載體可分為印刷型、縮微型、機讀型、聲像型,按文獻(xiàn)內(nèi)容和加工程度可分為一次信息、二次信息、三次信息,按出版形式可分為圖書、報刊、研究報告、會議信息、專利信 息、統(tǒng)計數(shù)據(jù)、政府出版物、檔案、學(xué)位論文、標(biāo)準(zhǔn)信息。

1.3.3 信息獲取能力

信息獲取能力是信息檢索的核心,它用來了解各種信息來源、掌握檢索語言、熟練使用檢索工具、以及對檢索效果進(jìn)行判斷和評價。判斷檢索效果的兩個指標(biāo),即查全率=被檢出相關(guān)信息量/相關(guān)信息總量(%)、查準(zhǔn)率=被檢出相關(guān)信息量/被檢出信息總量(%)。

1.3.4 信息利用

信息利用是信息檢索的關(guān)鍵,社會進(jìn)步的過程是一個知識不斷的“生產(chǎn)-流通-再生產(chǎn)”的過程。為了全面、有效地利用現(xiàn)有知識和信息,在學(xué)習(xí)、科學(xué)研究和生活過程中,信息檢索的時間比例逐漸增高。獲取學(xué)術(shù)信息的最終目的是通過對所得信息的整理、分析、歸納和總結(jié),根據(jù)自己學(xué)習(xí)、研究過程中的思考和思路,將各種信息進(jìn)行重組,創(chuàng)造出新的知識和信息,從而達(dá)到信息激活和增值的目的。

1.4 常用信息檢索技術(shù)

1.4.1 布爾邏輯檢索

利用布爾邏輯算符進(jìn)行檢索詞或代碼的邏輯組配,是現(xiàn)代信息檢索系統(tǒng)中最常用的一種技術(shù)。常用的布爾邏輯算符有 3 種,邏輯或“OR”、邏輯與“AND”、邏輯非“NOT”。

1.4.2 截詞檢索

截詞檢索是計算機檢索系統(tǒng)中應(yīng)用非常普遍的一種技術(shù)。由于西文的構(gòu)詞特性,在檢索中經(jīng)常會遇到名詞的單復(fù)數(shù)形式不一致;同一個意思的詞,英美拼法不一致;詞干加上不同性質(zhì)的前綴和后綴就可以派生出許多意義相近的詞等等。這是就要用到截詞檢索。

1.4.3 位置檢索

位置檢索也叫全文檢索、鄰近檢索。所謂全文檢索,就是利用記錄中的自然語言進(jìn)行檢索,詞與詞之間的邏輯關(guān)系用位置算符組配,對檢索詞之間的相對位置進(jìn)行限制。這是一種可以不依賴主題詞表而直接使用自由詞進(jìn)行檢索的技術(shù)方法。

1.4.4 字段限定檢索

字段限定檢索是指限定檢索詞在數(shù)據(jù)庫記錄中的一個或幾個字段范圍內(nèi)查找的一種檢索方法。在檢索系統(tǒng)中,數(shù)據(jù)庫設(shè)置的可供檢索的字段通常有兩種:表達(dá)文獻(xiàn)主題內(nèi)容特征的基本字段和表達(dá)文獻(xiàn)外部特征的輔助字段。

1.4.5 加權(quán)檢索

加權(quán)檢索是某些檢索系統(tǒng)中提供的一種定量檢索技術(shù)。加權(quán)檢索同布爾檢索、截詞檢索等一樣,也是文獻(xiàn)檢索的一個基本檢索手段,但與它們不同的是,加權(quán)檢索的側(cè)重點不在于判定檢索詞或字符串是不是在數(shù)據(jù)庫中存在、與別的檢索詞或字符串是什么關(guān)系,而是在于判定檢索詞或字符串在滿足檢索邏輯后對文獻(xiàn)命中與否的影響程度。

1.4.6 聚類檢索

聚類是把沒有分類的事物,在不知道應(yīng)分幾類的情況下,根據(jù)事物彼此不同的內(nèi)在屬性,將屬性相似的信息劃分到同一類下面。

1.5 科技信息檢索的基本流程

科技信息檢索的流程如圖2所示。

圖2 科技信息檢索流程Fig.2 Sicence and technology information retrieval process

2 前向?qū)ο騻鞑ド窠?jīng)網(wǎng)絡(luò)

1987年美國計算機專家Robert Hecht-Nielsen將Kohonen特征映射網(wǎng)絡(luò)與Grossberg(格勞斯貝格)基本競爭網(wǎng)絡(luò)相結(jié)合提出了對向傳播神經(jīng)網(wǎng)絡(luò) (Counter Propagation Network,CPN),也稱作對傳網(wǎng),它是一種新型特征映射網(wǎng)絡(luò),提供了一個輸入模式和輸出模式之間的雙向映射,并被廣泛地應(yīng)用于模式分類、函數(shù)逼近、統(tǒng)計分析和數(shù)據(jù)壓縮等領(lǐng)域。CPN讓網(wǎng)絡(luò)的隱藏層執(zhí)行無監(jiān)督學(xué)習(xí),它是解決多級網(wǎng)絡(luò)訓(xùn)練的另一個思路。CPN是將Kohonen特征映射網(wǎng)絡(luò)與Grossberg基本競爭型網(wǎng)絡(luò)相結(jié)合的一種新型特征映射網(wǎng)絡(luò)[4-7],它是監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)相結(jié)合的神經(jīng)網(wǎng)絡(luò),既具有監(jiān)督網(wǎng)絡(luò)分類準(zhǔn)確精細(xì)的優(yōu)點,也具有無監(jiān)督網(wǎng)絡(luò)分類靈活、算法簡練的特點,將二者有機的結(jié)合起來。CPN一般分為前向?qū)骶W(wǎng)(Forward Counter Propagation Network,F(xiàn)orward-CPN)和全向?qū)骶W(wǎng)(Full Counter Propagation Network,F(xiàn)ull-CPN)兩種。

Forward-CPN的結(jié)構(gòu)由輸入層、競爭層、輸出層3部分組成,如圖3所示,輸入層和競爭層構(gòu)成自組織特征映射(Selforganizing Feature Map,SOM)網(wǎng)絡(luò),競爭層與輸出層構(gòu)成基本競爭網(wǎng)絡(luò)。Forward-CPN屬于監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí)相結(jié)合的網(wǎng)絡(luò),它從整體上分析屬于監(jiān)督型網(wǎng)絡(luò),從輸入層和競爭層構(gòu)成的SOM網(wǎng)絡(luò)上分析屬于無監(jiān)督型網(wǎng)絡(luò)。

Forward-CPN的隱層為競爭層,競爭層獲勝神經(jīng)元調(diào)整其內(nèi)星和外星權(quán)值向量。內(nèi)星權(quán)值向量采用無監(jiān)督學(xué)習(xí)算法,權(quán)值調(diào)整的目的是使得權(quán)值向量不斷靠近當(dāng)前的輸入模式類,從而將該模式類的典型向量編碼到獲勝神經(jīng)元的內(nèi)星權(quán)值向量中;外星權(quán)值向量采用監(jiān)督學(xué)習(xí)算法,權(quán)值調(diào)整的目的是使得外星權(quán)值向量不斷靠近并等于期望輸出,從而將該輸出編碼到外星權(quán)值向量中。

圖3 Forward-CPN模型Fig.3 Model of forward-CPN

Forward-CPN從輸入層到競爭層,網(wǎng)絡(luò)按照SOM學(xué)習(xí)規(guī)則產(chǎn)生競爭層獲勝神經(jīng)元,并按照這一規(guī)則調(diào)整相應(yīng)的輸入層到競爭層之間的連接權(quán)值。從競爭層到輸出層,網(wǎng)絡(luò)按照基本競爭網(wǎng)絡(luò)學(xué)習(xí)規(guī)則得到輸出層各神經(jīng)元的實際輸出值,并按照有監(jiān)督學(xué)習(xí)規(guī)則的誤差校正方法調(diào)整相應(yīng)的競爭層到輸出層之間的連接權(quán)值。經(jīng)過上述反復(fù)學(xué)習(xí),將任意的輸入模式映射為輸出模式。

Forward-CPN算法可以分為兩個階段,第一階段對輸入層-競爭層的權(quán)值矩陣進(jìn)行訓(xùn)練,使權(quán)值向量不斷靠近當(dāng)前的輸入模式類;第二階段對競爭層-輸出層的權(quán)值矩陣進(jìn)行訓(xùn)練,使權(quán)值向量不斷靠近并等于目標(biāo)輸出。

3 基于前向?qū)ο騻鞑ド窠?jīng)網(wǎng)絡(luò)的信息檢索

3.1 基于Forward-CPN的信息檢索原理

1)將服務(wù)器系統(tǒng)中的每個分類主題詞分配給Forward-CPN輸入層的每個神經(jīng)元,建立“輸入層-競爭層”權(quán)值矩陣。

2)將用戶的初始檢索提問詞集和作為神經(jīng)網(wǎng)絡(luò)的輸入模式集合提供給網(wǎng)絡(luò),通過提問詞集和的輸入模式通過網(wǎng)絡(luò)的競爭層,到達(dá)輸出層。

3)不斷地將輸入模式集合中的輸入模式反復(fù)提供給網(wǎng)絡(luò),讓網(wǎng)絡(luò)完成學(xué)習(xí),直到某一時刻,網(wǎng)絡(luò)的輸出神經(jīng)元能夠滿足用戶期望輸出的結(jié)果,網(wǎng)絡(luò)達(dá)到穩(wěn)定。

4)對網(wǎng)絡(luò)輸出端檢索出的信息進(jìn)行智能分類,使用戶獲得更多的想得到的結(jié)果。

3.2 基于Forward-CPN的信息檢索算法設(shè)計

步驟1:輸入模式預(yù)處理

將每個輸入模式進(jìn)行歸一化處理,將二進(jìn)制離散數(shù)據(jù){a1,a2,…an}轉(zhuǎn)換為雙極式數(shù)據(jù){x1,x2,…xn},即

步驟2:初始化權(quán)值矩陣 w1和w2。

步驟3:將利用檢索提問詞建立的輸入模式集合提交給網(wǎng)絡(luò)。

步驟4:通過網(wǎng)絡(luò)的權(quán)值矩陣w1和w2,對輸入模式進(jìn)行學(xué)習(xí)。

步驟5:當(dāng)網(wǎng)絡(luò)檢索到所有信息時,網(wǎng)絡(luò)處于穩(wěn)定狀態(tài),停止運行,同時輸出檢索結(jié)果。

3.3 仿真實驗

假設(shè)現(xiàn)有 6 篇文獻(xiàn)分別為 D1、D2、D3、D4、D5、D6,將其存儲于服務(wù)器進(jìn)行檢索。Forward-CPN輸入層神經(jīng)元為3個,隱層神經(jīng)元為7個,輸出層神經(jīng)元為6個。利用6篇文獻(xiàn)建立輸入模式,即

將其轉(zhuǎn)換為雙極數(shù)據(jù)模式,即

然后,利用Forward-CPN進(jìn)行仿真,與傳統(tǒng)方法比較,前者具有更好的效果,如表1所示。

表1 Forward-CPN方法與傳統(tǒng)方法比較Tab.1 Compare between Forward-CPN and traditional method

4 結(jié)束語

通過對信息檢索技術(shù)的基本概念、原理、檢索方式、以及科技信息檢索流程的分析,在對前向?qū)ο騻鞑ド窠?jīng)網(wǎng)絡(luò)的基本模型和算法的研究的基礎(chǔ)上,提出了基于前向?qū)ο騻鞑ド窠?jīng)網(wǎng)絡(luò)的信息檢索的原理和算法,并將這種算法與傳統(tǒng)方法通過仿真實驗進(jìn)行對比,在保持100%的查準(zhǔn)率的情況下,將查全率由79.63%提高至85.59%,獲得了較好的效果。

[1]周瑛.神經(jīng)網(wǎng)絡(luò)作為分類器的算法研究及其在信息檢索中的應(yīng)用[D].合肥:安徽大學(xué),2006.

[2]劉斌,黃鐵軍,程軍,等.一種新的基于統(tǒng)計的自動文本分類方法[J].中文信息學(xué)報,2002,16(6):18-24.LIU Bing, HUANG Tie-jun,CHENG Jun, et al.A new statistical-based method in automatic text classification[J].Journal of Chinese Information Processing,2002,16(6):18-24.

[3]Salton G,McGill M J.Introduction to modem information retrieval[C]//New York:McGraw Hill,1983.

[4]Hecht Nielsen R.Counter propagation network[C]//Proc.of IEEE First Int’l Conference on Neural Networks,1987(2):19-32

[5]Kuzmanovski I,Novic M.Counter-Propagation neural networks in matlab[J].Chemometrics and Intelligent Laboratory System,2008(90):84-91.

[6]金明曦,武妍.基于對向傳播神經(jīng)網(wǎng)絡(luò)的人臉識別方法[J].電子科技大學(xué)學(xué)報,2004,33(5):573-576.JIN Ming-xi,WU Yan.Face recognition based on counter propagation network[J].Journal of University of Electronic Science and Technology of China,2004,33(5):573-576.

[7]葛哲學(xué),孫志強.神經(jīng)網(wǎng)絡(luò)理論與MATLAB R2007實現(xiàn)[M].北京:電子工業(yè)出版社,2007.

[8]Hagan M T,Demuth H B,beale M H,著.神經(jīng)網(wǎng)絡(luò)設(shè)計[M].戴葵,等譯.北京:機械工業(yè)出版社,2006.

[9]Fredric M.Ham,Ivica Kostanic,著.神經(jīng)計算原理[M].葉世偉,王海娟,譯.北京:機械工業(yè)出版社,2007.

猜你喜歡
信息檢索信息
基于同態(tài)加密支持模糊查詢的高效隱私信息檢索協(xié)議
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
醫(yī)學(xué)期刊編輯中文獻(xiàn)信息檢索的應(yīng)用
新聞傳播(2016年18期)2016-07-19 10:12:06
在網(wǎng)絡(luò)環(huán)境下高職院校開設(shè)信息檢索課的必要性研究
新聞傳播(2016年11期)2016-07-10 12:04:01
基于神經(jīng)網(wǎng)絡(luò)的個性化信息檢索模型研究
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
教學(xué)型大學(xué)《信息檢索》公選課的設(shè)計與實施
河南科技(2014年11期)2014-02-27 14:10:19
公共圖書館信息檢索服務(wù)的實踐探索——以上海浦東圖書館為例
圖書館界(2013年5期)2013-03-11 18:50:29
信息
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 午夜福利在线观看入口| 天天综合网色中文字幕| 欧美国产菊爆免费观看| 亚洲精品天堂自在久久77| 国产香蕉一区二区在线网站| 成年av福利永久免费观看| 欧美日本不卡| 色香蕉影院| 国产成人一区| 激情综合图区| 激情综合网址| 性色一区| 国产无码精品在线| 久久国产精品影院| 色视频久久| 欧美色综合久久| 欧美第一页在线| 欧美成人午夜在线全部免费| 欧洲精品视频在线观看| 日本人妻一区二区三区不卡影院| 亚洲最黄视频| 国产人前露出系列视频| 亚洲天天更新| 亚瑟天堂久久一区二区影院| 91视频国产高清| 精品视频91| 精品久久777| 亚欧成人无码AV在线播放| 国产一区二区精品福利| 777国产精品永久免费观看| 色视频国产| 欧美在线视频a| 亚洲av中文无码乱人伦在线r| 亚洲AV无码一二区三区在线播放| 欧美一区国产| 真实国产乱子伦视频| 亚洲综合网在线观看| 国产丝袜一区二区三区视频免下载| 亚洲日本精品一区二区| 国内精品小视频在线| 中文字幕欧美日韩| 国产成本人片免费a∨短片| 久久成人国产精品免费软件| 成人在线观看不卡| 亚洲成人网在线观看| 日韩a级片视频| 国产精品3p视频| 国产视频自拍一区| 国产美女叼嘿视频免费看| 久青草免费在线视频| 丝袜国产一区| 欧美亚洲国产精品第一页| 四虎影视国产精品| av色爱 天堂网| 欧美人人干| 乱系列中文字幕在线视频| 亚洲一级毛片免费观看| 精品国产91爱| 欧美一级高清视频在线播放| 亚洲成人手机在线| 国产精品伦视频观看免费| 精品综合久久久久久97| 制服丝袜无码每日更新| 亚洲一欧洲中文字幕在线 | 欧美自拍另类欧美综合图区| 亚洲第一中文字幕| 国产成人三级在线观看视频| 99视频在线精品免费观看6| 香蕉视频在线观看www| 欧美一区二区福利视频| 久久久久国产精品免费免费不卡| 尤物国产在线| 国产精品深爱在线| 亚洲无码免费黄色网址| 激情无码字幕综合| 亚洲高清在线播放| 久久久波多野结衣av一区二区| 国产日韩欧美在线播放| 国产精品综合久久久 | 国产网站免费看| 啊嗯不日本网站| 永久天堂网Av|