999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于多智能體協(xié)同的多源信息搜索方法

2015-01-06 08:21:17褚衍杰徐正國(guó)
計(jì)算機(jī)工程 2015年2期
關(guān)鍵詞:智能信息模型

褚衍杰,徐正國(guó)

(信號(hào)盲處理國(guó)家重點(diǎn)實(shí)驗(yàn)室,成都610041)

基于多智能體協(xié)同的多源信息搜索方法

褚衍杰,徐正國(guó)

(信號(hào)盲處理國(guó)家重點(diǎn)實(shí)驗(yàn)室,成都610041)

針對(duì)實(shí)時(shí)、多源、海量數(shù)據(jù)條件下用戶所需信息的獲取問(wèn)題,提出一種面向?qū)ο蟮?、基于多智能體協(xié)同的多源信息搜索模型,以對(duì)象為中心,在反饋循環(huán)搜索的過(guò)程中,完善對(duì)象描述模型并實(shí)現(xiàn)多源數(shù)據(jù)中關(guān)聯(lián)對(duì)象信息的獲取,提高多源信息獲取的全面性和準(zhǔn)確性。設(shè)計(jì)基于Q學(xué)習(xí)的協(xié)同控制算法,針對(duì)馬爾科夫?qū)ο笈c非馬爾科夫?qū)ο蠼o出相應(yīng)的決策方法。實(shí)驗(yàn)結(jié)果表明,該協(xié)同控制算法比概率轉(zhuǎn)移矩陣及概率統(tǒng)計(jì)算法具有更好的信息獲取能力。

多智能體;信息搜索;多源信息;面向?qū)ο?Q學(xué)習(xí);協(xié)同機(jī)制

1 概述

隨著網(wǎng)絡(luò)技術(shù)的飛速發(fā)展,尤其是移動(dòng)互聯(lián)網(wǎng)日益深入人們的日常生活,各種數(shù)字化信息呈爆炸式增長(zhǎng),據(jù)IDC(International Data Corporation)公司統(tǒng)計(jì), 2011年全球被創(chuàng)建和被復(fù)制的數(shù)據(jù)總量為1.8 ZB (1021),其中75%來(lái)自個(gè)人(圖像、視頻、音樂(lè)等)[1];大數(shù)據(jù)、云計(jì)算等技術(shù)提供了海量數(shù)據(jù)處理的基本技術(shù),但是如何從繁雜多樣的多源數(shù)據(jù)中有效獲取用戶需要的信息仍是一個(gè)有待深入研究的課題。

多智能體技術(shù)是一項(xiàng)利用多個(gè)智能體組成有機(jī)整體,并相互協(xié)同、服務(wù)以共同完成一個(gè)任務(wù)的人工智能技術(shù),能夠有效地實(shí)時(shí)解決動(dòng)態(tài)復(fù)雜問(wèn)題。文獻(xiàn)[2]提出一種利用移動(dòng)智能體在多個(gè)網(wǎng)站搜索特定信息的系統(tǒng)及相應(yīng)算法,但未解決多種數(shù)據(jù)類型(如文本、圖片、視頻等)的協(xié)同搜索問(wèn)題。文獻(xiàn)[3]構(gòu)建一個(gè)基于多智能體系統(tǒng)的知識(shí)管理模型;文獻(xiàn)[4]建立基于多智能體系統(tǒng)的多級(jí)庫(kù)存智能管理系統(tǒng);文獻(xiàn)[5]設(shè)計(jì)了以智能車為載體的區(qū)域監(jiān)控系統(tǒng);文獻(xiàn)[6]利用多智能體建模與仿真的方法分析了大眾生產(chǎn)系統(tǒng)在不同情況下的穩(wěn)定性;文獻(xiàn)[7]將多智能體系統(tǒng)應(yīng)用到城市管理領(lǐng)域,設(shè)計(jì)城市自動(dòng)應(yīng)急聯(lián)動(dòng)系統(tǒng);文獻(xiàn)[8]提出利用分布值函數(shù)的多智能體協(xié)同算法;文獻(xiàn)[9]提出利用多智能體交通濾波效應(yīng)的分布式協(xié)同控制算法;文獻(xiàn)[10]分析了復(fù)雜網(wǎng)絡(luò)特性對(duì)大規(guī)模多智能體協(xié)同算法的影響。本文借鑒上述模型、方法,將多智能體系統(tǒng)應(yīng)用到多源信息的協(xié)同搜索問(wèn)題中,提出多智能體協(xié)同模型及協(xié)同算法。

2 基于多智能體協(xié)同的多源信息搜索模型

用戶關(guān)心的信息一般可以概括為2種:面向?qū)ο蟮男畔⒑兔嫦蜻^(guò)程的信息。面向?qū)ο蟮男畔⑹侵赣脩絷P(guān)心某個(gè)對(duì)象,例如人、組織、物品、文章等的相關(guān)信息;面向過(guò)程的信息是指用戶關(guān)心某個(gè)事件的發(fā)展進(jìn)程。由于對(duì)事件過(guò)程描述的復(fù)雜性,在信息搜索的過(guò)程中,一般也以事件過(guò)程中相關(guān)對(duì)象的特征為搜索要素,因此可以用一種對(duì)象描述模型來(lái)表示信息模型。根據(jù)用戶關(guān)心內(nèi)容的不同,對(duì)象模型具有不同的形式,且可以在信息搜索過(guò)程中進(jìn)行更新。一般而言,對(duì)象的基本模型包含以下因素:[對(duì)象名,對(duì)象身份特征,對(duì)象行為特征],例如,某人可以描述為[姓名,籍貫,年齡,民族,電話號(hào)碼,聯(lián)系人,聯(lián)系時(shí)間],在信息搜索過(guò)程中可以根據(jù)需要逐漸更新學(xué)歷、微博賬號(hào)、微博內(nèi)容等要素。

2.1 模型介紹

多智能體協(xié)同的多源信息搜索模型利用不同的智能體處理不同類型的數(shù)據(jù),并融合多種結(jié)果作為最終的對(duì)象信息,結(jié)構(gòu)如圖1所示。

圖1 多智能體協(xié)同的多源信息搜索模型

多智能體協(xié)同的多源信息搜索模型結(jié)構(gòu)具體如下:

(1)協(xié)同控制智能體:負(fù)責(zé)根據(jù)用戶的搜索要求、對(duì)象知識(shí)庫(kù)和對(duì)象描述模型,制定下達(dá)搜索任務(wù),協(xié)調(diào)不同的智能體完成不同的子任務(wù)。

(2)智能體群:即圖1中的智能體A、智能體B等,具體完成數(shù)據(jù)分析的子任務(wù);這些智能體可以具有相同的功能,并行處理數(shù)據(jù),也可以具有不同的功能,處理不同類型的數(shù)據(jù)。

(3)素材數(shù)據(jù)采集智能體:由多個(gè)素材數(shù)據(jù)采集智能體組成,負(fù)責(zé)從不同的數(shù)據(jù)源采集素材數(shù)據(jù)。在數(shù)據(jù)源眾多、數(shù)據(jù)采集設(shè)備有限的條件下,需要利用原始素材庫(kù)及對(duì)象知識(shí)庫(kù)的統(tǒng)計(jì)信息制定合理的數(shù)據(jù)采集策略。

2.2 信息搜索流程

信息搜索流程如下:

(1)用戶下達(dá)信息搜索任務(wù)。

(2)協(xié)同控制智能體根據(jù)任務(wù)內(nèi)容,初始化對(duì)象模型。

(3)協(xié)同控制智能體根據(jù)對(duì)象模型和對(duì)象知識(shí)庫(kù)中已有的知識(shí)制定搜索子任務(wù),分發(fā)給智能體群中的各智能體;協(xié)同控制智能體根據(jù)各子任務(wù)內(nèi)容,將素材數(shù)據(jù)的篩選條件下達(dá)到素材數(shù)據(jù)采集智能體。

(4)素材數(shù)據(jù)采集智能體實(shí)時(shí)進(jìn)行數(shù)據(jù)采集,將原始數(shù)據(jù)存入原始素材庫(kù)。

(5)智能體群中的各智能體從原始素材庫(kù)中采集要素信息,完成分析處理任務(wù),通知協(xié)同控制智能體,將結(jié)果存入對(duì)象知識(shí)庫(kù),并更新對(duì)象描述模型。

(6)協(xié)同控制智能體判斷任務(wù)完成情況,若達(dá)到用戶的要求,則結(jié)束任務(wù),否則轉(zhuǎn)步驟(3),直至達(dá)到要求。

在圖1中,素材數(shù)據(jù)采集智能體面臨從多源數(shù)據(jù)中提高獲取有效素材效率的問(wèn)題,該問(wèn)題已在文獻(xiàn)[11]中詳細(xì)論述;協(xié)同控制智能體面臨協(xié)調(diào)智能體群處理多源、多類型數(shù)據(jù)的問(wèn)題,下面將針對(duì)該問(wèn)題提出協(xié)同控制算法。

3 多源信息搜索協(xié)同控制方法

用戶關(guān)心的對(duì)象數(shù)據(jù)經(jīng)常會(huì)在多個(gè)數(shù)據(jù)源、多種類型數(shù)據(jù)之間跳轉(zhuǎn),其跳轉(zhuǎn)規(guī)律通常蘊(yùn)含了該對(duì)象的行為特性,基于Q學(xué)習(xí)的協(xié)同控制算法利用Q學(xué)習(xí)思想訓(xùn)練對(duì)象的出現(xiàn)記錄,從而解決控制多智能體群在何時(shí)處理哪個(gè)數(shù)據(jù)源中哪類數(shù)據(jù)的問(wèn)題。

3.1 Q學(xué)習(xí)

Q學(xué)習(xí)是一種傳統(tǒng)的多智能體強(qiáng)化學(xué)習(xí)方法,通過(guò)智能體與環(huán)境交互得到外部環(huán)境的回報(bào),從而決定下一步的動(dòng)作。Q學(xué)習(xí)把智能體的學(xué)習(xí)過(guò)程看作一個(gè)Markov決策過(guò)程(Markov Decision Proccss, MDP),即智能體根據(jù)當(dāng)前內(nèi)部狀態(tài)、外部狀態(tài)、固定的狀態(tài)轉(zhuǎn)移概率,以最大化將來(lái)的總體回報(bào)為目標(biāo),決定下一步采取的動(dòng)作并得到一個(gè)即時(shí)回報(bào)。

Q學(xué)習(xí)中定義Q值為按照某一個(gè)策略執(zhí)行一系列動(dòng)作得到的回報(bào)的總和,其一步更新算法如下[12]:其中,st∈S表示t時(shí)刻的狀態(tài);at∈A表示t時(shí)刻采取的動(dòng)作;P(st,at,st+1)表示在狀態(tài)st下執(zhí)行動(dòng)作at,轉(zhuǎn)化到狀態(tài)st+1的概率;r(st,at)表示在狀態(tài)st下執(zhí)行動(dòng)作at得到的回報(bào);γ表示折扣因子,描述時(shí)間遠(yuǎn)近對(duì)回報(bào)的影響;α表示學(xué)習(xí)率。

在Q學(xué)習(xí)中,累計(jì)回報(bào)函數(shù)表示為Vπ(s)=Qπ(s,a),按照策略與狀態(tài)動(dòng)作對(duì)的映射尋找最優(yōu)策略,即π:s→a,可以得到最優(yōu)策略如下:

通過(guò)反復(fù)迭代執(zhí)行動(dòng)作-更新Q值,Q值將逐步逼近最優(yōu)策略Q?(s,a)。

通過(guò)對(duì)Q學(xué)習(xí)算法的介紹可以發(fā)現(xiàn),Q學(xué)習(xí)算法通過(guò)學(xué)習(xí)訓(xùn)練過(guò)程中動(dòng)作與環(huán)境回報(bào)之間的對(duì)應(yīng)關(guān)系,實(shí)現(xiàn)尋找最優(yōu)策略的目的,與多源信息搜索問(wèn)題中希望通過(guò)對(duì)象數(shù)據(jù)的出現(xiàn)規(guī)律預(yù)測(cè)下一步動(dòng)作的問(wèn)題類似,因此下面提出基于Q學(xué)習(xí)的協(xié)同控制方法。

3.2 基于Q學(xué)習(xí)的協(xié)同控制方法

在多源信息搜索的協(xié)同控制問(wèn)題中,利用Q表訓(xùn)練對(duì)象的出現(xiàn)記錄,其中有以下問(wèn)題需要關(guān)注:

(1)系統(tǒng)狀態(tài)與動(dòng)作:系統(tǒng)狀態(tài)S表征系統(tǒng)發(fā)現(xiàn)對(duì)象信息的情況,可以直接使用發(fā)現(xiàn)對(duì)象的數(shù)據(jù)源和數(shù)據(jù)類型(s,d)表示,即共有M×N種狀態(tài),且可以變換為S=s+(d-1)×M,狀態(tài)間可以任意跳轉(zhuǎn);系統(tǒng)執(zhí)行的動(dòng)作a表示處理某數(shù)據(jù)源的某類數(shù)據(jù),同樣有M×N種動(dòng)作。

(2)環(huán)境回報(bào)函數(shù):Q學(xué)習(xí)算法的環(huán)境回報(bào)函數(shù)r(st,at)表征在狀態(tài)st下執(zhí)行動(dòng)作at,將得到的回報(bào)應(yīng)用在多源信息搜索問(wèn)題中,表示在相應(yīng)數(shù)據(jù)源、數(shù)據(jù)類型中發(fā)現(xiàn)對(duì)象信息的價(jià)值,該價(jià)值可以由用戶通過(guò)歷史經(jīng)驗(yàn)對(duì)數(shù)據(jù)源、數(shù)據(jù)類型的重要程度評(píng)價(jià)得到,也可以統(tǒng)計(jì)單位時(shí)間內(nèi)在數(shù)據(jù)源、數(shù)據(jù)類型內(nèi)獲取的對(duì)象信息數(shù)量確定,環(huán)境回報(bào)函數(shù)示例如圖2所示。

圖2 環(huán)境回報(bào)函數(shù)示例

(3)對(duì)象特性:傳統(tǒng)的Q學(xué)習(xí)算法采用二維Q表存儲(chǔ)Q值,相當(dāng)于默認(rèn)對(duì)象下一狀態(tài)僅由其當(dāng)前狀態(tài)確定,符合馬爾科夫過(guò)程的特點(diǎn);在多源信息搜索問(wèn)題中,對(duì)象的特性未知,有可能不符合馬爾科夫過(guò)程的特點(diǎn),因此對(duì)Q表進(jìn)行改進(jìn),采用多維Q表,則Q表的維度表示了對(duì)象前后相關(guān)狀態(tài)的數(shù)量;從經(jīng)驗(yàn)上看,對(duì)象的相關(guān)狀態(tài)數(shù)量不會(huì)太多,基于Q學(xué)習(xí)的協(xié)同控制算法(圖3)采用三維Q表。下面根據(jù)對(duì)象是否符合馬爾科夫過(guò)程特點(diǎn)將對(duì)象稱為馬爾科夫?qū)ο蠛头邱R爾科夫?qū)ο蟆?/p>

圖3 基于Q學(xué)習(xí)的協(xié)同控制算法流程

基于Q學(xué)習(xí)的協(xié)同控制算法具體步驟如下:

(1)初始化系統(tǒng)內(nèi)部狀態(tài),系統(tǒng)內(nèi)部狀態(tài)為(s-,s0,s+),其中,s0表示對(duì)象最近一次出現(xiàn)的狀態(tài);s-表示s0的前一個(gè)狀態(tài);s+表示s0的后一個(gè)狀態(tài)。

(2)初始化Q表,Q(i,j,k)=0(1≤i,j,k≤M×N),初始化環(huán)境回報(bào)函數(shù),為便于仿真,此處假設(shè)環(huán)境回報(bào)函數(shù)由人工設(shè)定,實(shí)際使用時(shí)可以統(tǒng)計(jì)獲取。

(3)當(dāng)有新的對(duì)象出現(xiàn)記錄g={gs,gd}時(shí),更新s+=gs+(gd-1)×M;更新Q值表,一步更新公式為Q(s-,s0,s+)=Q(s-,s0,s+)+r(s+)。

(5)對(duì)象屬性判斷:系統(tǒng)初始時(shí),無(wú)歷史信息,無(wú)法確定對(duì)象屬性,同時(shí)執(zhí)行步驟(6)、步驟(7);系統(tǒng)運(yùn)行一段時(shí)間后,統(tǒng)計(jì)馬爾科夫決策和非馬爾科夫決策對(duì)下一步動(dòng)作的預(yù)測(cè)與對(duì)象下一步實(shí)際狀態(tài)相同的次數(shù),選擇預(yù)測(cè)正確次數(shù)大的決策屬性作為對(duì)象屬性。

(8)執(zhí)行下一步動(dòng)作,處理狀態(tài)s+對(duì)應(yīng)的{s,d}數(shù)據(jù),對(duì)應(yīng)公式為:

其中,表示向下取整,等待新的對(duì)象出現(xiàn)記錄,轉(zhuǎn)步驟(3)。

分析算法步驟可以看出,算法計(jì)算量主要集中在預(yù)測(cè)下一步動(dòng)作時(shí)求Q值矩陣的最大值,馬爾科夫決策的復(fù)雜度為O(M2N2),非馬爾科夫決策的復(fù)雜度為O(MN),因此算法總的復(fù)雜度為O(M2N2),能夠滿足實(shí)時(shí)處理的需求。

4 實(shí)驗(yàn)驗(yàn)證與結(jié)果分析

為驗(yàn)證算法性能,在Matlab 2012上對(duì)算法進(jìn)行仿真驗(yàn)證。驗(yàn)證系統(tǒng)結(jié)構(gòu)如圖4所示,其中,對(duì)象記錄生成模塊負(fù)責(zé)生成馬爾科夫?qū)ο蠛头邱R爾科夫?qū)ο蟮某霈F(xiàn)記錄;對(duì)象信息價(jià)值統(tǒng)計(jì)模塊負(fù)責(zé)按照環(huán)境回報(bào)函數(shù)統(tǒng)計(jì)不同算法獲取的對(duì)象信息價(jià)值,作為比較算法性能的依據(jù)。為了說(shuō)明算法性能,下面對(duì)比了本文算法、轉(zhuǎn)移概率矩陣算法以及概率統(tǒng)計(jì)算法的性能(“Q學(xué)習(xí)2”表示本文算法的馬爾科夫決策,“Q學(xué)習(xí)3”表示本文算法的非馬爾科夫決策),其中轉(zhuǎn)移概率矩陣算法是指利用對(duì)象出現(xiàn)記錄,統(tǒng)計(jì)對(duì)象在各狀態(tài)間的轉(zhuǎn)移概率矩陣,并根據(jù)當(dāng)前狀態(tài)的最大轉(zhuǎn)移概率值確定下一步動(dòng)作;概率統(tǒng)計(jì)算法是指統(tǒng)計(jì)對(duì)象在各狀態(tài)的歷史出現(xiàn)記錄作為對(duì)象在該狀態(tài)出現(xiàn)的概率,下一步動(dòng)作為向出現(xiàn)概率最大的狀態(tài)對(duì)應(yīng)的數(shù)據(jù)源、業(yè)務(wù)派遣處理智能體。

圖4 驗(yàn)證系統(tǒng)結(jié)構(gòu)

在下面實(shí)驗(yàn)中,如無(wú)特殊說(shuō)明,實(shí)驗(yàn)數(shù)據(jù)條件為:M=5,N=5,對(duì)象在各數(shù)據(jù)源、數(shù)據(jù)類型的出現(xiàn)符合正態(tài)分布;每次實(shí)驗(yàn)初始時(shí)對(duì)象出現(xiàn)記錄數(shù)為0,然后生成對(duì)象出現(xiàn)位置并預(yù)測(cè)下一步動(dòng)作,每種方法生成并預(yù)測(cè)1000次,統(tǒng)計(jì)獲取的對(duì)象信息價(jià)值;每種實(shí)驗(yàn)給出10次實(shí)驗(yàn)的結(jié)果。

實(shí)驗(yàn)結(jié)果中的2個(gè)性能指標(biāo)定義如下:(1)信息價(jià)值是指歷次預(yù)測(cè)正確時(shí)的環(huán)境回報(bào)函數(shù)累計(jì)求和;(2)信息獲取率是指算法獲取的信息價(jià)值與搜索次數(shù)的比值。

4.1 環(huán)境回報(bào)函數(shù)對(duì)算法性能的影響

環(huán)境回報(bào)函數(shù)是本文算法與轉(zhuǎn)移概率矩陣算法的主要區(qū)別之一,為了說(shuō)明環(huán)境回報(bào)函數(shù)的影響,按照?qǐng)D5給出的2種回報(bào)函數(shù)設(shè)置進(jìn)行實(shí)驗(yàn),結(jié)果如圖6所示。

圖5 2種環(huán)境回報(bào)函數(shù)設(shè)置

圖6 環(huán)境回報(bào)函數(shù)對(duì)算法性能影響的對(duì)比

在圖6(a)中,本文算法的馬爾科夫決策和轉(zhuǎn)移概率矩陣算法的實(shí)驗(yàn)結(jié)果基本一致,都比概率統(tǒng)計(jì)算法有顯著提高,這是由于所有的回報(bào)函數(shù)值都設(shè)為1時(shí),本文算法退化為和轉(zhuǎn)移概率矩陣算法相同,從本質(zhì)上講,兩者對(duì)下一步動(dòng)作的預(yù)測(cè)都是基于馬爾科夫模型的概率轉(zhuǎn)移矩陣;圖6(a)中有個(gè)別實(shí)驗(yàn)結(jié)果有微小區(qū)別,是由于兩者第一次訓(xùn)練需要的數(shù)據(jù)量不同造成的,本文算法需要3次記錄生成第一個(gè)Q值,而轉(zhuǎn)移概率矩陣算法只需要2次記錄;在圖6(b)中,由于環(huán)境回報(bào)函數(shù)分為5級(jí),本文算法的優(yōu)勢(shì)得以體現(xiàn),比轉(zhuǎn)移概率矩陣算法性能提升在40%~50%左右,說(shuō)明了環(huán)境回報(bào)函數(shù)的有效性。

4.2 算法綜合性能分析

圖7(a)和圖7(b)分別給出了對(duì)于馬爾科夫?qū)ο笈c非馬爾科夫?qū)ο?4種方法的整體性能對(duì)比。圖7(a)的學(xué)習(xí)次數(shù)為1000次,圖7(b)的學(xué)習(xí)次數(shù)為10 000次,本文算法采用圖5的第2種環(huán)境回報(bào)函數(shù)。

圖7 算法整體性能對(duì)比

由圖7(a)可以看出,對(duì)于馬爾科夫?qū)ο?在訓(xùn)練次數(shù)為1000的條件下,本文算法的馬爾科夫決策效果最好,轉(zhuǎn)移概率矩陣算法效果次之;由圖7(b)可以看出,對(duì)于非馬爾科夫?qū)ο?在訓(xùn)練次數(shù)為10 000的條件下,本文算法的非馬爾科夫決策效果最好,馬爾科夫決策次之,轉(zhuǎn)移概率矩陣算法和概率統(tǒng)計(jì)算法的性能較差。上述結(jié)果說(shuō)明當(dāng)算法假定的對(duì)象特性與實(shí)際相符時(shí),算法效果最好,實(shí)際使用時(shí)需要根據(jù)情況選擇適當(dāng)算法。

圖8(a)和圖8(b)分別給出了對(duì)于馬爾科夫?qū)ο蠛头邱R爾科夫?qū)ο?4種算法的性能收斂趨勢(shì)。圖8(a)針對(duì)馬爾科夫?qū)ο?進(jìn)行了1次實(shí)驗(yàn),預(yù)測(cè)10 000次;圖8(b)針對(duì)非馬爾科夫?qū)ο?進(jìn)行了1次實(shí)驗(yàn),預(yù)測(cè)100 000次。

圖8 算法收斂性對(duì)比

由圖8(a)可以看出,對(duì)于馬爾科夫?qū)ο?本文算法的馬爾科夫決策的信息獲取率最高,且收斂速度較快。在學(xué)習(xí)次數(shù)為500左右時(shí),算法信息獲取率達(dá)到20%左右,此后持續(xù)增長(zhǎng),在學(xué)習(xí)次數(shù)為3 000左右之后增速放緩,趨于平穩(wěn);另外,3種算法收斂后的性能按照轉(zhuǎn)移概率矩陣算法、本文算法的非馬爾科夫決策、概率統(tǒng)計(jì)算法的順序性能依次降低。

由圖8(b)可以看出,對(duì)于非馬爾科夫?qū)ο?本文算法的非馬爾科夫決策的信息獲取率最高,且收斂速度較快。在學(xué)習(xí)次數(shù)為5 000左右時(shí),算法信息獲取率達(dá)到20%左右,此后持續(xù)增長(zhǎng),在學(xué)習(xí)次數(shù)為20 000左右后增速放緩,趨于平穩(wěn);另外,3種算法收斂后的性能按照本文算法的馬爾科夫決策方法、轉(zhuǎn)移概率矩陣算法、概率統(tǒng)計(jì)算法的順序性能依次降低。在學(xué)習(xí)次數(shù)小于3 000次左右的情況下,本文算法的馬爾科夫決策的性能比其他3種算法好。

另外,上述實(shí)驗(yàn)是對(duì)象在各數(shù)據(jù)源、數(shù)據(jù)類型正態(tài)分布的情況下進(jìn)行的,在現(xiàn)實(shí)中根據(jù)對(duì)象分布特性的不同,算法性能提升效果有所不同。一般來(lái)說(shuō),對(duì)象分布越不均勻,算法效果越好。

通過(guò)上述實(shí)驗(yàn)驗(yàn)證,發(fā)現(xiàn)本文算法的特性如下:

(1)基于Q學(xué)習(xí)的協(xié)同控制算法中分別針對(duì)2種類型的對(duì)象設(shè)計(jì)了馬爾科夫決策和非馬爾科夫決策。馬爾科夫適用于馬爾科夫?qū)ο蠡蛘叻邱R爾科夫?qū)ο蟮珜W(xué)習(xí)次數(shù)較少的情況;非馬爾科夫決策適用于非馬爾科夫?qū)ο笄覍W(xué)習(xí)次數(shù)較多的情況。

(2)由于馬爾科夫決策的收斂速度較快,因此在實(shí)際使用中,建議學(xué)習(xí)次數(shù)小于M2N2的情況下使用馬爾科夫決策;學(xué)習(xí)次數(shù)大于M2N2后,2種決策方法分別預(yù)測(cè),根據(jù)預(yù)測(cè)正確率確定對(duì)象屬性,從而選擇預(yù)測(cè)方法。

5 結(jié)束語(yǔ)

本文研究海量實(shí)時(shí)數(shù)據(jù)條件下有效獲取多源信息的方法,在多智能體技術(shù)的基礎(chǔ)上,設(shè)計(jì)面向?qū)ο蟮亩嘀悄荏w協(xié)同多源信息搜索模型,并提出基于Q學(xué)習(xí)的多源信息搜索協(xié)同控制方法。與傳統(tǒng)搜索引擎相比,利用該模型能夠以對(duì)象為中心,在反饋循環(huán)搜索的過(guò)程中,完善對(duì)象描述模型并能從多源數(shù)據(jù)中關(guān)聯(lián)獲取對(duì)象信息,在信息搜索的全面性、有效性上有較大提高,模型的可擴(kuò)充性也較強(qiáng)。針對(duì)基于Q學(xué)習(xí)的多源信息搜索協(xié)同控制方法的實(shí)驗(yàn)證明,該方法設(shè)計(jì)的2種決策使得系統(tǒng)對(duì)馬爾科夫?qū)ο蠛头邱R爾科夫?qū)ο蟮男畔⑺阉餍视酗@著提高?;诙嘀悄荏w的多源信息搜索模型,能夠提高信息搜索系統(tǒng)的智能性、全面性和靈活性,但由于采用在線采集要素、離線循環(huán)分析的方法,在時(shí)效性上有所欠缺;另外,該模型對(duì)智能體群處理能力的差異未進(jìn)行詳細(xì)分析,這些都有待進(jìn)一步研究。

[1] Gantz J,Reinsel D.IDC IVIEW:Extracting Value from Chaos[J].IDC IVIEW,2011,(12):1-12.

[2] Chu Yanjie,Wei Qiang.A Network Specific Information SearchSystemBasedonMobileAgent[C]// Proceedings of the 3rd Global Congress on Intelligent Systems.Wuhan,China:[s.n.],2012:302-304.

[3] 蔣翠清,幸龍潮,丁 勇.基于Agent的知識(shí)管理系統(tǒng)模型研究[J].情報(bào)雜志,2007,(2):56-61.

[4] 薛 紅,趙 川.基于多智能體的連鎖零售多級(jí)庫(kù)存集成與優(yōu)化[J].計(jì)算機(jī)工程,2012,38(14):167-170.

[5] 陳 棟,關(guān)新平,龍承念,等.基于多智能體的區(qū)域監(jiān)控系統(tǒng)[J].計(jì)算機(jī)工程,2010,36(21):72-74.

[6] 姚燦中,楊建梅.基于多智能體的大眾生產(chǎn)系統(tǒng)穩(wěn)定性研究[J].計(jì)算機(jī)工程,2011,37(3):13-15.

[7] 熊立春,陳建宏,石東平,等.基于Multi-Agent協(xié)同模式的城市應(yīng)急聯(lián)動(dòng)系統(tǒng)[J].科技導(dǎo)報(bào),2012,(5): 33-38.

[8] Ferreira E D,Khosla P K.Multi Agent Collaboration Using Distributed Value Functions[C]//Proceedings of IEEE Intelligent Vehicles Symposium.Dearborn,USA: IEEE Press,2000:404-409.

[9] 徐 楊,張玉林,孫婷婷,等.基于多智能體交通濾波效應(yīng)分布式協(xié)同控制算法[J].軟件學(xué)報(bào),2012, 23(11):2937-2945.

[10] 徐 楊,李 響,常 洪,等.復(fù)雜網(wǎng)絡(luò)特性對(duì)大規(guī)模多智能體協(xié)同控制的影響[J].軟件學(xué)報(bào),2012, 23(11):2971-2986.

[11] 褚衍杰,徐正國(guó).基于行為規(guī)律的搜索資源分配新算法[J].電訊技術(shù),2014,54(2):195-200.

[12] 趙增榮,韓提文.基于Q-Learning的智能體訓(xùn)練[J].石家莊鐵道學(xué)院學(xué)報(bào),2007,20(2):37-39.

編輯 陸燕菲

Multi-source Information Search Method Based on Multi-Agent Collaboration

CHU Yanjie,XU Zhengguo
(National Key Laboratory of Blind Signal Processing,Chengdu 610041,China)

A new multi-source information search model based on multi-Agent collaboration is put forward to deal with the problem that under the real time,multi-source and huge information condition.Multi-Agent information search model centers around objects,builds the whole object model by cycling search,and gets the information that users care for.This model has higher intelligent and open-ended features,and it can make multi-source information searing more comprehensive and accurate.Q-learning-based collaborative control algorithm is proposed.The algorithm designs different decision-making methods for Markov objects and non-Markov objects.Experimental results show that the algorithm has better information search ability than probability transfer matrix and probability statistics algorithms.

multi-Agent;information search;multi-source information;object-oriented;Q learning;collaborative mechanism

褚衍杰,徐正國(guó).基于多智能體協(xié)同的多源信息搜索方法[J].計(jì)算機(jī)工程,2015,41(2):193-198.

英文引用格式:Chu Yanjie,Xu Zhengguo.Multi-source Information Search Method Based on Multi-Agent Collaboration[J].Computer Engineering,2015,41(2):193-198.

1000-3428(2015)02-0193-06

:A

:TP393

10.3969/j.issn.1000-3428.2015.02.037

褚衍杰(1982-),男,博士研究生,主研方向:信息處理;徐正國(guó),博士研究生。

2014-02-28

:2014-04-07E-mail:chuyanjie@tsinghua.org.cn

猜你喜歡
智能信息模型
一半模型
重要模型『一線三等角』
重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
智能前沿
文苑(2018年23期)2018-12-14 01:06:06
智能前沿
文苑(2018年19期)2018-11-09 01:30:14
智能前沿
文苑(2018年17期)2018-11-09 01:29:26
智能前沿
文苑(2018年21期)2018-11-09 01:22:32
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
3D打印中的模型分割與打包
展會(huì)信息
主站蜘蛛池模板: 青青草原国产| 欧美黄色a| 朝桐光一区二区| 91毛片网| 91九色国产在线| 亚洲av无码人妻| 亚洲无码视频图片| 91无码国产视频| 在线观看国产网址你懂的| 无码又爽又刺激的高潮视频| 亚洲色图欧美激情| 亚洲熟女偷拍| 在线精品自拍| 精品一區二區久久久久久久網站| 国产精品亚洲综合久久小说| 天天综合天天综合| 国产靠逼视频| 欧美色香蕉| 日韩不卡高清视频| 老熟妇喷水一区二区三区| 国产女人在线视频| 麻豆精品久久久久久久99蜜桃| 国产成本人片免费a∨短片| 欧美人与动牲交a欧美精品| 国产微拍一区二区三区四区| 麻豆精品国产自产在线| 久久情精品国产品免费| 亚洲最新在线| 色综合天天娱乐综合网| 欧美第二区| 91香蕉视频下载网站| 99久久精品国产精品亚洲| 亚洲最新在线| 538国产在线| 人妻熟妇日韩AV在线播放| 国产午夜福利在线小视频| 国产精品无码AⅤ在线观看播放| 97se亚洲综合| 国产精品免费福利久久播放| 亚洲天堂自拍| 婷婷亚洲最大| 中文毛片无遮挡播放免费| 露脸真实国语乱在线观看| 欧美激情,国产精品| 中文字幕永久在线观看| 成人韩免费网站| 五月激情婷婷综合| 精品在线免费播放| 亚洲成a人片77777在线播放 | 国产乱人伦偷精品视频AAA| 91麻豆精品国产91久久久久| 亚洲男人在线| 午夜性爽视频男人的天堂| 五月激激激综合网色播免费| 久久99国产视频| 伊人久久婷婷| 免费观看亚洲人成网站| 亚洲成在人线av品善网好看| 高清无码一本到东京热| 久久综合丝袜日本网| 国产高清自拍视频| 亚洲欧美自拍视频| 任我操在线视频| 亚洲区第一页| 成人福利免费在线观看| 中文字幕有乳无码| 六月婷婷激情综合| 国产在线拍偷自揄拍精品| 国产福利免费观看| 欧美精品啪啪一区二区三区| 国产黄色免费看| 色偷偷男人的天堂亚洲av| 欧美精品亚洲二区| 国产成人高精品免费视频| 五月天天天色| 国产福利观看| 怡春院欧美一区二区三区免费| 青草视频在线观看国产| 91伊人国产| 毛片在线看网站| 亚洲国产高清精品线久久| 国产精品偷伦视频免费观看国产|