999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于BDI的語義搜索及其在數字旅游中的應用

2016-09-08 10:41:34李銀勝沈劍平
計算機應用與軟件 2016年8期
關鍵詞:語義特征旅游

陳 昊 李銀勝 沈劍平

(復旦大學軟件學院 上海 201203) (電子商務交易技術國家工程實驗室 上海 201203)

?

基于BDI的語義搜索及其在數字旅游中的應用

陳昊李銀勝沈劍平

(復旦大學軟件學院上海 201203) (電子商務交易技術國家工程實驗室上海 201203)

目前的上下文處理方法對語義技術支持不足,導致語義搜索在精準度和智能化上存在局限。提出一種基于BDI(Belief-Desire-Intention)的語義搜索方法,對動態上下文進行語義描述,利用BDI機制優化搜索結果。該方法將用戶查詢、動態上下文與BDI框架的Belief融合,通過產品特征語義、業務語義推理上下文特征和搜索目標特征作為Desire,通過基于MinHash的語義相似度計算進行候選Intention排序。結合項目需求,在JADEX開源BDI Agent環境下,開發了基于上述語義搜索的旅游產品搜索系統。該系統通過ID3決策樹提取用戶當前行程的上下文特征實現了語義搜索功能,實驗表明該方法搜索準確率相比僅使用語義相似度搜索方法明顯提高,能夠滿足旅游產品搜索的要求。

BDI語義搜索上下文

0 引 言

CNNIC的統計數據表明,截至2014年6月,我國搜索用戶規模達5.07億,較2013年12月增長1783萬人,用戶對搜索個性化、智能化的搜索需求增加[1]。電子商務發展使各行各業向互聯網轉型,傳統信息檢索系統由于對上下文考慮不足,面對各種不同應用場景時,準確度難以有較大提高。例如在旅游領域,游客安排行程時考慮因素復雜,需要在電商網站分析比對各種產品信息,由于缺乏上下文支持,較難獲得個性化的搜索結果,用戶需耗費大量精靈尋找滿足行程需求的產品。

目前互聯網上常見的全文搜索引擎與電商平臺的搜索功能中,均有語義技術應用。全文搜索引擎一般使用文本模型如概率模型、語言模型進行建模,結合知識圖譜技術實現更精準的搜索[3,4];電商網站如淘寶、京東等,面向領域,使用文本模型、反作弊模型、服務質量模型等進行多層次篩選。語義技術從傳統的概念匹配、歧義消解[5,6],到現在更多與信息檢索緊密結合,用于解決日益嚴重的信息過載問題。

為提供良好用戶體驗,語義搜索需要上下文處理技術的支持,而目前相關應用存在以下局限:1)語義搜索類應用對上下文考慮不足,尚未與上下文緊密結合;2)查詢歷史、用戶信息等靜態資源作為搜索上下文,使用離線分析解決智能化問題導致實時性較低;3)使用業務規則的方法在處理業務復雜的場景如旅游產品搜索時規則庫構造復雜難以維護。

本文結合筆者參與的旅游集散網(Travelhub.cn)項目,在用戶搜索過程中,需要根據用戶行程單中已添加的行程安排,提供個性化的旅游產品搜索結果。考慮到傳統方法的不足之處,本文提出了一種基于BDI的語義搜索方法,該方法使用JADEX[2]開源BDI Agent環境,從產品特征語義,業務語義出發構建語義詞典,結合動態上下文推理搜索目標,將MinHash語義相似度用于選項匹配。本文實現了針對旅游產品的語義搜索原型系統。該系統使用ID3決策樹多維度動態提取搜索上下文特征,改進語義搜索對實時、動態的上下文支持,提高精準度和智能化程度。

1 相關工作

語義搜索需要上下文處理技術的支持以提高用戶體驗。上下文從來源上可區分為三類,用戶上下文,資源上下文和系統上下文[7]。用戶上下文指用戶本身信息及其在檢索過程中隱含的信息;資源上下文指選項本身包含的上下文信息,例如網頁中的超鏈接等。系統上下文指系統所采用的檢索模型,檢索界面等。對這些上下文信息的處理方法主要有以下幾類:

1) 規則推理方法

該方法通過顯式反饋,偽反饋收集上下文信息,如用戶在搜索過程中,系統向用戶提出問題,或由用戶主動設定上下文,如淘寶等網站中在搜索商品時可自行設置搜索的情景、偏好等,作為搜索權重調整依據。相關應用可以獲取最準確的上下文信息,但無法為用戶提供簡潔的體驗。另外規則條件需要構造專家知識庫,維護工作量大。

2) 機器學習方法

此類方法一般通過隱式反饋收集上下文信息,如面向用戶上下文的方法,如點擊流反饋模型[8],啟發式二元投票模型[9],相關應用有基于Oracle Spatial空間數據和MapXtreme的個性化行程定制[11]等,缺點是對數據記錄進行離線分析導致對動態上下文信息支持不足;另一類面向資源上下文,如在網頁對象排序中將網頁對象本身屬性作為上下文,如基于超鏈接分析的HITS算法[10]等,缺點是算法根據特定選項類型構造,通用性不足。相比前者,機器學習方法具有更好的用戶體驗,但相關應用在處理上下文時,對上下文的動態性、實時性考慮不足。

3) Agent方法

Agent方法利用了Agent架構本身的自治性、社會性、反映性、能動性特點,如文獻[12]將基于Agent的將語義搜索應用于UDDI中的Web服務發現,但未考慮上下文。Agent架構繁多,文獻[13]中提出了使用BDI架構的Agent建模方法。文獻[14]在此基礎上,構建了一種BDI Agent平臺的運行框架。目前該框架已有多種實現,如JADEX等。BDI框架的應用通常適用于根據外界環境變化觸發動作,來完成指定的目標。如文獻[15]實現了一個基于BDI的旅游個人助理Agent,根據處理用戶在旅游行程中的位置變化個性化搜索結果,文獻[16]利用BDI推理框架將用戶模型作為上下文,通過AHP層次分析法實現了基于用戶模型的產品推薦。BDI Agent架構設計使得其在適合用于處理動態上下文,但主要基于傳統搜索的混合加權,與語義技術結合尚不緊密,有待完善。

總結以上三類方法,其優缺點如表1所示。

表1 上下文處理技術優缺點總結

為改善現有語義搜索技術中上下文處理方法的動態性、實時性,本文參考Agent方法,以及其中的BDI架構,設計了一種基于BDI的語義搜索方法。將該方法用于BDI推理中的Belief生成,Desire推理,Intention匹配計算,并實現了面向旅游產品語義搜索的應用,在利用語義匹配較好精準度同時,能夠適應行程的動態上下文需求。

2 基于BDI的語義搜索方法

2.1BDI基礎架構

BDI架構包含三個主要概念,Belief(信念),即Agent具有的上下文信息,資源信息的集合。Desire(期望),即Agent期望達到或保持的狀態。Intention(意圖),基于BDI架構的Agent通過執行Intention來接近或達到Desire的狀態。

Belief包含用戶查詢,選項數據和外部上下文數據。搜索上下文變化,用戶查詢輸入均會導致Belief的更新,查詢輸入觸發事件,引起BDI Agent內部狀態變化,Agent將根據Belief生成Desire。在Desire的執行和推理過程中,需要通過可執行動作的Intention權重來選取適當的動作執行。

BDI Agent執行的基本流程如圖1所示。

圖1 BDI Agent執行流程

圖1分為以下三個主要環節:1)用戶發起查詢后,BDI Agent首先需要根據用戶輸入的內容與上下文信息,更新Belief內容,如用戶查詢的特征詞、用戶上下文的內容等;2)更新內容結合Belief中已有的領域語義詞典、候選項特征,生成Desire,即用戶期望的選項特征;3)根據該特征,執行語義搜索,計算Intention與Desire間的語義相似度,得到最符合用戶Desire的Intention,執行并向用戶展示結果。

下文將介紹在環節1中的Belief構造和更新方式,環節2中使用Belief內容生成Desire的方法和環節3中Intention語義搜索的相似度權重計算。

2.2Belief構造與更新

Belief含義為Agent對世界和自身的認識,Agent的Belief包含三個部分:

1) 會話上下文數據用戶的每次會話包含了查詢目標,可能關聯多次查詢。以查找旅游產品為例,用戶可能先輸入由地理位置形容的關鍵詞“附近的餐飲”,再補充輸入產品的類別信息“高端”等,可自動將產品類別限制為“餐飲”,提高檢索效率。

2) 產品數據及其領域語義詞典產品數據中的產品特征將用于后期Intention的權重計算。例如產品的種類、特點、關鍵概念等。語義詞典則用于消除特征中的歧義,實現語義化的搜索。本文構建的旅游領域語義詞典使用TF-IDF,對排除停止詞后的語料提取旅游產品描述中的關鍵概念。在此基礎上,選取屬于旅游產品領域詞典子集的高頻詞作為旅游產品特征。

3) 外部上下文數據外部上下文數據將用于業務規則的觸發,例如旅游場景中,當前已選擇的旅游產品、天氣、地理位置等。上下文數據提取方法根據適用場景有所區別,提取出的外部上下文的特征作為選項匹配的依據之一。

Belief有以下兩種更新方式:

1) 用戶行為更新按用戶輸入更新會話上下文數據和高實時性的外部上下文數據。

2) 后臺異步更新考慮實現階段的性能問題,對性能要求高,實時性要求低的數據,如旅游產品數據的領域語義詞典和旅游產品概念的提取,采取后臺更新的策略,Agent不會主動感知Belief的更新。當用戶發起新查詢時,Agent會使用最新版本的數據進行推理。

2.3Desire生成策略

Desire含義為Agent需求目標,即對搜索目標的具體特征要求。在旅游場景中,Desire即為用戶期望產品的特征,這些特征從用戶的查詢中獲取。Desire依據業務規則的推理結果和用戶輸入生成。Desire最終表達為一組語義特征集合,用于Intention傾向的計算。

Desire生成方法如下:

1) 基于用戶查詢內容對用戶查詢內容進行分詞后,提取其中的有效特征,直接作為Desire中的語義特征集合。

2) 基于上下文信息例如用戶的行程選擇反映了其旅行目的等因素。上下文信息的使用方法眾多,受上下文信息種類的約束。如文獻[15]在構建上下文信息時以地理位置等信息構建。文獻[16]以用戶模型作為上下文。為保證上下文的全面性,Desire的推理方法是可擴展的。本文的后續實現基于旅游場景,考慮到旅游行程的連續性、動態性特點,通過選取具有類似特征但尚未選擇的產品作為搜索的上下文,可在多維度上使用決策樹進行分類,將ID3決策樹規則作為上下文特征的生成依據。

生成語義特征后,將合并特征并使用語義詞典的關系,如同義關系等,消除特征歧義,形成本次查詢的Desire。

2.4Intention權重計算

在Desire生成完成后,對每個待計算Intention的行為,其排序依據Desire中的語義特征集合使用基于特征相似度的算法計算相似度作為其Intention權重。

計算特征相似度的方法主要有基于空間向量模型的歐氏距離,余弦相似度,基于哈希的MinHash,漢明距離等方法,以及基于主題相似度的LAS、PLSA等方法[17]。搜索是一種在線的、同步的動作,具有較高實時性要求,因此選擇能快速批量估算多個集合相似度的MinHash算法。

定于語義詞典為特征全集C,特定產品特征為Cs,Desire中包含了一組由用戶查詢和上下文信息得出的期望特征組的集合Sd={C1,C2,…,Cn}。Intention需要計算對于每個產品實體的相似程度。MinHash方法基于Jaccard進行相似度計算原理,當兩個集合重復度越高,Jaccard越趨向于1。MinHash則使用隨機抽樣方法估算集合交集概率,將C1,C2,…,Cn與Cs所含集合映射到特征項[t1-tn]之間,其中t1,t2,…,tn∈C,隨機選擇[t1-tn]的一個排列組合,Tn∈Cx則此行標記為1,否則標記為0,依次查找第一次出現的行。矩陣取值公式如下:

(1)

表2為C1{t1,t4,…},C2{t1,t2,t4,…},C3{t3,…},C4{t4,…}時的示例。

表2 基于MinHash的產品特征相似度計算示例

對于C1列,根據第一次出現1的列數作進行哈希,得到h1(C1)=0,h1(C2)=0,h1(C3)=2,h1(C4)=3。通過多次抽取隨機排列得到N個MinHash函數h1,h2,…,hn,依此對每一列都計算N個MinHash值。對于兩個集合,根據N個哈希值中相等的比例,即可估計出兩集合的Jaccard相似度如下:

(2)

其中:

(3)

該方法通常可以一次進行多個產品實體特征的計算,而旨在選項數量較多時,所有產品Cd并集的維度數要小于產品實體特征Cs個數,因此可同時降低空間復雜度和時間復雜度,提高效率。傾向計算完成后,將執行按相似度高低順序返回選項的動作,滿足Desire要求。

3 基于BDI的旅游產品語義搜索Agent實現

3.1系統總體架構

本文系統實現依托于旅游集散網(Travelhub.cn)數字旅游平臺。該數字旅游平臺是一個基于面向服務架構的協同平臺,支持旅游產品的智能推薦和搜索,其移動客戶端支持用戶自由將各類產品組成行程單,因此需要在用戶搜索時分析上下文,給出合適的旅游產品,提升用戶體驗。

結合項目需求,本文基于一種BDI Agent的Java實現JADEX,將語義搜索應用于該項目的旅游產品搜索中,并以行程單中的當前已安排行程作為語義搜索上下文。JADEX與BDI架構中的Belief-Desire-Intention表述略有區別,BDI中的Belief,Desire和Intention分別對JADEX中的Belief,Goal和Plan。Agent會根據外部變化會觸發動作,通過選取執行Plan來達成Goal。

基于BDI的語義搜索系統總體架構如圖2所示。

圖2 總體架構圖

其中數據層包括內存中的會話級別生命周期的上下文數據和數據庫中的持久化的旅游產品數據,旅游產品數據需要通過文本特征提取生成每個產品的特征,并使用語義詞典消除歧義。JADEX推理框架的Belief,Goal和Plan直接訪問數據庫或內存中的上下文數據。

業務層主要為JADEX推理框架,特征提取部分用于生成語義詞典,并根據旅游產品的文本描述和屬性提取特征詞,進行離線預處理。JADEX框架則使用ID3提取上下文的特征詞,與用戶輸入結合,進行MinHash相似度的Plan篩選和執行。

展現層主要基于Phone Gap實現的HTML5移動端界面,用于記錄用戶已選行程單,展示搜索結果。

在本文設計的BDI Agent搜索應用,根據用戶當前已加入行程單產品和搜索歷史作為上下文,提取行程特征,結合用戶輸入智能選取合理的旅游產品。語義搜索其執行流程如圖3所示。

圖3 JADEX執行流程

在執行上述流程前,首先需要進行語義詞典和產品特征的預處理。在預處理完成后,搜索執行時首先依賴上下文模塊將搜索上下文更新至Agent的Belief,并推理出目標特征存入Goal中,最后執行Plan的匹配與篩選。

3.2語義詞典與產品特征預處理

旅游產品的語義搜索依賴領域語義詞典,旅游領域語義詞典通過對旅游產品的特征進行提取獲得特征詞。通過關系詞典,如同義詞典等為特征詞增加關系。

旅游產品語義特征數據源來自:

1) 旅游產品屬性,如酒店的星級分類、景區的類型等。

2) 產品描述描的文本特征。產品描述特征提取主要流程如圖4所示。

圖4 產品特征提取主要流程

本文使用中文語法分詞器IK Analyzer[19]處理產品描述的中文分詞。該分詞器支持分詞歧義排除功能和自定義拓展次,停用詞庫,適用于定制特定領域的分詞詞庫。

分詞完成后,使用TF-IDF提取產品描述特征詞。本文選取了各類旅游產品中銷量較高的產品作為語料庫,用于IDF值計算,將特征詞前K個最高TF-IDF值的作為產品的語義特征,由于存在停用詞不完整等問題,TF-IDF得到的分詞結果需要人工確認后才能在語義詞典中啟用。旅游產品語義特征中包含了TF-IDF值,用于后續可能存在的歧義消解。每個特征詞對應一個GUID。

通常語義詞典中包含的關系有同義、反義、部分、屬于等。考慮到旅游產品搜索業務特點,同義詞關系可減少特征相似度計算時的誤差,屬于關系需用于上下文傾向推理時的維度生成。因此本文向詞典概念之間增加了同義,屬于兩類關系:

1) 同義關系的概念組合為概念簇,本文借助中文辭海數據庫,將“同義”概念連接,并為每一個同義概念簇指定GUID,用于匹配時,在同義詞簇中的概念使用GUID表示。

2) 屬于概念通過屬于關系關聯,作為上下文傾向推理時的決策維度。屬于概念參考旅游行程設計時的考慮因素,手工添加,詳細說明見基于決策樹的上下文傾向推理。

語義詞典、產品特征耗時較長,需要首先完成初始化,Agent啟動后可直接使用這些數據進行Goal期望特征生成與Plan的語義匹配。

3.3上下文語義特征解析

系統將用戶行程安排作為用戶檢索的上下文,作為Agent的Belief。上下文從應用的行程單下獲取,行程中包含用戶已添加的旅游產品,以及在將產品加入行程單同時未選擇的產品,隱含本次行程的各種特點,使用決策樹的方式對旅游行程特征進行提取。對生成的決策樹,轉換為條件表達方式,作為檢索依據。上下文傾向特征生成是一個上下文-行程特征-產品特征的轉換過程。

決策樹訓練集包括兩部分:1) 行程單中的已選擇產品,chosen屬性標記為TRUE;2) 加入行程單時搜索結果中的未選擇產品,chosen屬性標記為FALSE。因檢索過程是同步的,本文依據旅游行程制定時的考慮因素,將“屬于”概念的根結點分為價格維度、時間維度、地理維度、特征維度、交通維度、與語義詞典中的概念或概念簇手動分類。如價格維度下使用了“奢華”同義詞概念簇、“經濟”同義詞概念簇等;地理維度使用語義詞典中來自產品“所在地”屬性的概念。如表3所示。

表3 旅游行程的特征維度及其示例

以在行程單中搜索一處景點為例,其行程單中其他景點及其未選擇景點的特征可從行程的其他已選和隱式的未選擇實例使用ID3決策樹訓練,以此作為Goal權重的計算依據。如圖5所示。

圖5 上下文決策樹生成

在選擇結果為TRUE的葉節點上,可以得到如價格、時間、地理、特征、交通五個維度的值。所有為TRUE的葉節點可組合為一組用于JADEX推理執行的Goal目標特征。若K為決策樹的TRUE葉節點數,則會生成K種目標概念。如在該結果下,上下文相關的特征為:

1) [簇2{經濟…},概念{上海},概念{古鎮}];

2) [簇2{經濟…},概念{上海},概念{文化}]。

依據該特征組,即可與旅游產品特征進行第2.4節中所述的MinHash的相似度計算,用于Agent搜索執行過程中的Plan匹配和執行。

3.4語義搜索執行

用戶發起查詢后,使用IK Analyzer對查詢進行分詞和特征化,作為觸發Agent狀態改變的事件。同一會話的查詢會記入Agent的Desire中,用于生成此次查詢的目標概念。例如用戶在查詢中增加“豪華”詞項后,如果沒有指明產品類別,系統將嘗試從Desire中追溯此次會話可能指代的產品類別,查詢的構造將作為Goal更新的依據。

基于JADEX平臺的Agent需要初始化自身的Belief,加載產品數據和語義詞典,執行期間動態更新上下文數據及其特征。JADEX平臺可通過Java 注解配置Agent的Belief、Goal和Plan的配置。其中不同Goal類型如表4所示。

表4 JADEX中Goal的分類及含義[2]

同一行程下的用戶查詢會綁定一個會話ID,每個Agent對應一個會話,設定超時時間,非活動的Agent會定期銷毀,降低內存負擔。新啟動的Agent將生成一個與之對應的頂層Achieve Goal。對于旅游產品搜索應用中的每一個頂級Achieve Goal,其目標在于檢索出與用戶查詢特征最相似的N個產品。頂級Achieve Goal下,關聯了以下Goal和Plan:1) Maintain Goal用于維持當前查詢的產品類型,根據會話信息增加例如查詢產品種類限制,提高檢索效率;2) 抽象查詢Plan,執行動作為查詢旅游產品Plan;3) 產品Plan,每個產品Plan對應一個產品,執行動作為返回其對應的旅游產品。檢索旅游產品Plan的方法使用基于MinHash的語義特征相似度。考慮性能問題,使用語義特征相似度方法計算時,降低了產品數量維度數,減少相似度計算時間消耗。

4 實驗與評價

本文實現的基于BDI的旅游產品語義搜索將用戶加入行程單中的產品,即當前行程安排作為上下文,可以獲得更適應上下文的搜索結果。為驗證有效性,本文參考文獻[18]總結的搜索評價指標,從前K項準確率、召回率等進行對比,并結合實驗結果和本文方法流程特點進行分析總結。

本文使用模擬用戶的實驗方法,數據來源如下:

1) 旅游產品數據來自旅游集散網(Travelhub.cn)。

2) 標準行程來自馬蜂窩(Mafengwo.cn)等旅游攻略網站。

其中各類旅游產品數據總量27 676項,標準行程收集5組。本文將行程單內容與旅游產品數據ID匹配,隨機選取行程單產品的特征詞,模擬構造了10組查詢項,將搜索到的“可接受”產品作為準確結果。上下文的構建則隨機選取行程中的其他旅游產品及其“忽略”產品用于ID3上下文特征決策樹訓練。通過真實的標準行程構造模擬用戶搜索上下文,對搜索的準確率、召回率進行測試,步驟如下:

1) 收集行程單。將特定行程點上標準旅游產品的可替代產品記為“可接受”產品。其中可替代旅游產品限制為與標準旅游產品特征項Jaccard相似度大于0.3,旅游產品所在地距離不超過30公里。其他30公里內的同類產品記為“忽略”產品,用于模擬上下文。

2) 分別使用基于Jaccard相似度的語義搜索和使用BDI Agent的方法中下文的語義搜索進行查詢。本文將對比傳統Jaccard的相似度與BDI Agent方法。

3) 根據特定的行程,分析前K項搜索結果,屬于“可接受”產品的作為準確結果。

由于用戶對排序靠前的搜索結果更關心,本文對K=15時的檢索結果進行比對分析,考慮到查詢項對準確率召回率存在影響,取每組查詢項的最好結果,見表5所示。

表5 基于Jaccard相似度和基于BDI Agent搜索結果比對

續表5

根據以上結果,下文將從兩個角度分析本文所實現的BDI語義搜索Agent:1)從實驗結果分析傳統語義搜索和上下文增強的BDI語義搜索實際效果;2)從流程上分析BDI語義搜索和傳統上下文處理方法的區別和優勢。

從實驗結果來看,在K=15時,基于BDI的語義搜索相比傳統語義搜索在大多數情況下具有更高的準確率和召回率。因此通過動態上下文語義,基于BDI的語義搜索可改善產品傳統語義搜索的準確率和召回率。

從流程上來看,基于BDI的語義搜索通過用戶搜索旅游產品過程中,行程單中的記錄項目的上下文內容實時生成Desire特征,相比規則推理的方法,動態生成Desire而不依賴用戶顯式輸入和大量規則庫,具有較好的體驗,便于維護。相比基于機器學習的上下文處理方法,由于上下文數據量不大,可以用于ID3決策樹的實時運算,動態性好;由于基于用戶對行程搜索項的選擇結果,上下文的來源具有針對性;相比其他BDI Agent方法,本文方法使用BDI增強了語義搜索,結合語義詞典消歧和MinHash相似度估算方法,不再局限于低維度的權重匹配,與語義技術緊密結合。

總體來看,BDI語義搜索相比其他方法,將動態上下文和語義搜索緊密結合,改善了語義搜索對動態上下文的支持,提高了精準度。

5 結 語

傳統上下文處理技術對動態上下文支持不夠,較難與語義搜索在不同動態上下文場景下緊密結合,以滿足用戶對搜索體驗的智能化需求。

本文結合筆者參與的數字旅游項目需求,提出的基于BDI的語義搜索方法。該方法對傳統語義搜索加以改進,使用BDI Agent實現適用于動態上下文的語義搜索。該方法將檢索內容與動態上下文作為Agent的Belief,使用語義詞典,從語義和業務維度出發,推理上下文特征和檢索目標作為 Desire,以MinHash語義相似度計算作為Intention選擇依據進行語義搜索。本文基于一種開源BDI Agent實現JADEX,開發了基于BDI語義搜索的旅游產品語義搜索模塊。考慮旅游產品的業務特點,將旅游行程安排作為動態上下文,通過語義相似度匹配旅游產品,實驗表明搜索準確率相比僅使用語義相關性搜索方法明顯提高,且利用BDI Agent架構特點改善了傳統上下文處理方法對語義技術和上下文動態性支持不足的問題,具有應用意義。

后續工作中,我們將補充完善上下文內容和領域語義詞典,針對其他業務規則因素進行擴展,如旅游中的天氣因素,季節因素,以及行程的路徑規劃等,使BDI的語義搜索能更智能地融入數字旅游應用中。

[1] CNNIC. 中國互聯網絡發展狀況統計報告[R]. 2014.

[2] Lars Braubach. JADEX Overview [EB/OL]. [2014-06-23]. http://www.activecomponents.org/bin/view/Documentation/Overview.

[3] Sullivan D. Google Launches Knowledge Graph to Provide Answers, Not Just Links [EB/OL]. [2013-04-20]. http://searchengineland.com/google-launches-knowledge-graph-121585.

[4] Paiva S, Ramos-Cabrer M, Gil-Solla A. GSSP-A generic Semantic Search Platform[J]. Procedia Technology, 2012, 5(1):388-396.

[5] Jihyun Lee, Jeong Hoon Park, Myung Jae Park, et al. An Intelligent Query Processing for Distributed Ontologies[J].The Journal of Systems & Software, 2009, 83(1):85-95.

[6] Anthony Ha. Kngine Aims To Build A Natural Language-Driven App That Can Answer Any Question[EB/OL]. [2012-11-30]. http://techcrunch.com/2012/11/30/kngine/.

[7] 田萱, 李冬梅. 上下文檢索研究綜述[J]. 計算機科學, 2011,38(9):18-24.

[8] Shen X, Tan B, Zhai C. Implicit User Modeling for Personalized Search[C]//Proceedings of the 14thACM International Conference on Information and Knowledge Management, 2005:824-831.

[9] White R W, Jose J M, Ruthven I. An Implicit Feedback Approach for Interactive Information Retrieval[J]. Information Processing and Management, 2004, 42(1):166-190.

[10] 馬瑞新, 鄧貴仕, 王曉. 基于擴散理論的HITS算法在Web挖掘中的研究與優化[J]. 計算機應用研究, 2012, 29(1):145-147.

[11] 林俊, 杜軍平. 智能旅游行程導航系統[J]. 計算機應用,2009, 29(1):369-371.

[12] Celik D, Elgi A, A Semantic Search Agent Approach: Finding Appropriate Semantic Web Services based on User Request Term[C]//Proceedings of ITI 3rdInternational Conference on Information and Communications Technology, 2005:675-687.

[13] Anand S Rao, Michael P Georgeff. Modeling Rational Agents within a BDI-Architecture[C]//Proceedings of the 2ndInternational Conference on Principles of Knowledge Representation and Reasoning, 1991:473-484.

[14] Anand S Rao, Michael P George. BDI Agents: From Theory to Practice[C]//Proceedings of the 1stInternational Conference on Multi-Agent Systems, 1995:312-319.

[15] Ana Casali, Llu′is Godo. Modeling Travel Assistant Agents: a Graded BDI Approach[J]. Artificial Intelligence in Theory and Practice, 2006, 217(1):415-424.

[16] 周豐. 面向需求的用戶建模及服務推薦研究[D]. 上海. 復旦大學,2014.

[17] 孫海霞, 錢慶, 成穎. 基于本體的語義相似度計算方法研究綜述[J].現代圖書情報技術, 2010,26(1):51-56.

[18] Stefan Buttcher, Charles L A Clarke, Gordon V Cormack. Information Retrieval, Implementation and Evaluation Search Engines [M]. China Machine Press, 2012.

[19] 林良益. 中文分詞庫IK Analyzer[EB/OL]. [2015-01-21].http://www.oschina.net/p/ikanalyzer/.

BDI-BASED SEMANTIC SEARCH AND ITS APPLICATIONS IN E-TOURISM

Chen HaoLi YinshengShen Jianping

(SchoolofSoftware,FudanUniversity,Shanghai201203,China) (NationalEngineeringLabofEcommerceTechnologies,Shanghai201203,China)

Current context processing method does not support semantic technology very well, this leads to the limits of semantic search in both accuracy and intelligence. In this paper, we propose a BDI-based semantic search approach, it makes semantic description on dynamic context and uses BDI mechanism to optimise search results. The approach integrates user’s query and dynamic contexts with Belief in BDI framework, reasons the context features through products feature semantics and business semantics, and searches objects features as agent’s Desire, finally it calculates the candidate Intention order through MinHash-based semantic similarity. In combination with the requirement of project, we develop the search system of tourism products in environment of open source BDI Agent of JADEX engine, the system is based on the above mentioned semantic search. Through ID3 decision tree the system extracts context features of current itinerary of users to implement the semantic search function. Experiment shows that the search accuracy of the approach improved significantly relative to the search methods only using semantic similarity, it can satisfy the demand of tourism products search.

Belief-desire-intention (BDI)Semantic searchContext

2015-03-15。國家科技支撐計劃項目(2012BAH18F06)。陳昊,碩士生,主研領域:電子商務。李銀勝,副教授。沈劍平,博士生。

TP3

A

10.3969/j.issn.1000-386x.2016.08.007

猜你喜歡
語義特征旅游
語言與語義
如何表達“特征”
不忠誠的四個特征
當代陜西(2019年10期)2019-06-03 10:12:04
抓住特征巧觀察
旅游
“上”與“下”語義的不對稱性及其認知闡釋
現代語文(2016年21期)2016-05-25 13:13:44
認知范疇模糊與語義模糊
旅游的最后一天
線性代數的應用特征
河南科技(2014年23期)2014-02-27 14:19:15
出國旅游的42個表達
海外英語(2013年8期)2013-11-22 09:16:04
主站蜘蛛池模板: 免费午夜无码18禁无码影院| 日韩精品专区免费无码aⅴ| 亚洲精品福利视频| 99视频在线精品免费观看6| 毛片一区二区在线看| 久久婷婷国产综合尤物精品| 亚洲国产成人综合精品2020| 亚洲国产欧美目韩成人综合| 久99久热只有精品国产15| 99中文字幕亚洲一区二区| AV网站中文| 色综合久久88| 成人毛片免费在线观看| 1769国产精品免费视频| 亚洲国产天堂在线观看| 亚洲第一在线播放| 国产在线一区视频| 亚卅精品无码久久毛片乌克兰| 亚洲无码高清视频在线观看 | 草逼视频国产| 国产精品无码作爱| 狠狠做深爱婷婷综合一区| 国产不卡网| 四虎成人精品在永久免费| 韩国自拍偷自拍亚洲精品| 无码一区18禁| 极品av一区二区| 久久中文字幕2021精品| 国产va免费精品观看| 91九色国产porny| 一本大道无码高清| 最新精品久久精品| 亚洲人在线| 久草青青在线视频| 久久无码av三级| a级免费视频| 22sihu国产精品视频影视资讯| 国内99精品激情视频精品| 黄色片中文字幕| 欧美自慰一级看片免费| 日本午夜网站| 在线观看亚洲精品福利片| 精品91自产拍在线| 在线免费观看AV| 免费看的一级毛片| 欧美亚洲第一页| 尤物国产在线| 在线中文字幕网| 手机精品福利在线观看| 日本不卡视频在线| 亚洲欧洲综合| 中文字幕无码电影| 无码人妻免费| 国产区人妖精品人妖精品视频| 综合亚洲网| 欧美一级夜夜爽www| 亚洲无码久久久久| 久久精品国产91久久综合麻豆自制| 国产91无码福利在线| 欧美在线综合视频| 欧美区一区| 亚洲无码视频一区二区三区| 亚洲综合色区在线播放2019| 国产91麻豆视频| 亚洲伊人久久精品影院| 日韩精品毛片人妻AV不卡| 亚洲第一成人在线| 国产真实乱子伦精品视手机观看 | 亚洲日韩精品综合在线一区二区| 国产精品视频观看裸模| 亚洲国产高清精品线久久| 天天摸夜夜操| 毛片在线看网站| 就去色综合| 久久一日本道色综合久久| 欧美性天天| 国产精品区网红主播在线观看| 亚洲另类国产欧美一区二区| 欧美日一级片| 亚洲第一福利视频导航| 日韩黄色大片免费看| 无码免费视频|