999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

一種改進的CBR案例檢索相似性度量模型

2011-12-31 00:00:00谷淑娟高學東孫冉
中國管理信息化 2011年9期

[摘 要] 案例相似性度量是基于案例推理(CBR)的突發事件應急決策管理的關鍵問題。本文基于最近鄰算法,提出一種改進的案例相似性度量模型。提出“結構相似度”度量缺失數據對于案例結構特征相似性的影響,引入“變異系數”度量案例屬性的可替代性,精確描述替代程度不同的屬性對于案例相似性的貢獻。最后通過具體案例檢索實例驗證了該模型的有效性。

[關鍵詞] 應急決策; 基于案例推理; 案例檢索; 相似性度量

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2011 . 09 . 013

[中圖分類號]TP18;TP315 [文獻標識碼]A [文章編號]1673 - 0194(2011)09- 0050 - 06

1引言

案例推理(Case-Based Reasoning, CBR)技術廣泛應用于突發事件應急決策,可結合歷史相似案例的經驗知識解決現有問題,有效降低知識獲取難度,并通過不斷加入新案例進行自主學習,適合于知識難以獲取但已積累了豐富案例經驗的諸多復雜領域[1]。

基于案例推理的應急決策模型可劃分為案例檢索、案例重用、案例修正和案例保存等4個階段[2]。案例檢索是其中的關鍵步驟,目的是根據目標案例的特征描述,從案例庫中查找與之最相似的案例,常用案例檢索方法為最近鄰法。實際應用中案例庫數據類型多變,屬性間關系復雜,多出現屬性值缺失現象,需針對這些現象構造合理的案例相似性度量模型。

案例相似性度量模型包括屬性局部相似性和案例全局相似性。屬性局部相似性指案例在各屬性上的相似性,應急案例屬性數值類型可分為連續型、分類型、模糊數或模糊區間型等,需根據不同數據類型規定相應的屬性局部相似性度量。其中針對模糊數及模糊區間型數據進行相似性度量是難點問題,人們通常采用區間平均相似度[3,4]、長度面積重疊率[5]、義類詞典[6]等對其進行相似性度量。

案例全局相似性綜合考慮各屬性局部相似性、屬性權重等要素,是案例檢索的根本依據。應急案例常見的全局相似性(差異度)度量為屬性局部相似性(差異度)的加權值,如加權Euclidean距離,加權Hamming距離等[7]。此外,也有學者將粗糙集[8]、模糊數及語義距離[9]、神經網絡[10]等技術引入案例全局相似度計算中。這些相似性度量模型均假設描述案例的各屬性相互可替代,且未考慮缺失值屬性對案例結構特征相似性的影響。

本文首先介紹基于最近鄰算法的案例檢索方法,隨后提出一種改進的案例全局相似性度量模型,精確描述缺失數據及屬性替代關系對于案例全局相似性的貢獻,最后以洪澇災害實例驗證新度量模型的有效性。

2基于最近鄰的案例檢索方法

K最近鄰(K-Nearest Neighbor Algorithm,KNN)算法是最常用的CBR案例檢索方法。它將案例的特征矢量看作高維空間中的點,然后在問題空間中尋找與目標案例相匹配的點,將超過相似度閾值的案例返還給用戶,其一般過程描述如下[11]:

3改進的案例相似性度量模型

在基于最近鄰算法的突發事件案例檢索過程中,案例通常具有數據類型多樣、缺失數據較多、屬性間關系復雜等特點。傳統案例相似性度量模型已針對不同數據類型,設計了不同的屬性局部相似性度量方法,但均未充分考慮缺失數據及屬性關系對案例間相似性的影響。

傳統案例相似性度量模型通常將缺失數據的屬性剔除,使其不參與案例相似度的計算。這種處理方式改變了案例屬性的結構特征,剔除權重較高與較低的屬性對于案例全局相似度的有效性顯然具有不同的影響。此外,傳統案例相似性度量模型假設屬性間相互獨立,屬性間可相互替代,但在實際應用中屬性間往往不可相互替代,或在一定范圍內存在非線性替代關系。例如一件質料優秀但樣式很差的衣服對于消費者的吸引力不會強于一件質料良好且樣式良好的衣服,即質料的優秀并不能彌補樣式上的缺憾。

3.1改進的案例相似性度量模型定義

目標案例T與案例庫中源案例R,由m個屬性描述,即T = {t1,t2,…,tm},R = {r1,r2,…,rm},各屬性權重為w(j),j = 1,2,…,m,則T與R間改進的案例相似性度量SIMnew(T,R)可定義為:

其中,ωt,r表示案例T與案例R的結構相似度,描述了缺失數據對于相似度的影響程度,αt,r表示案例T與案例R的屬性可替代程度,sim(tj,rj)表示案例T與案例R在屬性j上的局部相似度。

T與R間改進的案例相似度SIMnew(T,R)和屬性局部相似度sim(tj,rj)的取值范圍均為[0,1],取值越高說明目標案例T與源案例R間相似程度越高。

3.2改進的案例相似性度量模型解析

依據改進案例相似度的定義可知,改進案例相似度包含案例間結構相似度、屬性替代性度量、屬性局部相似性度量和屬性權重等4部分。

3.2.1結構相似度

目標案例T與案例庫中源案例R的結構相似度ωt,r計算過程如下:

(1) 計算案例T所有非空屬性集合,記為AT;

(2) 計算案例R所有非空屬性集合,記為AR;

(3) 計算AT與AR的交集和并集,分別記為IT,R和UT,R;

(4) 計算IT,R中所有屬性權重之和,記為ωI;

(5) 計算UT,R中所有屬性權重之和,記為ωU;

(6) 則案例T與R的結構相似度ωt,r定義為:

當案例T與R的屬性空間未出現缺失值時,結構相似度ωt,r為1;當缺失值出現在權重較高的屬性中時,計算案例相似度的有效性降低。結構相似度的作用在于將其客觀反映在案例相似度計算結果中。

3.2.2屬性替代性度量

衡量屬性間替代程度的重要途徑是考察屬性間的差異性,因此引入統計學中綜合反映總體各單位之間差異程度的指標——變異指標,用以量化屬性之間的可替代性。屬性間差異程度越大,說明屬性間越不易被替代。

目標案例T與案例庫中源案例R的可替代性程度計算公式為:

其中,αt,r為目標案例T與案例庫中源案例R屬性變異指標,Xt,r為案例T與R屬性局部相似度的平均值,σt,r為案例T與R加權形式下的屬性局部相似度均方差。

案例屬性差異程度越高,屬性間可替代程度越低,由這些屬性所描述的案例間相似度越低。

3.2.3屬性局部相似度

應急案例數據類型復雜多樣,案例T與R進行匹配時,需針對不同數據類型定義相應的屬性局部相似度。

(1) 連續型:連續型變量較為常見,例如產品單價、產品次品率等,其局部相似性度量定義為:

其中,tj,rj分別表示案例T和R在屬性j上的取值,α,β表示該屬性的取值上界和下界。

(2) 分類型:分類型變量取值離散,包括布爾型變量,例如產品類型,其局部相似性度量定義為:

sim(tj,rj) = 1 tj = rj0 tj≠rj (6)

(3) 模糊數型:模糊數包括三角模糊數、梯形模糊數、降半梯形模糊數等。例如,采購人員根據以往的采購情況,認為交貨提前期至少a1天,至多a4天,且在a2~a3天的可能性最大,可表示為梯形模糊數(a1,a2,a3,a4)。案例T和R在屬性j上的取值分別為tj = (tj,1,tj,2,tj,3,tj,4)和rj = (rj,1,rj,2,rj,3,rj,4),其局部相似性度量可定義為:

① 若tj,1≤tj,2≤tj,3≤tj,4≤1且rj,1≤rj,2≤rj,3≤rj,4≤1,可使用Chen提出的SCGM法,即:

② 若tj,1≤tj,2≤tj,3≤tj,4且rj,1≤rj,2≤rj,3≤rj,4,使用隸屬度平均積分代表法(Graded Mean Integration- representation Distance)來計算相似度:

sim(tj,rj) = (1 + P(tj) - P(rj))-1(8)

3.2.4屬性權重確定

本文利用結構方程,即驗證性因子分析的思想對案例屬性進行分析,并以計算所得的權重的絕對值作為屬性的權重。

4實例數值分析

4.1實例背景

本文應用防汛應急決策實例來說明改進案例相似性度量模型的有效性。案例庫中有10個防汛應急案例(見表1,C1~C10),由30個屬性(a1~a30)描述(屬性說明見表2)。 屬性空間中a1~a2描述案例基本信息,a3~a5描述案例類型信息,a6~a15為案例環境信息,a16~a30描述案例問題信息(略去庫中案例解決方案及決策評價信息)。

當前應急事件:安徽某市突降暴雨,風力等級為5,災害等級為III級,可控程度中等,已造成中等程度的損失,對水電和交通造成了影響。

結合當地相關歷史記錄,對于該事件進行形式化表示,得到目標案例T。案例T的類型、環境和問題信息(即a3~a30)分別為:{自然危害,洪澇危害,山洪暴雨洪澇,安徽,長江流域,中,雨,200~300,5,null,丘陵,中,null,暴雨,III, null, null, II, null,中,中,低,是,否,是, null, null, null }。

依據本文提出的案例間改進相似性度量,在案例庫中進行案例檢索,輸出與目標案例最相似的案例。

4.2實例數值實驗結果及分析

應用本文提出的改進案例相似度模型,計算目標案例T與源案例間的相似性。利用公式(5)~(8)計算目標案例與各源案例間的屬性局部相似度(見表3“C1~C10列”)。

本文應用結構方程確定各屬性權重,由于相似度計算涉及案例類型、環境、問題信息等28個屬性,其中類型、環境信息的屬性相同,即均為0.035 714,而問題信息的15個屬性權重則各不相同,運用結構方程模型分析軟件AMOS 17.0對結構方程進行500 + 65 500次迭代,得到權重結果見表3,結果收斂值(C.S.)為1.025 0,Gelman論證如果該值滿足1≤C.S.≤1.10,則可認為該模型是可接受的。

根據公式(4)計算案例間屬性替代性程度,根據公式(3)計算案例間結構相似度,計算結果見表3。目標案例中存在8個空缺值,但源案例中信息十分完整,因此目標案例與各源案例間結構相似度相同,均為0.802 22。

根據公式(2)計算目標案例與各源案例間的全局相似度,得到與目標案例最為相似的案例為C1,隨后可根據案例庫中所存儲的C1解決方案、決策結果評價等信息進行案例重用與修正。

5結論

本文針對基于CBR的應急決策模型中案例檢索問題,提出一種改進的案例相似性度量模型。傳統相似性度量模型無法精確描述缺失數據及屬性間替代性,因此本文提出“結構相似度”度量缺失數據對于案例結構特征相似性的影響,引入“變異系數”度量案例屬性的可替代性。分別針對連續型、分類型及模糊型變量定義相應的屬性局部相似性度量方法,并利用結構方程確定各屬性權重,最后通過防汛應急決策實例驗證了改進的案例相似性度量模型的有效性。

主要參考文獻

[1] Kolodner J L.Improving Human Decision Making through Case-Based Decision Aiding[J]. AI Magazine, 1991,12(2):52-68.

[2] Aamodt A, Plaza E. Case-Based Reasoning:Foundational Issues, Methodological Variations and System Approaches [J].Artificial Intelligence Communications,1994,7(1):39-59.

[3] Slonim T Y, Schneider M. Design Issues in Fuzzy Case-Based Reasoning [J]. Fuzzy Sets and Systems, 2001,117(2):251-267.

[4] 周凱波,馮珊,李鋒. 基于案例屬性特征的相似度計算模型研究[J].武漢理工大學學報:信息與管理工程版, 2003,25(1):24-27.

[5] 秦玉平, 楊興凱. 基于案例推理的區間屬性相似度研究[J]. 遼寧師范大學學報:自然科學版, 2006,29(4):442-445.

[6] Wang L, Tian S C, Yuan X F, Ma X M, Research on Gas Explosion IDSS in Coalmines Based on CBR[C] // Proceedings of International Conference on Advanced Computer Control, Singapore, 2009: 652-656.

[7] Xu Z S. On Similarity Measures of Interval-Valued Intuitionistic Fuzzy Sets and Their Application to Pattern Recognitions [J]. Journal of Southeast University (English Edition),2007,23(1):139-143.

[8] 駱敏舟,周美立. 實例推理檢索中相似度量方法的研究[J].合肥工業大學學報:自然科學版, 2001,24(6):1091-1094.

[9] 鐘詩勝,王知行. 基于模糊相似優先的實例檢索模型[J]. 計算機研究與發展,1998,35(9):810-813.

[10] 許志端,楊蘭蓉,張金隆. 一種基于神經網絡的事例相似度評估方法[J].華中理工大學學報, 2000,28(10):91-93.

[11] D Wettschereck, D W Aha, T Mohri. A Review and Empirical Evaluation of Feature Weighting Methods for a Class of Lazy Learning Algorithms [J]. Artificial Intelligence Review,1997,11(1-5): 273-314.

An Improved Case Similarity Measure for Case Retrieval in CBR Based on Emergency Decision

GU Shu-juan, GAO Xue-dong, SUN Ran

(School of Economics and Management, University of Science and Technology Beijing, Beijing 100083, China)

Abstract: Case-Based Reasoning (CBR) is widely used in emergency decision. Case similarity measure is a key issue in the case retrieval process. In this paper, an improved case similarity measure is given to deal with the problem of missing data and substitutability, which are ignored by traditional case similarity measures. ‘Structure similarity’ is proposed to calculate the structural impact of missing data, and ‘variation coefficient’ is used to measure the substitutability between attributes. Finally, numerical examples in the real emergency decision application justified the effectiveness of the new case similarity measure.

Key words: Emergency Decision; Case Retrieval; Case-Based Reasoning (CBR); Case Similarity Measures

主站蜘蛛池模板: 人人看人人鲁狠狠高清| 亚洲综合色婷婷| 99久久无色码中文字幕| 一级黄色网站在线免费看| 久久这里只有精品66| 自拍欧美亚洲| 91精品啪在线观看国产| 国产精品v欧美| 久久精品66| 最新亚洲人成无码网站欣赏网| 成人午夜视频在线| 亚洲AV无码乱码在线观看裸奔| 亚洲人成人伊人成综合网无码| 亚洲综合日韩精品| 久久国产精品影院| 激情乱人伦| 亚洲综合专区| 中国丰满人妻无码束缚啪啪| 国产欧美在线观看一区| 国产精品专区第1页| 中国国产A一级毛片| 久久福利片| 欧美视频免费一区二区三区| 99视频只有精品| 成年网址网站在线观看| 国产亚洲精品97AA片在线播放| 色婷婷国产精品视频| 免费看av在线网站网址| 精品久久久久无码| 中日无码在线观看| 无码aⅴ精品一区二区三区| 亚洲IV视频免费在线光看| 亚洲无限乱码| 激情影院内射美女| 久久久国产精品无码专区| 国产精品亚洲一区二区三区在线观看| www.亚洲天堂| 日韩AV无码一区| 国产成本人片免费a∨短片| 精品久久香蕉国产线看观看gif| 国产精品成| 婷婷伊人久久| 国产乱子伦一区二区=| 婷婷伊人久久| 精品丝袜美腿国产一区| 制服丝袜国产精品| 免费精品一区二区h| 97影院午夜在线观看视频| 国产成人无码AV在线播放动漫| 亚洲三级电影在线播放| 国产精品无码AV中文| 日韩AV无码免费一二三区| 77777亚洲午夜久久多人| 性69交片免费看| 青青热久麻豆精品视频在线观看| 久久久久久久久18禁秘| 国产欧美亚洲精品第3页在线| 国产91丝袜在线播放动漫| 色视频国产| 国产肉感大码AV无码| 日本成人精品视频| 国产成人综合在线观看| 亚洲精品你懂的| 日韩人妻少妇一区二区| 亚洲欧美日韩天堂| 激情综合婷婷丁香五月尤物| 国产91成人| 欧美另类图片视频无弹跳第一页| 亚洲人成在线免费观看| 日韩欧美中文在线| 亚洲无线观看| 亚洲成aⅴ人在线观看| 91丝袜美腿高跟国产极品老师| 亚洲精品国产精品乱码不卞| 一级毛片在线播放| 国产女人综合久久精品视| 国产在线精彩视频论坛| 国产精品久久自在自线观看| 99久久精品国产精品亚洲| 亚洲欧美激情另类| 毛片免费高清免费| 永久免费av网站可以直接看的 |