王洪利
(西安交通大學 管理學院,西安710004)
現實中需要處理的復雜系統問題往往都是定性的、難以量化的,為了彌補定量方法的缺陷,錢學森先生提出了定性與定量相互融合的綜合集成方法及其理論體系,綜合集成方法的實質就是將專家群體、知識體系、數據與信息體系和計算機體系結合起來,從定性到定量進行綜合集成,實現以人的思維、思維成果、人的知識、智慧為主以及各種情報、數據信息集成起來的大成智慧的綜合集成[1]。綜合集成法為處理難以量化的復雜系統問題提供了理論指導。管理科學的研究對象中包括大量的由無數個體組合而成的無限多樣性和復雜性的復雜系統,采用建模仿真的手段來研究復雜系統內在運行機制是復雜系統研究的最主要方法。定性仿真是以定性建模和定性推理為基礎的,定性建模理論研究如何建立不完備知識系統的模型,即定性模型。定性推理則是研究如何用這種定性知識模型進行形式化推理,把定性推理應用于系統定性模型上,通過推理來產生和解釋系統的行為便是定性仿真。由于系統的復雜性和參數的難以量化,系統過于復雜和知識的不完備[2],復雜系統研究主要采用的是定性仿真。但復雜系統仿真的發展趨勢是采用定性定量相融合的仿真,也被稱為半定性半定量仿真,微觀上分為在定性仿真中使用定量信息的仿真和在定量仿真中使用定性信息的仿真兩種[3],復雜系統的特點決定其仿真應以前一種為主。但在當前復雜系統的量性融合仿真中,仿真的可靠性不高,定性與定量相互脫節,不能同時為系統建模和仿真利用。產生這種情況的主要原因在于:復雜系統仿真中,定量信息沒有進行有效的定性表示;定性信息和定量信息相互不能有效轉化。解決以上問題的關鍵就是從仿真系統中變量表示這個最根本的基石入手,引入更加有效的定量信息定性表達模型和定性信息與定量信息的互相轉化方法。并在此變量表達模型的基礎上,研究具有量性融合特征的半定性仿真的定性建模、定性推理的理論和方法。
已有的研究中,為了解決系統仿真中不確定變量的半定量化的問題,提出以下有代表性的不確定性變量的定量化方法:(1)基于區間數的方法[4];(2)模糊數方法[5];(3)概念灰數方法[6]。
參考和借鑒錢學森先生的綜合集成思想和方法,本文將在系統仿真中,引入擅長量性轉化的云模型作為復雜系統中不確定性變量的表示方法,對復雜系統仿真中不確定性變量的半定量化方法進行分析和研究。
云模型是由中國的著名學者李德毅院士1995年提出的一種定性表達與定量互相轉化的模型[7]。從其誕生至今在解決諸如世界著名難題三維倒立擺控制、知識發現與數據挖掘、評價與決策、信息與控制等諸多方面和領域取得了較大的成功應用。
云和云滴[8]:設U是一個用數值表示的定量論域,C是U上的定性概念,若定量值x∈U是定性概念C的一次隨機實現,x對C的確定度μ(x)∈[0,1]是有穩定傾向的隨機數:μ:U→[0,1] ?x∈Ux→μ(x),則x在論域U上的分布稱為云(Cloud),記為云C(X).每一個x稱為一個云滴。如果概念對應的論域是n維空間,那么可以拓廣至n維云。
云模型所表達概念的整體特性可以用云的數字特征來反映。云用期望Ex(Expected value)、熵En(Entropy)和超熵He(Hyper entropy)這3個數字特征來整體表征一個概念,多維云模型的整體特征可由多組數字特征表示,期望Ex是云滴在論域空間分布的期望,是最能夠代表定性概念的點,或者說是這個概念量化的最典型樣本;熵En代表定性概念的可度量粒度,熵越大通常概念越宏觀,也是定性概念不確定性的度量,由概念的隨機性和模糊性共同決定。一方面En是定性概念隨機性的度量,反映了能夠代表這個定性概念的云滴的離散程度;另一方面又是定性概念亦此亦彼性的度量,反映了在論域空間可被概念接受的云滴的取值范圍;超熵He(Hyper entropy)是熵的不確定性度量,即熵的熵,由熵的隨機性和模糊性共同決定。用三個數字特征表示的定性概念的整體特征記做C(Ex,En,He)。
一維正態云模型[9][10]:ArForward(C(Ex,En,He))是一個把定性概念的整體特征變換為定量表示的映射π:C→∏,滿足以下條件:
(1)Θ={ti|Norm(En,He)的一次實現i=1..N}
(2)X={xi|xi為Norm(Ex,ti)的一次實現ti∈Θ,i=1..N}
其中,Norm(μ,δ)為期望為μ方差為δ的正態隨機變量,N為云滴的個數。
利用正態云,就可以把定性概念C(Ex,En,He)變換為數值表示的云滴集合,實現了概念空間到數值空間的轉換。一維正態云可以拓廣至n維正態云。其中正態云模型是最重要的一種云模型,李德毅院士已證明了正態云模型的普適性[9]。
首先,需要明確一下不確定性變量和定性變量的區別。定性變量是不用數值型來體現的一組變量。比如性別、宗教信仰、客戶滿意度等等。定性變量表示的并非真有數量上的變化,而只有性質上的差異。這些量還可以分為兩種,一種是有序變量,它沒有數量關系,只有次序關系,如某教師的工作評價分為優秀、良好、一般等;另一種是名義變量,這種變量既無等級關系,也無數量關系,如顏色(紅、黑)、性別(男、女)等。定量變量是可用具體數值來表示的變量,就是通常所說的連續量,如產量、庫存、現金、發表論文的數量等,它們是由測量或計數、統計所得到的量,這些變量具有數值特征,稱為定量變量。確定性變量是指根據現有的客觀條件和人們頭腦中的知識和經驗可以確定其具體值(定性或定量值)的變量。不確定性變量是指由于系統的復雜性,根據現有的客觀條件和人們頭腦中的知識和經驗無法確定其具體數值,但通過人們的觀察、判斷和分析可以判斷其大致范圍的變量。從以上可以看出,不確定性變量可能是定量變量,也可能是定性變量。不確定變量在我們處理復雜系統問題時是普遍存在的一種變量。不確定性變量不是我們對其一無所知的變量,也不是完全透徹清楚了解其具體取值的變量。除此之外,某些定性變量具有“與生俱來”客觀的不確定性存在。如對人按年齡劃分分為少年、青年、中年、老年等幾個階段,那么一個人16歲,屬于少年還是青年呢?人們總是回答屬于青年的可能性是多少,同時也沒有否定有屬于少年的可能性。這種定性劃分上中間臨界值就客觀上存在很大的不確定性。
對于以上描述的不確定性變量的取值的獲取,一直是各相關領域研究的關鍵和難點問題。在復雜系統的仿真中,本文對不確定性變量取值的獲取,采取在社會科學和管理科學中的德爾菲、調查、訪問、頭腦風暴法等科學實用的方法來獲取專家的判斷。
假設對象集合為O={o1,o2,...,on},對象O的定性變量 集合 為X={x1,x2,...,xn},專 家集 合為E={e1,e2,...,en}。以下分為幾種情況來研究群體領域專家的判斷值轉化為半定量的云模型表示的方法:
(1)假如不同專家給出的判斷值是不同的準確值(不是區間)
表1為第k個專家ek對各對象變量的判斷值。其中表示第k個專家對j個對象的第i個變量的判斷值。

表1 第k個專家ek對各對象變量的判斷值
根據表1的數據首先針對單個對象oj的變量xi統計各取值的專家頻次(表2)。

表2 對象oj的變量xi的各取值頻次統計

表3 變量xi的各取值的專家個數的比例
表3中所給的pi就是該變量取vi的可能性,越多的專家選擇此選項,則表示不確定性變量取該值的可能性越大。將pi最大時的vi的取值記為vmax(pi)。
如果表2中vi的個數足夠多(即個數多到數據分布符合正態分布規律特征),首先將表2繪制成直方圖(橫坐標為vi,縱坐標為取該值的專家的個數),采用云模型理論中的方法,創建該不確定性變量取值的云模型。步驟如下:
①根據“復雜問題相信和依靠領域專家”與“少數服從多數”兩個基本準則,取群體專家判斷所對應的云模型的數字特征中的期望Ex=vmax(pi)。如果存在兩個以上的相等的pi,則在一定的水平閾值δ內,選取其中最左邊和最右邊的兩個vi,作為梯形云的左期望和右期望(只有一個pi最大,可看成左期望等于右期望)。
②分別從左期望向左和右期望向右,將熵值從0以較小的步長逐漸增加,直到左右半正態云的函數值與直方圖值之差小于誤差容許閾值。將左右兩個半正態云的熵值記為梯形云的兩個熵值Enl、Enr。
可將以上兩步過程看成將整個數據集只變換成一個云模型的云變換過程。
④各根據下式計算左右半正態云模型的超熵:

如果表2中vi取值的數量不是足夠多,但多于兩個,為了最好的擬合數據可使用最小二乘法,計算云的數字特征。如果表2中vi取值的數量少到只有兩個。則可以采用幾何云的方法來計算云的數字特征[10]。
(2)考慮到大多數專家對某個定性變量量化賦值可能許多不確定性,而且還涉及到個人判斷因素,通常很難甚至不能確定地說出是多少,但總能說出“大約是多少”或“在多少到多少之間”,即給出不確定性變量量化的區間值。為此作如下定義:
定義1 設區間有兩個區間[a,b],[c,d],如果a<c,b<d,則稱區間[a,b]<[c,d]。如果a<c,則稱區間[a,b]“左小于”區間[c,d]。如果d>b,則稱區間[c,d]“右大于”區間[a,b]。
定義2 如果存在一個實數點x∈[a,b],則稱x“點包含于”區間[a,b]。

表4 序列中點包含vi的區間個數

表4 序列中點包含vi的區間個數
取值vi序列中點包含vi的區間個數q′i v1 vk v2 q′1 q′2……q′k

表5 序列中點包含vi的區間個數占全體包含總數的比例
首先將表4繪制成直方圖(橫坐標為vi,縱坐標為序列中點包含vi的區間個數),采用云模型理論中的方法,創建該不確定性變量取值的云模型。步驟如下:
①根據表5取群體專家判斷所對應的云模型的數字特征中的期望。如果存在兩個以上的相等的,則在一定的水平閾值δ內,選取其中最左邊和最右邊的兩個vi,作為梯形云的左期望和右期望(只有一個最大,可看成左期望等于右期望)。
②分別從左期望向左和右期望向右,將熵值從0以較小的步長逐漸增加,直到左右半正態云的函數值與直方圖值之差小于誤差容許閾值。將左右兩個半正態云的熵值記為梯形云的兩個熵值Enl、Enr。
可將以上兩步過程看成將整個數據集只變換成一個云模型的云變換過程。
④各根據下式計算左右半正態云模型的超熵:

本文提出了面向復雜系統定性仿真,從理論和方法上提出了一種基于云模型的不確定性變量的半定量化方法。該方法將充分發揮云模型在定性變量半定量化表示、量性融合與轉化方面的優勢,為復雜系統中不確定性變量的半定量化提供一種可供借鑒的方法,將可能促進定性與定量仿真的進一步融合。進一步的研究工作包括在應用中驗證本文所提出的方法等。
[1]顧基發,王浣塵,唐錫晉.綜合集成方法體系與系統學研究[M].北京:科學出版社,2007,(1).
[2]胡斌,肖人彬.復雜系統的定性仿真[J].系統仿真技術,2006,2(1).
[3]陳宗海,段家慶,桂旺盛.智能模擬之定性定量仿真的發展[J].自動化博覽,2005,(s1).
[4]Benjamin Kuipers,Daniel Berleant.Using Incomplete Quantitative Knowledge in Qualitative Reasoning[C].AAAI Press.The Seventh Conference on Artificial Intelligent,1988.
[5]Qiang Shen,Roy Leitch.Extending Qualitative Simulation by the Use of Fuzzy Sets[J].IEEE Transaction on Systems,Man,and Cybernetics,1992,22(2).
[6]黃元亮.灰色定性仿真基礎研究[D].中國科學技術大學,博士學位論文,2004.
[7]李德毅,孟海軍,史雪梅.隸屬云和隸屬云發生器[J].計算機研究和發展,1995,32(6).
[8]邸凱昌.空間數據發掘與知識發現[M].武漢:武漢大學出版社,2001.
[9]李德毅,劉常昱.論正態云模型的普適性[J].中國工程科學,2004,6(8).
[10]張勇,趙東寧,李德毅.相似云及其度量分析方法[J].信息與控制,2004,33(2).