999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于Isomap的CWME專家群體意見分析系統

2008-12-31 00:00:00楊偉杰戴汝為
計算機應用研究 2008年10期

 收稿日期:2007-11-24;

修回日期:2008-01-09

作者簡介:楊偉杰(1980-),女,山東濰坊人,博士研究生,主要研究方向為人工智能、模式識別、智能系統(weijie.yang@ia.ac.cn);戴汝為(1932-),男,云南昆明人,中國科學院院士,研究員,主要研究方向為自動控制、模式識別、人工智能、復雜性科學及思維科學;崔霞(1975-),女,山東莒南人,副研究員,主要研究方向為人工智能、模式識別、智能系統.

(中國科學院 自動化研究所 復雜系統與智能科學重點實驗室 北京 100080)

摘要:

針對從定性到定量綜合集成研討廳體系,對復雜問題分析過程中的專家群體的分散化思維,提出并實現了一種基于自動調查問卷的群體意見相似性定性分析方法。此方法基于群體行為的相似性特征對調查問卷的相似性度進行量化統計,并采用Isomap算法將問卷量化之后產生的多維數據集進行降維及可視化表示。

關鍵詞:CWME; 群體意見相似性; Isomap降維; 綜合集成研討廳

中圖分類號:TP31

文獻標志碼:A

文章編號:1001-3695(2008)10-3188-03

Isomap-based experts’ opinions evaluation system in CWME

YANG Wei-jie DAI Ru-wei CUI Xia

(Key Laboratory of Complex System Intelligence Science Institute of Automation Chinese Academy of Sciences Beijing 100080 China)

Abstract:There is the dynamic complexity in experts groups for man’s social being determines his consciousness in the course of solving complex problem high related to OCGS.This paper gave a qualitative analysis method based on questionnaires namely group coherence qualitative analysis method. Using the Isomap algorithm this method realized the data’s dimension reduction of the opinions which the experts evaluated to argue scheme. At the same time it visualized the results in the low dimension space so provided an ideal environment of the visualization for the hall for workshop of metasynthetic enginee-ring which would be clear to see the state of the clustering of the group of the experts’ thinking.

Key words:CWME(cyberspace for workshop of metasynthetic engineering); coherence of group thoughts; Isomap dimension reduction; hall for workshop of metasynthetic engineering

綜合集成研討廳體系,是思維科學的一項應用技術[1~3]。建立起能夠激發出個人創造性的群體環境,獲取1+1>2的整體和綜合優勢。綜合集成法的創建者早就指出,與開放復雜巨系統有關的非常復雜的問題不是個人所能解決的,必須依靠集體的智慧,綜合集成所有可以利用的知識資源,發揮整體效應。同時這也就存在一個問題:面對一個復雜問題,由于群體中的個體成員對包含在復雜問題中各種因素的重要性的感知不同,看法也各不相同,這就是研討廳中的專家群體分散化思維的表現[4]。

克服專家群體的分散化思維,使參加研討的專家群體的思維最終達成一致,這就需要一個把握群體意見狀態的工具,而調查問卷就是其中一種有效的手段。它對發現和界定未知或模糊的復雜問題和現象具有啟發作用。但是,隨著傳統調查方法拒訪率不斷提高,調查質量也在逐漸下降,促使許多市場研究公司開始紛紛轉向網絡,利用互聯網為手段進行的市場調查已在我國悄然興起,其形式則是以網絡調查問卷為主。現存的調查問卷系統已經很多,問卷的管理、生成、分發功能基本完善,但是在問卷結果的統計方面卻存著很大的缺憾。因而本文基于綜合集成研討廳群體有效交互與組織,融合群體行為相似性研究成果,設計并實現了一種自動調查問卷系統,它不僅可以完成一般問卷系統的基本功能,并且針對問卷結果分析實現了多種定性、定量分析方法的融合,對不同問題使用不同的分析方法,并將調查問卷的結果可視化。本文系統最主要的貢獻是:針對調查問卷定性統計分析的難點,即問卷的量化問題,提出并實現了一種基于群體行為的相似性特征對調查問卷進行量化統計的方法,并應用非線性機器學習算法對其進行可視化顯示,實現了對研討廳中專家群體分散化思維導致的結果差異的定性分析。

1基于Isomap算法的問卷結果定性分析方法

將專家的定性認識通過建模的方法來提高到定量的認識,專家分析其結果,不斷修改模型或其參數直至達到一個滿意的結果,是從定性到定量綜合集成思想的具體體現[5]。針對這一過程,將專家對研討方案評價意見的多維數據組進行降維,并將降維后的結果在低維數據空間中進行可視化表示。通過這種對專家意見在低維空間內的可視化表示,可直觀觀測到專家群體思維的聚類情況,然后根據聚類情況分析專家之間的行為相似性,逐漸引導專家意見趨于一致。本文中同樣體現了這一點。因為調查往往是在一個群體內進行的,而一個群體中的個體之間一定存在相似性,只要能找到對這種相似性的合理描述,就能引導群體意見達成一致。因而筆者提出了如下的方法:首先對問卷結果進行統一的量化表示得到高維表示向量,然后對此高維向量進行降維處理,最后對降維之后的低維向量進行可視化表示,得到個體之間意見相似性關系。

1.1問卷結果的量化

在綜合集成研討廳中,專家發表對方案的評價意見可以通過填寫調查問卷來完成。其中選擇題型調查問卷是目前市場調查中一種常用調查問卷,一份調查問卷有多道選擇題,每道選擇題有多個選項,可以單選,也可以多選。所以僅僅通過查看調查問卷的填寫結果,難以區分專家之間觀點上的差異。人們期待能用一種更加直接的方式來反映專家個體之間觀點上的差異,如可視化數據顯示方式。為了實現調查結果的可視化,首先要將問卷調查結果用數學形式量化表達出來。本系統采用的量化方式如下:首先統計一份調查問卷中所有的選項數,設定一個維數與該選項數相等的高維向量。該高維向量每一維的分量對應一個選項的選擇情況,如果該選項被選中,則該分量置1,否則置0。這樣每一份調查問卷都與一個高維向量相對應,同樣一個高維向量也表示一份調查問卷的填寫結果。

1.2問卷結果的降維處理

如前所述,一份調查問卷的調查結果可以用一個高維向量表示。但只有三維以下的向量才能在坐標系中表示,所以為了實現可視化,需要對高維向量進行降維。如何將大量高維數據所包含的特征結構在低維空間中展現,即發現隱藏在高維數據中有意義的低維結構,成了問題的關鍵。傳統的降維技術主要有PCA 和MDS方法等,用PCA 和MDS算法實現數據降維的主要特點是映射的低維數據點可以較好地保持高維數據之間的差異性,兩者可較好地發現隱藏在高維數據線性空間中的數據結構,但對于高維數據集隱藏的非線性結構處理結果并不理想。因而本系統采用了Isomap非線性降維算法。Isomap算法不僅融合了PCA和MDS的主要算法特征——計算有效性、全局的優化性和漸近收斂性,而且可以比較靈活地學習到數據點的非線性結構。它根據高維數據集包含的非線性結構進行點的非線性擴展,用歐式距離較好地揭示了高維數據集的自由度[6,7]。

Isomap降維算法具體實現如下:

a)構造關系圖。將每個高維向量用一個節點表示,如果兩個向量間的距離小于預設值ε,則連接著兩個節點。遍歷所有節點,形成一張圖G。

其中,定義向量X和向量Y的距離為

d(X,Y)=∑ni=1(xi-yi)2(1)

b)計算最短距離矩陣。在圖G中,計算所有節點i到其他所有節點j的最短距離,組成距離矩陣DG={dG(i j)}。其中dG(i j)表示節點i與j之間的最短連線距離。

c)構造降維向量。將矩陣DG按下述方法變換為矩陣τ(DG)。

τ(DG)=-HSH/2

Sij=D2ij

Hij=δij-1/N,N為矩陣的維數

δij=1,i=j0,i≠j(2)

令λp為矩陣τ(DG)的第p大的特征值,Vip為λp所對應特征向量的第i個分量。則如果要將高維向量yi降為d維向量yi,yi的第p個分量由下式確定:

yip=λpVip(3)

變量d可以等于1、2、3,這時降維向量分別為一維、二維、三維,可以在不同的坐標系中顯示。

d)任取一個三維向量作為坐標原點,對其他向量按下面公式作相應的坐標變換:

x′=x-xy′=y-yz′=z-z(4)

其中:(x,y,z)為原點向量坐標;(x,y,z)為除原點向量以外的普通向量的原始坐標;(x′,y′,z′)為普通向量變換后的坐標。根據各個向量的坐標點和它們的連線關系在三維坐標系中繪圖。以下舉例說明。

假設有甲、乙、丙、丁四個人填寫了一份調查問卷,在這份調查問卷中,有三道選擇題。其中前兩道選擇題分別有兩個選項,最后一道選擇題有三個選項,選擇題允許多選。他們的選擇結果是這樣的:甲選擇了第一個選擇題的第一個選項、第二個選擇題的第二個選項、第三個選擇題的第二和第三個選項;乙選擇了第一個選擇題的第二個選項、第二個選擇題的第一個選項、第三個選擇題的第一個選項;丙選擇了第一個選擇題的兩個選項、第二個選擇題的第二個選項、第三個選擇題的第三個選項;丁選擇了第一個選擇題的第一個選項、第二個選擇題的兩個選項、第三個選擇題的第二個選項。接下來用向量來表示調查問卷的填寫結果,因為整個調查問卷共有七個選項,所以用一個七維向量來表示一份調查問卷的填寫結果。根據上面b)所述的方法,將甲、乙、丙、丁四個人的問卷填寫結果分別用A、B、C、D四個向量表示,它們分別為

A=(1,0,0,1,0,1,1)T B=(0,1,1,0,1,0,0)T

C=(1,1,0,1,0,0,1)T D=(1,0,1,1,0,1,0)T

根據上述的歐式距離計算公式,計算各向量間的歐式距離如下:

d(A,B)=d(B,A)=7≈2.6

d(A,C)=d(C,A)=2≈1.4

d(A,D)=d(D,A)=2≈1.4

d(B,C)=d(C,B)=5≈2.2

d(B,D)=d(D,B)=5≈2.2

d(C,D)=d(D,C)=4≈2

經過實驗,在本例中無須通過設定ε值來濾除連線,所以預設ε值為3,按照a)所述方法建立關系圖如圖1所示。

接下來在關系圖中計算每兩個節點之間的最短連線距離。從A到B有兩條連線,分別是ACB、ADB,計算這兩條連線的距離:

dACB=dAC+dCB=1.4+2.2=3.6

dADB=dAD=dDB=1.4+2.2=3.6

所以從A到B的最短連線距離為3.6。

同理,可以計算出從A到C的最短距離為1.4,從A到D的最短距離為1.4,從B到C的最短距離為2.2,從B到D的最短距離為2.2,從C到D的最短距離為2。并且容易看出,從節點i~j的最短距離與從節點j~i的最短距離是相同的。

這樣計算得到最短距離矩陣

DG=02.61.41.42.602.22.21.42.2021.42.220

根據上述步驟c)的計算方法,計算變換矩陣

τ(DG)=1.645-1.50.425-0.57-1.52.115-0.780.1650.425-0.781.165-0.81-0.570.165-0.811.215

求解矩陣τ(DG)的特征值

λ1=3.905,λ2=1.541,λ3=0.694,λ4=0

求解與各特征值相對應的特征向量

v1=(0.584,-0.673,0.363,-0.274)T

v2=(0.19,-0.41,-0.511,0.731)T

v3=(0.611,0.36,-0.579,-0.374)T

v4=(-0.5,-0.5,-0.5,-0.5)T

根據步驟d)中的公式,將A﹑B﹑C﹑D降為三維坐標向量。

A=(1.154,0.235,0.509)T

B=(-1.329,-0.509,0.3)T

C=(0.717,-0.635,-0.497)TD=(-0.542,0.908,-0.312)T

以A為坐標原點,變換A、B、C、D坐標為

A′=(0,0,0)T

B′=(-2.483,-0.744,0.209)IT

C′=(-0.436,-0.870,-1.01)T

D′=(-1.696,0.672,-0.82)T

最后在三維坐標系中標出各個坐標點,繪制出圖2。圖中各個點之間的距離就代表了不同個體之間意見的相似性關系。

2系統功能實現

此系統可以完成問卷的管理、自動生成、自動分發等基本功能,并且針對問卷結果分析實現了多種定性、定量分析方法的融合,對不同問題使用不同的分析方法,并將調查問卷的結果可視化。同時本文系統通過采用Isomap算法對調查問卷結果的量化統計,實現了對研討廳中專家群體分散化思維的定性分析。系統實現流程如圖3所示。

2.1調查問卷的管理

在本系統中,問卷是以XML文件流的形式存放在數據庫中,并以列表的形式在系統中提供了問卷管理功能,可以方便地增加、刪除、編輯問卷。問卷管理工具界面如圖4所示。

2.2自動調查問卷設計

設計一份問卷包括一系列邏輯性的步驟,這些步驟由于調研人員不同而有所差別,但所有的步驟趨向于一個共同的順序[8]即:

a)提出分析架構,即首先是確定調研目標、資源和限制因素。這一步在本系統中是以設置問卷主題為主要任務,設置好主題,問卷中所有問題都圍繞主題生成。

b)決定調查方式和問卷形態,即確定數據收集方法。首先確定問題的回答形式。問卷設計中,問題的設計有不同的種類。其中開放性問題和封閉性問題是兩個比較常用的種類[9]。開放性問題,就是不為受訪者提供具體回答選項的問題,如簡單回答問題等。封閉性問題,又稱定選性問題,受訪者從研究人員所給予的一個或更多的具體答案中選擇回答,如單項選擇題、多項選擇題等。根據這兩種問題的優缺點,本系統的自動問卷生成功能提供了以下幾種問題類型模板,即單項選擇、多項選擇、簡單回答、論述題和矩陣題。

c)擬定問卷初稿、修訂。本文設計的系統,在問卷創建者確定主題、創建問題及選項之后,系統自動生成問卷,并形成預覽,直接可以看到分發狀態的問卷形式,如果創建者不滿意還可以繼續進行修改。

d)預試和評估。問卷創建完成,創建者可以在本地進行多次提交,然后查看多次調查結果的匯總,對問卷進行預試。如對產生的結果不滿意可以根據需要繼續修改問卷直至能夠取得預期的效果。問卷設計工具界面如圖5所示。

2.3調查問卷的自動發放

系統采用了Google的G-Talk所采用的即時通信協議,即XMPP協議(也稱Jabber協議),實現了問卷的自動發放。在研討過程中,主持人對需要填寫的問卷進行分發,專家電腦桌面自動彈出問卷,其間無須專家進行任何的操作。問卷發放界面如圖6所示。

2.4自動調查問卷結果統計分析

從統計分析的層次劃分問卷的統計分析方法可分為兩類,即定性分析和定量分析[9]。問卷的定量分析根據分析方法的難易程度可分為簡單定量分析和復雜定量分析[10]。

簡單的定量分析是對問卷結果作出一些簡單的分析,本系統中對封閉問題的定量分析主要采用百分比、平均數、頻數來進行分析。同時針對不同的被訪群體之間進行比較則引入交叉分析來實現。對開放問題的定量分析主要采用分類處理之后用百分比之類的方法對各類型進行匯總。對于數量回答的定量分析,首先是對量化后的數據進行區間處理,然后使用位置測度、平均值、中位數等統計量來描述結果。

簡單分析常用于單變量和雙變量的分析,但是社會經濟現象是復雜多變的,僅用兩個變量難以滿足需要。這時就需要用到復雜定量分析。在問卷設計中,常用的復雜定量分析有兩種,即多元分析和正交設計分析。多元分析就是通過對觀測數據的分析,由表及里來研究多個變量之間相互依賴的規律性,或根據實際問題的需要對研究對象作出某種評價、分類、判別,或從中發現各個指標都起作用的更一般的公共因素。在問卷分析中常用的多元分析主要有聚類分析、主成分分析、因子分析三類。正交分析則是首先對問卷進行正交分析,盡可能使問卷結構合理;然后進行問卷調查,并收集數據;最后整理數據,對調查結果進行分析(可采用正交實驗中的方差分析),得出分析結果。

如前所述,由于被調查人群之間存在差異,結果同樣存在差異,決定了結果分析中必定存在定性的因素,本系統中引入了對結果的定性分析。本系統中主要使用的定性分析方法包括前面提到的Isomap降維分析方法,以及現在克服專家群體的分散化思維常用的群體一致性算法[11,12]。

本文設計的系統中對問題的分析主要采用以上幾種方法綜合的方式。針對不同的問題類型設置了不同的分析方法:針對封閉性問題采用百分比的分析方法;針對開放性問題則是采用分類、分區間的定量方法與定性方法相結合的方式;對矩陣問題則采用層次分析法[8,11]進行分析。最后對整個問卷結果進行量化,通過降維及可視化技術對整體意見進行綜合分析,得出群體意見發散程度,從而可以進一步協調專家個體之間的意見最終達到群體意見一致。

2.5調查問卷結果可視化

結果的可視化有利于調查者直觀地了解調查結果。在此系統中,筆者主要利用了Zed Graph開源.NET圖表類庫,根據問卷分析方法設計了幾種問卷的結果可視化的顯示方式。此處僅以Isomap降維定性分析方法可視化界面和百分比方法可視化界面作為例子,說明調查結果的可視化,如圖2、7所示。

3結束語

在綜合集成研討廳中,不可避免地存在專家群體之間的分散化思維。調查問卷作為收集專家意見的一種常用方法,對其結果進行統計分析能比較客觀地反映不同專家觀點上的差異。本文設計的自動調查問卷系統采用定量與定性結合的方法完成對調查問卷結果的綜合和意見一致性分析并最終實現了結果的可視化,從而有效分析專家個體之間行為相似性,并取得了不錯的效果。本文提出的基于Isomap降維算法的問卷結果量化及可視化方法為綜合集成研討廳體系體現專家思維聚類情況提供了一種理想的可視化環境。

參考文獻:

[1]錢學森,于景元,戴汝為.一個科學的新領域——開放的復雜巨系統及其方法論[J].自然雜志,1990,13(1):3-10.

[2]錢學森.再談開放的復雜巨系統[J].模式識別與人工智能,1991,4(1):1-4.

[3]戴汝為.從定性到定量的綜合集成技術[J].模式識別與人工智能,1991,4(1):5-10.

[4]王丹力,戴汝為.專家群體思維收斂的研究[J].管理科學學報 2002,5(2):1-5.

[5]劉春梅.綜合集成研討廳專家群體評估結果的可視化[J].模式識別與人工智能,2005,18(1):6-11.

[6]TENNENBAUM J B DeSILVA V LANGFORD J C. A global geometric framework for nonlinear dimensionality reduction[J].Scien-ce 2000,290(22):2319-2323.

[7]ZHA Hong-yuan ZHANG Zhen-yue. Isometric embedding and continuum ISOMAP[C]//Proc of the 20th International Conference on Machine Learning(ICML-2003). Washington DC:[s.n.] 2003:21-24.

[8]呂永紅.市場調查問卷的定量分析[J].集團經濟研究,2005(1):52-53.

[9]袁岳,周林古.零點調查——民意測驗的方法與經驗[M].福州:福建人民出版社,2005.

[10]劉菊紅.調查問卷中的統計分析方法[J].上海統計,2002(2):35-37.

[11]王丹力,戴汝為.群體一致性及其在研討廳中的應用[J].系統工程與電子技術,2001,23(7):33-37.

[12]呂志堅.綜合集成研討廳中的專家研討與思維研究[D].北京:中國科學院自動化所,2004.

主站蜘蛛池模板: 99久久亚洲精品影院| 在线观看欧美精品二区| 国产a v无码专区亚洲av| 亚洲高清中文字幕在线看不卡| 欧美专区在线观看| 国产欧美视频在线| 国产在线欧美| 国产成年女人特黄特色大片免费| 无码免费的亚洲视频| 色135综合网| 亚洲中文字幕久久无码精品A| 国内精品91| 婷婷综合缴情亚洲五月伊| 久久婷婷六月| 亚洲最新地址| 东京热av无码电影一区二区| 久久精品丝袜高跟鞋| 亚洲天堂久久| 色窝窝免费一区二区三区| 一级毛片基地| 久久这里只有精品国产99| 99re这里只有国产中文精品国产精品 | 久久人搡人人玩人妻精品 | 亚洲视频影院| 伊人久久精品亚洲午夜| 伊人久久大香线蕉影院| 亚洲日本韩在线观看| 欧美视频在线第一页| 91精品aⅴ无码中文字字幕蜜桃| 国产主播在线一区| 亚洲福利视频网址| 成人伊人色一区二区三区| 久久五月视频| 青草国产在线视频| 久精品色妇丰满人妻| 亚洲视频欧美不卡| 91精品免费久久久| 免费一级全黄少妇性色生活片| 大学生久久香蕉国产线观看| 色综合成人| 91精品专区| 91无码人妻精品一区二区蜜桃| 91亚洲精品国产自在现线| 理论片一区| a网站在线观看| 亚洲精品桃花岛av在线| 激情影院内射美女| 色噜噜狠狠狠综合曰曰曰| 久久超级碰| 午夜精品久久久久久久99热下载| 99资源在线| 一级片一区| a级高清毛片| 亚洲中文字幕无码爆乳| 中文无码毛片又爽又刺激| 国产丝袜第一页| 在线va视频| 久久精品国产精品青草app| 福利一区三区| 91香蕉视频下载网站| 亚洲婷婷在线视频| 精品一区二区三区水蜜桃| 国产在线欧美| 欧美性色综合网| 欧美亚洲国产精品第一页| 中国精品自拍| 欧美综合成人| 亚洲欧美综合另类图片小说区| 亚洲国产成人无码AV在线影院L | 97se亚洲综合不卡 | 五月婷婷丁香色| 精品视频91| 精品人妻系列无码专区久久| 国产成人高清精品免费软件| 国产视频一区二区在线观看| 亚洲国产综合精品一区| 东京热av无码电影一区二区| 丰满人妻被猛烈进入无码| 婷婷激情亚洲| 97国产精品视频自在拍| 天天综合亚洲| 人妻精品久久无码区|