曹峰,孫慧
(新疆大學a.理論經濟學學科博士后科研流動站;b.經濟與管理學院,烏魯木齊830046)
聯合分析與方差分析相似性的理論比較與實證
曹峰,孫慧
(新疆大學a.理論經濟學學科博士后科研流動站;b.經濟與管理學院,烏魯木齊830046)
文章從理論上探討聯合分析和方差分析的具體方法,并指出兩者的聯系;利用實際數據分別用兩種方法對屬性相對重要性及水平效應進行分析;最后得出聯合分析和方差分析效力相差無幾的結論。
聯合分析;方差分析
聯合分析和方差分析都可以對以自變量為定量數據,因變量為定性數據的數據進行分析。但是,聯合分析方法因其結果表述性強以及具有簡易性,廣泛運用于市場營銷、產品管理等領域。研究人員因其比傳統研究方法方差分析法更具有先進性而越來越傾向于聯合分析研究方法而慢慢摒棄方差分析法。
方差分析是一種常用的計量分析方法。方差分析與聯合分析的主要區別在于,方差分析的自變量為類別性變量,聯合分析的自變量為連續性變量。但本質上,兩者都是通過虛擬變量回歸的方法對數據進行分析,雖然分析的方法途徑不同,但兩者都能對屬性重要性即水平效應進行分析。
那么對于是聯合分析效力大還是方差分析效力大或者兩者效力一樣,本文通過分別用同樣數據分別運用這兩種方法進行研究分析,嘗試證明兩種方法研究同一種數據得出的結果效力相同。因此在研究問題時,無需為了追求所謂“先進性”而摒棄傳統研究方法。
1.1 聯合分析理論
1.1.1 聯合分析概念
聯合分析的前提是研究的產品具有明顯的特征,并且具有可模擬性,消費者在參與的過程中,對所研究的虛擬產品對象進行評價。通過對消費者評價的結果進行統計分析,將特性與特征的平均水平進行分離,從而對評價結果的特征進行統計性評價。聯合分析的前提是整體的評價結果已知,通過對消費者評價結果的分解分析其偏好。能夠分解出各個屬性的重要性及水平的效用,尋找總效用最大化的屬性及其水平組合,關注的核心是對受訪者而言屬性及其水平的價值,通過對受訪者評價結果的分析來揭示不同選擇之間受訪者的相對偏好。
在進行聯合分析時首先要做的是確定產品的特征與這些特征的整體水平。這些所研究的特征必須具備可識別性,并且能對消費者的購買選擇產生顯著的影響。學者在進行特征選擇時通常使用的個數為六至七個。在選擇了產品的特征之后,我們需要對這些特征的整體水平進行估計。在之后的參數選擇中,我們選擇的特征與這些特征的水平起了決定性作用。其次我們要對產品進行模擬。聯合分析通過虛擬化將產品的特征與特征的水平進行組合,并記錄在卡片之上。再次對受訪者進行調查采集樣本數據。通過對受訪者評價結果的分析,按照其評價排序分析其產品偏好其潛在的購買可能性。最后通過分離出的特征及其偏好計算消費者的特征效用,并且通過這些效用來預測消費者的產品偏好,從而制定相應的策略。
1.1.2 聯合分析的偏好估計模型
主要有:線性矢量模型、理想點模型和效用函數模型及其衍生模型——混合模型,另外還有離散選擇模型。當聯合分析中因變量是數值型變量,自變量是非數值型變量時,多采用的是含虛擬變量的線性回歸模型;如果因變量和自變量都是非數值型變量,則模型的實質是含有虛擬變量的Logit回歸。這些模型都是對一般線性回歸的擴展。
1.1.3 聯合分析的效用估計
(1)水平的效用的估算方法
估計水平效用的方法主要有最小二乘估計和分層貝葉斯估計。最小二乘法的自變量通常選取水平值,對輪廓得分進行回歸,得到的回歸系數就是水平效用值。分層貝葉斯估計是結合自顯性數據的先驗知識和整體輪廓中的抽樣數據估計個體偏好。
(2)屬性重要性的估計
聯合分析假定一個屬性的水平效用差值越大,則表示其在整體輪廓中的重要性越高,反之,差值越小則表示該屬性越不重要。一般常用百分比來表示屬性的相對重要性,計算公式如下:

其中Wi代表第i個屬性的相對重要性,max vij代表第i個屬性的最大水平效用值,min(vij)代表第i個屬性的最小水平效用值。
(3)輪廓效用的估計
輪廓的總效用由屬性之間的關系決定,可加性模型在計算輪廓的總效應時應用最為廣泛,它通常對成分效應的值進行簡單的加和來計算組合屬性的值。另一種較為廣泛應用的方法是交互作用模型,它與可加性模型不同的是它認識到各個因子之間存在交互作用,允許其中的水平組合的值他們的和不同,最后對成分效用的關系進行選擇。
(4)模擬估計偏好份額
聯合分析具有模擬的功能,輪廓效用和偏好份額可以在所有組合條件下計算出來。并借此模擬市場占有率的變化。方法主要有最大效用模型、BTL模型和Logit模型。
1.2 方差分析理論
方差分析是用于檢驗多個樣本的顯著性。受到各種因素共同作用的影響,所研究的數據通常呈現波動形態,我們將造成這種影響的因素按照可控性分為可控因素和非可控因素。它通過分析造成誤差的原因來檢測各個總體均值大小差異,從而得出自變量對因變量的影響,并判斷這種影響是否顯著。我們通常用總平方和來評價總體數據的誤差大小,總平方和中包括組內誤差和組間誤差。方差分析通過考察觀測變量的總平方和中各因素(屬性)所占的比例,來確定觀測變量的變動是否由這些因素引起,如果不能解釋則是由隨機因素造成的。
以單因素方差分析為例,假設要解決的是控制變量A對觀測變量y的影響,而控制變量A有r個水平,假定第i個水平下的觀測變量均值為μi,在第i個水平下第j個觀測變量的值為yij,則可將單因素方差分析模型寫為:

單因素方差分析是一個線性模型,由于方差分析中的控制變量均為非數值變量,因而在模型中引入r-1個虛擬變量可以得到:

這樣,方差分析模型可以看作是線性回歸模型的一種特殊形式,唯一的區別僅在于方差分析中使用的是分類變量,而一般的線性回歸使用的是連續型變量。
1.3 聯合分析與方差分析的相似性
聯合分析和方差分析本質上便是通過線性回歸模型聯系起來的。傳統上認為聯合分析從效用的角度出發,既可以分析屬性的重要性又能給出最優的屬性水平組合,卻不受屬性多少的限制。方差分析中如果因素過多,因素的交互作用成倍增加,就無法準確分離主效應和交互效應。但實際上聯合分析并沒有考慮交互效應,只對各屬性的主效應進行分離,即聯合分析中隱含了各個屬性間不存在交互效應的假定。這樣,拋開交互效應的影響,方差分析也不會受到因素個數的限制,可以對多因素進行方差分解。
1.4 方差分析對聯合分析三種效應估計的替代對比
(1)輪廓總效應估計比較
聯合分析的輪廓總效應估計通常采用的可加性模型即為單個屬性效應的簡單加總;而方差分析中,如前所述,如果只考慮主效應的影響,也就可以將總平方和理解為單個因素的效應的簡單加總。
(2)屬性相對重要性估算比較
聯合分析中屬性重要性的計算采用的是Wi=屬性各個水平效用的極差。
在聯合分析中,如果一個屬性各個水平效用之間的差異越大,這個屬性在整體輪廓中的重要性越高,反之則越不重要。通過對極差值排序就能得到屬性相對重要性的評判。
對應地,在方差分析中提供了各個因素的組間離差平方和、均方誤差和F統計量。這里根據劉冬(2009)的研究,可以選取組間離差平方和來判斷屬性的重要性。因為組間離差平方和可以克服均方誤差收到水平數目影響的缺陷,同時F統計量是建立在正態分布的假定基礎上的,組間離差平方和則沒有這種限制。
另外,組間離差平方和既可以起到極差的作用來判斷屬性的重要性,又可以避免極差受極端值影響的缺陷。
(3)水平效應估算比較
為了驗證方差分析對聯合分析的替代對比,我們采用李德(2011)的碩士論文《基于聯合分析方法的中國快捷酒店行業消費偏好研究》中的調查數據,分別使用聯合分析和方差分析進行對比分析。
2.1 正交模型的建立
為了解中國境內快捷酒店行業的發展狀況,作者針對消費者對快捷酒店各屬性的重視程度以及對快捷酒店消費偏好進行了調查。根據調查目的,選取了A-F6個屬性,各屬性及水平如表1所示。

表1 快捷酒店屬性及水平全輪廓
在對快捷酒店的分析中,6個屬性各對應2~4個水平,共有3×3×4×3×2×3=648個輪廓,對所有的輪廓都進行分析是不現實的,因此采用正交設計縮減輪廓的集合,使得既可以簡化問題又有足夠代表性以進行有效的分析。
作者調查了80名受訪者,他們分別對25個輪廓進行9級李克量表評分,分值越大表示該輪廓越受消費者青睞,反之亦然。
2.2 屬性相對重要性分析
(1)聯合分析結果
采用SPSS16.0軟件進行屬性重要性聯合分析的結果如表2所示。

表2 屬性重要性結果表(聯合分析)
從表2可以看出,按照聯合分析,快捷酒店的屬性重要性依次為:BB服務、寬帶、地理位置、會員服務、單日房價、有無窗戶。
①風險評估:在風險評估工作當中,應嚴格檢查護理人員的衣著是否規范,評價其專業技能水平和應急反應能力,考察其對于消毒隔離制度和無菌操作規程的掌握情況。與此同時,護理人員需要對于無償獻血志愿者的資料進行全面的了解,確認其是否符合獻血的標準和要求。檢查獻血者采血部位皮膚、血管,判斷是否存在淤血腫脹、感染以及橈神經淺支的發生風險,警惕獻血反應征象。根據風險評估結果,實施有效的風險控制措施。
(2)方差分析結果
采用SPSS16.0軟件進行屬性重要性方差分析的結果如表3所示。

表3 屬性重要性結果(方差分析)
表3可以看出,按照方差分析的組間離差平方和排序,屬性的重要性依次為:BB服務、地理位置、會員服務、單日房價、有無窗戶、寬帶。
比較聯合分析和方差分析的結果可以發現,只有對屬性D二者排序的重要性不一致,其他5個屬性的重要性排序都是一致的,而D屬性為快捷酒店的寬帶,由于寬帶的有無以及快慢對不同人的效用有很大差異,方差分析和聯合分析對其的排序不一致也可以理解。因此兩種方法對屬性相對重要性的估計效力不相上下。
2.3 水平效應分析
(1)聯合分析結果
用聯合分析對快捷酒店水平重要性的分析結果如表4所示。

表4 水平效應重要性分析結果(聯合分析)
(2)方差分析結果
從表4可以看出,根據聯合分析得到的效用值,單日房價屬性三個水平的重要性依次為:100元以下、100~150元、150元以上;地理位置屬性三個水平的重要性依次為:很方便、一般方便、很不方便;BB服務屬性四個水平的重要性一次為:早餐和床都很好、床舒服&早餐差或沒有、床不舒服&早餐好、早餐和床都很差;寬帶屬性四個水平的重要性依次為:很快、一般、很慢、無寬帶;有無窗戶屬性兩個水平的重要性依次為:有、無;會員服務屬性三個水平的重要性依次為:很好、一般、很差。
由于方差分析的時候多重比較可選擇的統計量較多且結果基本一致,我們這里給出Tukey HSD檢驗的結果。如表5所示。

表5 A屬性各水平重要性結果
單日房價屬性水平的重要性依次為1(4.6013)、2 (4.3587)、3(3.8175),括號內為水平的均值。地理位置屬性水平的重要性依次為1(4.7975)、2(4.3388)、3(3.4650);BB服務屬性水平的重要性依次為1(4.8888)、2(4.5475)、3 (3.8225)、4(3.5900);D寬帶屬性水平的重要性依次為1 (4.6362)、2(4.3450)、3(4.0975)、4(4.0225);會員服務屬性水平的重要性依次為1(4.7200)、2(4.3313)、3(3.6350);由于E屬性(有無窗戶)只有兩個水平,不做多重比較,這里只給出兩個水平的均值描述統計量,有無窗戶屬性水平的重要性依次為2(4.6475)、1(4.1475),所有屬性水平的重要性與聯合分析完全一致,且大部分的差異都是顯著的。
2.4 結果比較
通過聯合分析與方差分析分別對屬性重要性及水平重要性的分析發現,兩者對水平重要性的排序完全相同,而對屬性重要性的排序只有一個不同。兩者對于快捷酒店屬性的排序最重要的一項均為C(BB服務),聯合分析將D屬性(寬帶)排在了第二位,而方差分析則排在最后一位,其余B(地理位置)、F(會員服務)、A(單日房價)、E(有無窗戶)幾項的排序均相同。
從以上對聯合分析和方差分析的理論及實證分析來看,聯合分析能做的方差分析也能夠實現,而且兩者的結果差異不大。
從理論角度看,聯合分析和方差分析都可以分析自變量為分類變量,因變量為數值變量的數據;方差分析可以看作一種特殊的回歸,而聯合分析實質上是一種自變量為虛擬變量的回歸,所以兩種方法的功能具有相似性;由于聯合分析不考慮屬性間的交互影響,因此方差分析也不受因素個數的限制;兩者對輪廓效應的分析都采用簡單加總,因此屬性分析功能一致;聯合分析通過計算各水平的效應值分析水平的效應,方差分析則可以通過比較均值來實現。
從實證結果看,本文選用了實際數據對聯合分析和方差分析進行對比,除了屬性分析上兩者存在細微差異,可以認為兩者分析效力不相上下。所以研究人員追求“先進性”的研究方法其實也不一定不傳統研究方法好,我們還是在選擇研究方法時多去判斷不同方法之間的異同。
[1]何曉群.多元統計分析(第二版)[M].北京:中國人民大學出版社, 2008.
[2]賈俊平,何曉群,金勇進.統計學(第四版)[M].北京:中國人民大學出版社,2009.
[3]李德.基于聯合分析方法的中國跨界酒店行業消費偏好研究[D].重慶:重慶工商大學(碩士),2011.
[4]劉冬.論聯合分析與方差分析的聯系[D].北京:中國人民大學(碩士), 2009.
[5]高惠漩.應用多元統計分析[M].北京:北京大學出版社,2005.
[6]何曉群.多元統計分析[M].北京:人民大學出版社,2000.
[7]薛薇.SPSS統計分析方法及應用[M].北京:電子工業出版社,2006.
(責任編輯/易永生)
O21
A
1002-6487(2016)20-0076-04
國家自然科學基金資助項目(71263051;71463056)
曹峰(1979—),男,山東寧陽人,博士后,助理研究員,研究方向:人口、資源與環境經濟學。孫慧(1963—),女,江蘇泗陽人,教授,博士生導師,研究方向:人口、資源與環境經濟學。