999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

多指標面板數據聚類方法及其應用

2012-07-24 09:34:42任娟
統計與決策 2012年4期
關鍵詞:方法

任娟

(南京航空航天大學 經濟與管理學院,南京 210016)

0 引言

面板數據結合了截面數據和時間序列數據的特征,具有優良的特性,在研究中日益受到重視。然而,國內外很少學者考慮面板數據的多元統計分析。Bonzo D.C.和Hermosilla A.Y.[1]開創性地將多元統計方法引入面板數據的分析中,并用概率連接函數和遺傳算法改進了聚類分析。Ren J.[2]基于Fisher有序聚類理論,通過Frobenius范數重建了Ward函數,提出了一種多指標面板數據有序聚類方法。該方法沒有考慮指標的動態性,如指標的增長速度等。朱建平和陳民墾[3]對單指標面板數據的聚類分析進行了研究,其聚類算法和聚類過程類似于截面數據的聚類分析。李因果和何曉群[4]綜合考慮了面板數據的“絕對指標”和“增量指標”,在重構面板數據相似性測度的基礎上,提出了面板數據聚類方法。這種方法的不足之處是它對指標的增長速度的局部變化不能進行區分。另外,以上方法都是假設時間序列是同步的,但是,在現實世界中,這一條件并不總能滿足,許多情況下它們是非同步的。因此,本文認為應綜合考慮面板數據水平指標、增量指標、增量變化率指標及其非同步時間序列問題,為解決多指標面板數據聚類問題,擬提出一種面板數據聚類方法。

1 面板數據的數據格式

1.1 單指標面板數據

單指標面板數據的數據格式可以用一個二維表來表示。單指標面板數據聚類分析有兩種處理方法:一種是轉換方法,將單指標面板數據的時間維度轉換為截面數據的指標維度表示,兩種數據的統計描述特征相似,在聚類分析中,二者關于樣品距離的算法、聚類過程都是相同的,因此,單指標面板數據的聚類分析可以借鑒截面數據的聚類分析,可以直接運行相關軟件進行計算。另一種是一維有序樣品聚類方法,將單指標面板數據的空間維度轉換為有序樣品的指標維度表示,但需要進行降維處理得到一維指標。目前有不少專業軟件可以完成一維樣品有序聚類計算,比如DPS等。

1.2 多指標面板數據

在實際中,由于現象的復雜性,研究對象往往表現為多指標面板數據X,它表示一個樣本。多指標面板數據的結構要復雜一些,嚴格上應該用三維表來表示,也可以將其表示為矩陣形式。設一個樣本X包括的q個樣品,每個樣品的特征用p個指標描述,時間序列長度為T,實際上多指標面板數據含有空間(樣品)、指標和時間三個維度。

樣本X在空間維度上可表示為一組“空間樣品”,也就是將三維表在空間上展開為二維表,即:樣本X的一個“空間樣品”Xi的矩陣表示為:

2 多指標面板數據的時間序列特征

依據已有文獻,按照聚類分析處理面板數據的方法有:(1)每年分別進行聚類,顯然會造成各年度分類結果的不一致。(2)采取退化方法,對指標取其年度平均值進行聚類,消去時間維度,顯然損失了指標的時間維度信息。(3)采取簡化方法,不考慮指標的時序性,認為各時點上的指標對歐氏距離的貢獻程度一樣,顯然,忽視了指標的時間維度信息。(4)僅采用指標的水平值或者增量進行聚類,這種聚類結果不是忽視了指標的動態性,就是抹殺了指標的水平狀態。(5)采取綜合方法,采用指標的水平值和增量進行聚類,雖然提取了增量時間序列信息,但沒有進一步提取增量變化率時間序列信息。

顯然,上述五種聚類思路都存在一定的缺陷,對多指標面板數據的聚類:一方面要考慮樣本指標間的距離,另一方面必須考慮其時間序列的動態發展特征。因此,構造相似性指標時,必須考慮面板數據的水平指標、增量指標和增量變化率指標的時間序列。其中,水平指標的時間序列是第i個樣品的單個水平指標構成的時間序列增量指標的時間序列是將時間序列進行一階差分得到的序列,其中,增量變化率指標的時間序列是將時間序列進行二階差分得到的序列,其中:

3 聚類方法及聚類步驟

聚類分析是對q個樣品進行分類或對p個指標進行分類,其中前者稱為Q型聚類,后者稱為R型聚類。聚類分析有兩個關鍵問題:一是衡量樣品(或變量)間鄰近或相似程度的度量,另一個是聚類方法。

聚類分析常用的距離有絕對距離、歐氏距離、明考斯基距離、切比雪夫距離妙、馬氏距離等。常用的相似系數有夾角余弦、相關系數等。雖然多指標面板數據與截面數據的歐式距離有差異,但只是形式上的差異,本質上是一致的。這里,考慮采用樣本各指標的水平值、增量、增量變化率時間系列提取面板數據時間維度信息,選擇歐式距離來描述樣品之間的鄰近程度,即第u樣品與第v樣品之間的歐式距離d(u,v)為:

其中:

共3T-3個變量用來描述第i個樣品的第j個指標的水平值、增量、增量變化率時間序列,記為并用表示第i個樣品Xi。

樣品歐式距離d(u,v)可以認為是樣品間水平值、增量、增量變化率時間序列的三種距離的加權求和。權重一般根據實際問題進行設定,本文認為它們是等權重的。

考慮不同樣品的不同時期的相似性測度問題,則第u個樣品滯后h期與第v個樣品的滯后k期的歐式距離d(u-h,v-k)為:

其中:

用來描述第i個樣品的第j個指標滯后k期的水平值、增量、增量變化率時間系列,記為表示第i個樣品滯后k期為計算歐式距離時,對應的時間序列長度必須是相同的。

用于計算歐式距離的指標需滿足以下條件:指標之間不相關;消除各指標量綱的影響。相應的解決方法:原始數據通過因子分析得到的公共因子是不相關的;數據標準化處理即可消除量綱的影響。

實際應用中可根據指標重要性進行加權修正,權重系數可以根據研究問題的實際情況主觀給定或客觀測定,如實踐中常用的專家調查法,AHP,模糊判別,方差貢獻,熵權系數等方法確定權重系數。

聚類方法有系統聚類法、分解聚類法、有序樣品聚類法、動態聚類法、模糊聚類法等多種,其中,系統聚類法是目前國內外使用得最多的一種聚類方法。系統聚類法按類間距離的不同定義又可分為最短距離法、最長距離法、平均距離法、重心距離法和離差平方和法等。這里僅討論離差平方和法。

在類Gu中的樣品的離差平方和為:

其中,i∈Gu表示樣品Xi是類Gu中的一個樣品表示類Gu的第j指標在t時間的均值是類Gu中樣品的個數。

Wald認為兩類合并時所增加的離差平方和可以定義為兩類的平方距離。類Gu和類Gv間的離差平方和距離D2(u,v)定義為:

其中,Su、Sv和Sl分別是在類Gu和Gv以及它們并成的新類Gl中樣品的離差平方和,s和t分別是類Gu和Gv中樣品的個數,分別是類Gu和Gv的重心,分別表示Xi是類Gu和Gv中的一個樣品。

離差平方和法的遞推公式:在類Gm和類Gq合并成新類Gr后,新類Gr與另一類Gk的距離D(k,r)可表示為:

其中nk、nm、nr和nq分別表示類Gk、Gm、Gr和Gq中樣品的個數。

系統聚類的計算步驟包括:定義樣品間距離,計算樣品兩兩間距離構成的距離矩陣;合并距離最近的兩類為一新類,計算新類與當前各類的距離;如此循環,直至并為一類為止;畫聚類圖。

4 實證分析

4.1 聚類結果及分析

本文采用平均價格指標及其增量、增量變化率衡量公司的差異化戰略,采用銷售量指標及其增量、增量變化率衡量公司的低成本戰略。基于2009年3月~2010年3月國內空調市場上24個品牌(總的市場占有率為98%)的營銷統計數據,對24個品牌進行了聚類分析。數據來源于中怡康公司中國城市家電市場零售監測報告。戰略變量的描述涉及平均價格和銷售量兩個關鍵指標。數據的處理采用SPSS16.0和Matlab7.4軟件。聚類結果如圖1所示。第一類為海信、松下、三星、LG、三菱電機、日立、三菱重工、夏普和大金共9個品牌,這類企業產品平均價格高,價格波動小,溢價能力強,市場占有率比較穩定,采用差異化戰略參與市場競爭。其中,日立、三菱電機、三菱重工、夏普、松下均為日本品牌,三星、大金、LG則為韓國品牌,僅有海信為本土品牌。顯示日韓企業在中國市場的競爭策略甚為接近,在廣大的中國市場上不追求市場占有率,采取穩扎穩打的策略,這是日韓企業近年來采用輕資產戰略(降低重資產、增加無形資產)的結果。海信作為變頻空調龍頭企業,注重技術創新和產品質量,競爭戰略與日韓企業相似。第二類為新科、揚子、奧克斯、志高、惠而浦、長虹、科龍、TCL、格蘭仕、新飛和春蘭共10個品牌。除了惠而浦為美國品牌,其余全為本土品牌。這類企業產品平均價格較低,價格波動大,市場占有率不穩定,傾向于價格戰來爭奪市場份額,溢價能力弱,創新能力不足,推出新產品較少,采用低成本戰略參與市場競爭。第三類為伊萊克斯。伊萊克斯為瑞典品牌,其產品平均價格較高,價格波動大,溢價能力一般,既追求市場份額,又塑造高檔形象;體現為在低端路線和高端路線的選擇上搖擺不定,這是因為伊萊克斯正處在由低端產品向高端產品戰略的轉型時期,陷入了“夾在中間”的困境。第四類為格力、美的和海爾。其產品平均價格較高,價格波動較大,市場占有率高,產品溢價能力強,創新能力強,新產品推出較多。采用低成本和差異化戰略參與市場競爭。

圖1 面板數據聚類分析譜系圖

4.2 面板數據聚類方法比較分析

為說明本文提出的聚類方法的優越性,下面采用上例的數據來進行驗證,并給出本文方法和文[4]的多指標面板數據聚類方法分類效果的比較。

文[4]采用水平指標和增量指標進行面板數據聚類,一定程度上刻畫了水平指標的發展變化情況,但是沒有進一步對增量變化程度的刻畫,所得分類結果不夠細致。本文方法采用水平指標、增量指標和增量變化率指標綜合測度面板數據的樣品相似性,提取信息比較充分,所得分類結果(圖1)比較細致。另外,實際應用中,根據研究問題的實際情況也可采用三種量的組合進行聚類。

表1 24個空調品牌的面板數據聚類結果

5 結論

本文聚類方法特別適用于針對具有多指標的面板數據的樣品分類問題,綜合考慮面板數據的水平指標、增量指標和增量變化率指標的時間序列特征及其非同步時間序列問題,重新構造了離差平方和函數,提出了一種多指標面板數據聚類方法。通過實證分析,表明新方法能夠解決多指標面板數據聚類的問題,分類效果較好。但是分類規模較大時,分類將呈現組合爆炸的趨勢,計算量隨著急劇增加,尋找最優解變得困難,對于采用遺傳算法等人工智能方法搜尋次優解有待于將來進一步的研究。

[1]Bonzo D C,Hermosilla A Y.Clustering Panel Data via Perturbed Adaptive Simulated Annealing and Genetic Algorithms[J].Advances in Complex Systems,2002,(4).

[2]朱建平,陳民墾.面板數據的聚類分析及其應用[J].統計研究,2007,(4).

[3]Ren J,Shi Sh L.Multivariable Panel Data Ordinal Clustering and Its Application in Competitive Strategy Identification of Appliance-wir?ing Listed Companies[C].International Conference on Management Science& Engineering(16th),Moscow,Russia,2009.

[4]李因果,何曉群.面板數據聚類方法及其應用[J].統計研究,2010,(9).

猜你喜歡
方法
中醫特有的急救方法
中老年保健(2021年9期)2021-08-24 03:52:04
高中數學教學改革的方法
河北畫報(2021年2期)2021-05-25 02:07:46
化學反應多變幻 “虛擬”方法幫大忙
變快的方法
兒童繪本(2020年5期)2020-04-07 17:46:30
學習方法
用對方法才能瘦
Coco薇(2016年2期)2016-03-22 02:42:52
最有效的簡單方法
山東青年(2016年1期)2016-02-28 14:25:23
四大方法 教你不再“坐以待病”!
Coco薇(2015年1期)2015-08-13 02:47:34
賺錢方法
捕魚
主站蜘蛛池模板: 蜜桃视频一区| 色偷偷一区| 免费一级毛片不卡在线播放| 99热这里都是国产精品| 成人免费视频一区| 久久视精品| 久久久噜噜噜| 亚洲五月激情网| 国内精品自在欧美一区| 一本大道视频精品人妻| 欧美三级不卡在线观看视频| 日本www在线视频| 被公侵犯人妻少妇一区二区三区| 免费毛片全部不收费的| 午夜小视频在线| 中文字幕在线永久在线视频2020| 国产美女主播一级成人毛片| 亚洲一区免费看| 98精品全国免费观看视频| 久久99精品久久久久纯品| 精品欧美视频| 亚洲美女视频一区| 天堂va亚洲va欧美va国产| 国产成人做受免费视频| 日韩av电影一区二区三区四区| 无码AV高清毛片中国一级毛片| 成人精品免费视频| 久久一级电影| 日韩精品一区二区三区免费| 嫩草在线视频| 亚洲欧洲自拍拍偷午夜色| 国产一级做美女做受视频| 欧美性猛交一区二区三区| 波多野结衣中文字幕久久| 亚洲免费福利视频| 亚洲人成网站在线播放2019| 国产网站黄| 波多野结衣第一页| 亚洲一级毛片| 日本在线亚洲| 亚洲va欧美ⅴa国产va影院| 视频一区视频二区日韩专区| 99视频只有精品| 2021亚洲精品不卡a| 亚洲日韩精品无码专区| 亚洲国产成人麻豆精品| AV色爱天堂网| 午夜国产不卡在线观看视频| 国产一级小视频| 日韩小视频在线观看| 久久伊人操| 国产aaaaa一级毛片| 国产日韩丝袜一二三区| 999国内精品视频免费| 午夜精品久久久久久久99热下载| 亚洲视频色图| 日本亚洲最大的色成网站www| 欧美日韩综合网| 四虎影视无码永久免费观看| 欧洲极品无码一区二区三区| 伊人激情久久综合中文字幕| 国产精品3p视频| 久久a级片| 精品一区二区三区水蜜桃| 99这里只有精品免费视频| av在线5g无码天天| 国产一级毛片网站| 国产二级毛片| 国产无码性爱一区二区三区| 亚洲无线一二三四区男男| 国产精品视频观看裸模| 亚洲欧洲一区二区三区| 国产网站免费| 亚洲色图欧美激情| 中文字幕乱妇无码AV在线| 91亚洲精品国产自在现线| 91丨九色丨首页在线播放| 欧美综合区自拍亚洲综合天堂| 国产区人妖精品人妖精品视频| 国产人人射| 欧美色99| 中文字幕2区|