俱翠
【摘要】利用非參數統計的方法,可以減少實際應用中對假設條件的依賴,不受樣本分布形式限制。本文首先利用Kruskal-Wallis和Brown-Mood檢驗對2006-2011年北京市7個醫藥行業上市公司的凈資產收益率數據進行對比。其次,利用Page檢驗對上述數據進行分析。發現7家公司的資產收益率并無顯著的差異;2006年到2011年其間北京市醫藥生物行業的凈資產收益率是不斷提高的;各家公司的凈資產收益率與北京的整體經濟發展基本協調,公司之間的相差幅度比較小。
【關鍵詞】非參數檢驗;凈資產收益率
當今的經濟研究領域,運用傳統的參數統計進行實證分析非常廣泛。參數統計是建立在假定總體的理論分布類型已知而參數未知,通過抽出的樣本來估計分布中的若干知參數,且用假設檢驗方法來檢驗這些未知參數的合性的方法。然而,在現實生活中,傳統參數統計方法對總體分布的假定常常難以滿足,比如數據并非來自所假定的分布,或者數據根本不是來自一個總體,又或者數據因為種種原因被嚴重扭曲等。故此,在這種情形下仍然進行傳統統計推斷就很容易產生錯誤的結果,影響決策。為此,一種不依賴假定的非參數統計方法應運而生。非參數統計方法在對總體分布一無所知的情況下,也能很容易而又很可靠地獲得結論。在我們的日常生活中,常常會遇到比較兩者嚴重程度、優劣等級、先后次序的這些現實問題,解決此類問題,總體分布條件一般都難以滿足,則不宜選用參數統計方法,而不依賴于對總體分布嚴格假定的非參數估計方法屬分布自由檢驗,是解決這類問題的恰當手段和工具。
基于此,本文試運用非參數統計方法,對近年來北京市醫藥生物行業的凈資產收益率進行截面和時序數據的分析。本文在非參數統計在經濟研究領域應用及優缺點綜述的基礎上,選用Kruskal-Wallis檢驗和Page檢驗法,以北京市7家醫藥生物上市公司的凈資產收益率數據為例,利用sas和R軟件實現截面和時序數據計算的強大功能,對北京市7家醫藥生物上市公司的凈資產收益率進行橫向比較和趨勢分析。
1.非參數統計的適用性及優勢
非參數統計方法涉及很多領域,如電信、信息工程學、生物統計學、非線性時間序列等。非參數統計常用于以下幾種情形:待分析資料不滿足參數檢驗所要求的假定,因而無法應用參數檢驗;資料僅由一些等級構成,因而不能應用參數檢驗;所提的問題中并不包含總體參數,這時也適宜采用非參數方法;當急需要迅速得出結果時采用的簡易方法等。非參數統計的應用優勢主要體現在可以減少模型偏差、具有穩健性、適用范圍廣、簡單易操作等幾個方面。
2.本文選擇檢驗的方法
非參數統計多樣本數據模型檢驗的選擇多樣本的問題是統計中最常見的一類問題,主要涉及如何檢驗幾種不同的方法、決策或試驗條件(稱為處理)所產生的結果是否一樣等問題。首先,看這些樣本是否獨立。在獨立的條件下,我們可以利用Kruskal—Wallis檢驗和Jonckheere.Terpstra檢驗來處理兩種(有序與否)備擇假設情況。但在各樣本不獨立時,如果是完全區組試驗設計,可以引進Friedman檢驗和Page檢驗對應兩種(有序與否)備選假設情況。本文先假設7個醫藥生物公司是相互獨立的,利用多獨立樣本的Kruskal-Wallis和多獨立樣本的Browm-Mood檢驗進行檢驗。其次探討在不獨立時,運用Page檢驗研究其凈資產收益率的的趨勢情況。
3.實證分析
3.1 數據的來源及處理
本文對醫藥生物行業的經營效益情況進行研究,選擇凈資產收益率指標來進行衡量。由于凈資產收益率=稅后凈利潤/凈資產*100%,本文利用上市公司的財務數據,針對北京市7家醫藥生物上市公司(分別為北大國際醫院集團西南合成制藥股份有限公司、北京中關村科技發展(控股)股份有限公司北京北陸藥業股份有限公司、北京星昊醫藥股份有限公司、北京金豪制藥股份有限公司、北京雙鶴藥業股份有限公司、北京同仁堂股份有限公司)的數據(稅后凈利潤來自利潤表中的凈利潤,凈資產來自資產負債表中的所有者權益(股東權益)),選擇2006年到2011年北京市7家醫藥生物的財務數據作為本次研究的對象。由于上市公司的數據為季度數據,我們對數據進行簡單的平均處理,得出每年的凈資產收益率。
3.2 檢驗方法及步驟
3.2.1 多樣本的Kruskal-wallis檢驗
假設多樣本獨立。Kruskal-Wallis秩和檢驗是將所有樣本的值混合在一起看成是單一樣本,再把這個單一的混合樣本中值從小到大排序,序列值替換成秩值,最小的值給予秩值1,有結值時平分秩值。將數據樣本轉換成秩樣本后,再對這個秩樣本進行方差分析,但此時我們構造的統計量KW不是組間平均平方和除以組內平均平方和,而是組間平方和除以全體樣本秩方差。這個KW統計量是我們判定各組之間是否存在差異的有力依據。
在比較兩個以上的總體時,廣泛使用非參數的Kruskal-Wallis秩和檢驗,它是對兩個以上的秩樣本進行比較,本質上它是兩樣本時的Wilcoxon秩和檢驗方法在多于兩個樣本時的推廣。
如果樣本中存在結值,需要調整上面公式中的KW統計量,校正系數C為:
其中第j個結值的個數。調整后的KWc統計量為:
如果每組樣本中的觀察數目至少有5個,那么樣本統計非常接近自由度為的卡方分布。因此,我們將用卡方分布來決定統計量的檢驗。
3.2.2 page趨勢檢驗
對于完全區組設計的檢Page(1963)引進下面檢驗統計量,首先在每一個區組中,對處理排序;然后對每個處理把觀測值在各區組中的秩加起來,得到它具體定義為,其中每一項乘以的主要思想在于:如果是正確
的,這可以“放大”備選假設的效果。在總體分布為連續的條件下,如果沒有打結,則該檢驗是和總體分布無關的。對于一部分的值可以由查表來得到在零假設下的臨界值c,滿足。當固定,而時,在零假設下有正態近似,這里,
。在區組內有打結的情況下,可修正為:
這里為在第個處理中及第個結中的觀測值個數(結統計量)。
3.3 檢驗結果及分析
運用sas軟件,對上述的數據進行多獨立樣本的Brown-Mood檢驗和Kruskal-Wallis檢驗,其結果如圖1和圖2。
圖1 K-S檢驗結果
圖2 Brown-Mood檢驗結果
Kruskal-Wallis檢驗統計量對應的p值“Pr>Chi-Square”等于0.7168,在給定的顯著性水平0.05的條件之下,不能拒絕原假設,即認為7家公司的凈資產收益率并無顯著性的差異。同樣,對于Brown-Mood檢驗來說,也是不能拒絕原假設,認為7家公司的凈資產收益率并無顯著性的差異。
在進行page檢驗之前,運用R軟件繪制2006年-2011年北京上式醫藥生物行業凈資產收益率的趨勢圖(圖3)。
圖3 2006年-2011年北京上式醫藥生物行業凈資產收益率的趨勢
圖3橫軸為7個醫藥生物公司,縱軸為凈資產收益率。圖3中折線的每個拐點代表一個公司。顯然,08年和10年各公司的凈資產收益率變動浮動比較大,同時第二個拐點處的波動幅度比較大,說明北京中關村科技發展(控股)股份有限公司的凈資產收益率變動較大。對于其他年份,略見平緩,地區間的增長率也沒有十分明顯的趨勢,這就要求我們進行更進一步的驗證。
原假設為7種處理的位置參數是相等的。即,備擇假設為。根據凈資產收益率,寫出處理在每個區組(年份)之中的秩。由前面構造統計量的方法計算L值,最終求得。認為這六年來北京市醫藥生物行業的凈資產收益率以原假設的次序遞增。其中北京北京星昊醫藥股份有限公司最高,最低的為北京中關村科技發展(控股)股份有限公司。用R軟件進行page趨勢檢驗。運行結果求得Pvalue=0.02275013,可知在0.05的顯著性水平下,拒絕原假設,說明7家醫藥生物公司的凈資產收益率處于增長的趨勢。
表1 2006年-2011年北京上市醫藥生物行業凈資產收益率的秩
公司 06年 07年 08年 09年 10年 11年 Ri
北大國際醫院集團西南合成制藥股份有限公司 2 2 1 2 5 4 16
北京中關村科技發展(控股)股份有限公司 1 1 2 1 1 1 7
北京北陸藥業股份有限公司 7 7 7 5 2 3 31
北京星昊醫藥股份有限公司 6 6 6 7 7 7 39
北京金豪制藥股份有限公司 5 3 3 6 6 2 25
北京雙鶴藥業股份有限公司 3 5 5 4 4 5 26
北京同仁堂股份有限公司 4 4 4 3 3 6 24
4.結論
本文所選取的北京市醫藥衛生行業財務數據,只能說是評價北京醫藥行業運營效益的一個重要指標。公司的運營效益總是與一個地區的經濟息息相關,醫藥行業作為能夠衡量經濟發展的一個很重要的行業,對于經濟的發展有一定的評價作用,從文章中實證的結果,北京醫藥生物行業的整體發展趨勢較好,且公司之間差異性不是很明顯,可以說明北京的經濟處于一個較穩定的階段。
參考文獻
[1]李志強,王超麗.運用非參數統計方法的科技投入對比研究[J].科技與經濟,2012.
[2]姜瑋.非參數統計的作用及其在證券投資分析中的應用的綜述研究[J].中國商界,2010.
[3]章瑩.基于非參數統計的國內基金公司投資績效對比分析[J].線代商貿工業,2008.
[4]吳喜之,趙博娟.非參數統計[M].中國統計出版社,2009.
[5]杜強,賈艷麗.sas統計分析標準教程[M].人民郵電出版社,2010.