【摘要】我相信很多股民都能感受到他們手中持有的股票總是和指數同進退,也就是相關性很強,可是他們不知道具體的相關系數值是多少。本文隨機抽取30支股票作為樣本對于這個問題給出了點估計與區間估計。同時本文也給出了不同指數間的相關系數值。通過對于這些相關性的研究,大家可以了解到對于在我國想要運用股票組合來降低風險,我們還得進行重新思考。
【關鍵詞】相關系數 點估計 置信區間 系統風險
一、關于相關系數的一些概念
人們經常會遇到的一些確定的函數關系,比如圓的周長S即它和它的半徑R之間的關系可表示為S=2ΠR。這是一種確定的函數關系。還有一種是由于有各種不確定的因素的影響,變量間的關系呈現出不確定性,人們稱之為相關關系或統計關系,如大家都知道成本可以影響利潤,但消費者嗜好也起作用,所以難以給出成本與利潤之間的函數關系。在一定的條件下人們可以把相關關系轉化為函數關系,如計量經濟學家經常這樣做,以幫助他們研究一些經濟問題。
雖然人們可以通過畫圖描點來觀察變量間的相關關系,但對于變量相關關系的程度卻給不出精確的答案。在統計學中有一個比較常用的簡單線性相關系數,它可以給出我們想要的答案。本文就是用它來測量個股與指數之間的相關程度的。
二、對股票市場的感受
在股票市場中人們總是能感受到,當市場萎靡時也就是指數下跌時,我們手中的股票下跌的可能性就比較大。所以很多有經驗的股民在感受到局勢不妙時,就暫時退出市場以免受到更大的損失。基于我的研究,我將告訴你這樣做是十分正確的。相信很多人都看得出個股與指數的相關關系很強,但不知道具體的相關系數數值,這正是我想要探尋的。
三、個股與指數的相關系數
在這一部分,我將運用一些簡單的統計學的知識給出個股與指數的平均相關關系的均值估計值和其95%的置信區間。通過這些數值大家來看看我們對于股市的感受是不是和這些數值相符合。
我先給出上證指數和股票中國寶安(000009)的相關系數。
上表是通過Eveiws軟件計算出來的,當然通過Excel也可以實現這樣的目的。在表頭Sample中顯示了觀測數據的起止日期即2015年4月14日到2015年9月2日。Included observations顯示觀測個數為100。表中Y表示上證指數,X1表示股票000009。同期的相關系數都是0.8680(同期時兩個變量的地位相等,數據也無變化)。當Eveiws報告出這個數值時,我確實被嚇到了,這比我想象中的還要高!在這里我還要提醒讀者,000009有幾個交易日是停牌的,我把其停牌日的數據取最近一個交易日的收盤價,這樣就造成了計算出來的相關系數值有些偏誤(這也是不可避免的),至于是向上的偏誤還是向下的偏誤我無法判斷,但我認為向下的偏誤的可能性更大一些。
也許讀者已經注意到了在最右邊的一列依次顯示的是Y(上證指數)各期滯后值與X1(000009)當期值的相關系數也很高,但隨著滯后期的增加,相關程度有減弱的痕跡。這也很符合現實,即過去的影響力在減弱。同時時間序列數據一般都是有趨勢的,所以Y的過去值和X1的當期值也會有關聯。比起它們同期的相關系數也許讀者可能更關心Y的滯后值與X1當期值的相關系數。沒錯我們可以從上表中看到前一天的Y值與今天的X1值的相關系數不僅為正而且還很高。
讀者可能會對此提出質疑,因為我計算的相關系數可能不是凈的相關系數(偏相關系數),比如上證指數和000009相關,而000009和000096相關以及上證指數和000096也相關,所以出于謹慎態度我給出一個例子來說明這個問題。
下表是000009(X1)和000096(X2)的相關系數,這個結果也是Eveiws報告出來的。
我用日r12代表Y與X1的相關系數,r23代表X1與X2的相關系數,r13代表Y與X2的相關系數,其中r13在后文中我們將會給出。
給出偏相關系數公式如下,以算出000009和上證指數的偏相關系數。
將數值帶入公式我們得出的結果是0.907480248,顯然我之前給出的0.8680是向下偏誤的,這只是一階偏相關,似乎我應該用兩千多階偏相關系數才是正確的,但是不管怎樣它們都處在同一個系統中相互影響,所以我就無需計較它們各自的凈影響,還是把0.8680作為我要用的數據更為妥當。
當然這只是000009和上證指數的關系,我下面會給出一個樣本容量為30的樣本,我將不僅給出它們同期的相關系數而且同時給出Y滯后一期時的相關系數。
以上就是我計算出來的樣本股票與上證指數的相關系數和上證指數滯后一期的相關系數。
其中絕大多數股票與指數的相關系數在0.7以上,但也有些比較低。我們特別關心那些和指數相關系數特別低的股票,它們是000096、002143、000025,他們與上證指數的相關系數分別為經營范圍:興辦實業(具體項目另行申報);國內商業,物資供銷業(不含專營,專控,專賣商品);投資電力企業(具體項目另報);成品油(由分支機構經營);經營液化石油氣(限瓶裝,經營場地另辦執照)進出口業務按《中華人民共和國進出口企業資格證書》辦。
主營業務:油品、液化石油氣銷售及電力投資.是深圳市乃至珠三角地區油品及液化石油氣的主要經銷商之一。
002143印紀傳媒
經營范圍:制作、發行,專題、專欄、綜藝、動畫片、廣播劇、電視劇;影視娛樂文化信息咨詢,制作、代理、發布戶內外各類廣告及影視廣告;企業形象策劃;公關咨詢;公共關系專業培訓。(在取得相關行政許可后,按許可部門核定的經營項目開展經營活動,未取得相關行政許可的,不得開展經營活動)
主營業務:設計、制作、代理、發布戶內外各類廣告;傳媒娛樂項目投資、娛樂營銷;企業形象策劃;市場調研服務,會展會務服務;營銷信息咨詢;公關咨詢;公共關系專業培訓。
經營范圍:投資興辦實業(具體項目另行申報)。國內商業、物資供銷業(不含專營、專控、專賣商品)、物業租賃與管理。自營本公司及所屬企業自產產品、自用生產材料、金屬加工機械、通用零件的進出口業務、進出口業務按深貿管證字第098號外貿審定證書辦理。
主營業務:汽車銷售、汽車檢測維修及配件銷售、物業租賃及服務等。
通過對以上3家公司經營范圍和主營業務的了解,我感到很吃驚,因為很多人認為像這樣幾家和經濟周期緊密聯系的公司其股票應該會和指數的關聯性更強一些。對于這個問題的回答,我給出的猜測是,也許我國股票市場本身和經濟周期的關聯也不強。下面我們利用上面的方法計算出GDP指數(反應經濟周期的數據)和上證指數的相關系數。
在上表中我們使用的是季度數據,其中Y表示季度上證指數的收盤價,G表示季度GDP指數。從報告結果來看,它們的關聯系數為-0.0917。所以我上文中的推測還算合理。
下面我將給出本文想要做到的,即給出個股與指數相關系數的均值估計值。
上表是個股與上證指數的同期相關系數,我用30個樣本數據來估計總體均值。其中點估計是0.792,也就是上表中的樣本均值。在95%的置信水平下的區間估計為(0.703926687,0.880073313)。看到這個結果,我們可以對市場多少有些感悟,我們在這個市場中做股票組合對于分散總風險,可能沒有多少幫助,因為按這樣高的相關系數看,個股的特別風險只占很小的部分,而系統風險占了很大部分。
上表給出的是Y(上證指數)滯后一期與個股的相關系數,同上也是30個樣本數據。其中點估計也很高為0.76338667,也就是上表中的樣本均值。在95%的置信水平下的區間估計為(0.679158567,0.847614766)。由于這些數據是有趨勢的,所以我們也可以得出這樣的結果。
上文中提到既然我們不能通過在上證市場中構造股票組合來降低總風險(因為系統風險太高),那么我們可不可以在其他指數如創業板和中小板中挑選一些股票和上證指數中的股票進行組合來降低總風險呢?我給出的回答是否定的,因為上證指數和中小板指數以及創業板指數的相關系數都很高。不僅如此,它們滯后期與當期的相關系數也很高。下面是Eveiws報告出來的結果。
上表是中小板指數和上證指數的相關系數結果。數據是2015年4月14日到2015年9月2日的100個交易日的指數收盤價。其中Y代表上證指數,Z1代表中小板指數。
上表是創業板指數和上證指數的相關系數結果。數據是2015年4月14日到2015年9月2日的100個交易日的指數收盤價。其中Y代表上證指數,Z2代表創業板指數。
上表是創業板指數和中小板指數的相關系數結果。數據是2015年4月14日到2015年9月2日的100個交易日的指數收盤價。其中Z1代表中小板指數,Z2代表創業板指數。
四、總結
通過上面的分析,我得出了一些令人興奮的結論。
第一,個股和上證指數的相關系數很高在0.79左右,所以我們在上證指數中挑選股票組合以降低總風險的策略效果不佳,因為系統風險占比很高,所以股票組合的總風險依然很高。買個股與買指數基金效果差別不大。
第二,我們也不能通過在不同指數中挑選股票來降低總風險,因為其他指數(創業板和中小板)和上證指數的相關系數也很高,所以我對于在股票市場中降低總風險感到無能為力,但是還有其他品種如債券和不動產等投資對象可以供投資者選擇。所以我建議對金融市場不是很了解的人,要合理分配自己的投資比重。
第三,我們在第三部分也看到了,指數的滯后幾期和個股間也表現出較高的正相關系數,這可能是因為數據序列是有持續趨勢的,或者也可以稱其可能符合隨機游走。
第四,我在文中也提到了,GDP指數與上證指數的相關性很低,所以一些周期性行業的公司(就是和GDP指數關系密切)未必和指數表現出強的相關性。
參考文獻
[1]袁衛.統計學(第三版)[M].2009.
[2]達摩達爾·N·古扎拉蒂.計量經濟學基礎(第五版)[M].2011.
作者簡介:董雪建(1991-),男,漢族,河南省信陽人,云南財經大學碩士研究生,研究方向:金融。