999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于混沌游戲表示和自適應仿射傳播聚類的股票板塊分類

2020-11-02 18:28:06張紫璇段紅梅
財會月刊·上半月 2020年10期

張紫璇 段紅梅

【摘要】為對我國A股進行板塊分類, 首先用混沌游戲表示算法對股票日收益率數據進行降維, 再用自適應仿射傳播聚類算法得到將所有股票分為5類和11類兩種板塊的分類結果。 與證監會行業分類中類內外平均相關系數差0.0140相比, 分5類時類內外相關系數差均值為0.0284, 分11類時, 類內外相關系數差均值為0.0270, 均比證監會行業分類區分度高。

【關鍵詞】混沌游戲表示;自適應仿射傳播聚類;股票板塊分類;A股

【中圖分類號】F832.5 ? ? ?【文獻標識碼】A ? ? ?【文章編號】1004-0994(2020)19-0152-4

一、引言

股票板塊分類方法中應用最廣的是按股票行業分類。 早在1966年, 美國學者Kahle等[1] 就指出股票價格的變動會受到行業分類的影響。 之后又有學者得出了行業因素能解釋股票收益率26%波動率的結論[2] 。 現有的行業分類標準主要有ISIC行業分類、GICS、證監會行業分類、WIND行業分類、申銀萬國行業分類及中信證券行業分類等。 上市公司行業信息是上市公司對外應披露信息的重要方面。 上市公司行業分類方法的科學與否, 對于規范和提高上市公司信息披露質量、市場參與者對公司股票進行定價、投資者進行投資決策都有著直接的影響。 由于各種原因, 我國證券市場在建立之初沒有對上市公司進行統一的分類, 上海、深圳證券交易所根據各自工作的需要, 分別對上市公司進行了簡單劃分:上交所將上市公司分為工業、商業、公用事業和綜合四類; 深交所則分為工業、商業、公用事業、金融和綜合五類。 近年來, 隨著證券市場的發展、上市公司數量的激增, 兩交易所原有分類的不足表現得越來越明顯:分類過粗, 給市場各方對上市公司進行分析帶來了很多不便。

本文采用混沌映射聚類算法, 根據上市公司的股票價格建立相關映射, 并且將該金融時間序列的相關系數與映射之間的耦合強度聯系在一起進行分析。 以我國A股日收益率數據為數據源, 通過混沌游戲表示算法降維和自適應仿射傳播聚類算法進行聚類分析, 從而獲得新的上市公司板塊分類結果, 對比原有的證監會行業分類結果, 本文提出的分類結果區分度更高, 類內外平均相關系數差別也更加明顯, 與當前A股企業實際較為貼合。

二、模型構建

1. 數據。 根據上市公司的股票價格建立相關映射, 并且將該金融時間序列的相關系數與映射之間的耦合強度聯系在一起進行分析, 基于本論文的分析訴求, 在對分析數據進行選擇時, 以我國A股(包括上交所和深交所)2843只股票2007年1月1日 ~ 2017年1月23日的交易數據為對象, 將其日收益率作為聚類數據進行研究。

初始數據集一共包含3325只股票數據。 股市中通常把上市時間不足半年的股票稱為新股, 而新股存在新股弱勢且數據量少, 故刪除268只發行時間少于180天的股票; 研究過程中, 發現有上百只股票自2016年5月1日起不再有交易數據, 數據缺失時間較長, 故刪除2016年5月之后沒有交易數據的116只股票; 刪除B股。 剩余2843只股票。 在數據分析中, 本文充分考慮了2008年全球金融危機的影響和2015年A股股災異常波動的影響, 對相關數據進行了相應處理, 以求在數據層面更加切實地反映正常交易市場下股票的數據信息。

證監會上市公司行業分類結果來自2017年2月16日在證監會網站發布的2016年四季度上市公司行業分類結果。 研究發現, 采用混沌游戲模擬可以實現數據的自然分割, 相同行業背景下的公司通常是聚合在一起的, 下文重點結合混沌游戲與上市公司交易數據進行整合分析。

2. 混沌游戲表示。 混沌游戲表示算法流程如下:①作一個正方形, 四個角分別表示DNA序列中的A、C、G、T四種堿基。 ②在正方形面上隨機取一個初始點。 ③對于任意一個長度為N的DNA序列, 按照DNA序列中的堿基順序, 用以下方法繪制混沌游戲表示(CGR)圖:按順序讀取DNA序列的堿基, 繪制讀到的堿基對應的角與初始點的中點, 并將這個中點設為新的初始點, 得到一張包含N+1個點的CGR圖。 更具體地說, 令A、C、G、T分別為P1(0,0)、P2(4,0)、P3(4,4)、P4(0,4), CGRi(x,y)為要在CGR圖中繪制的第i個點, Pi(x,y)是序列的第i個點, 按以下迭代公式得到CGR圖中所有的點:CGRi(x)=[CGRi-1(x)+Pi(x)]/2,i=1,…,N; CGRi(y)=[CGRi-1(y)+Pi(y)]/2,i=1,…,N。

CGR圖有以下性質:①當將CGR圖用x=0,1,2和y=0,1,2分為如圖1所示的4個分塊時, 若CGRi(x)落在第一個分塊, 按以上第一個迭代公式得到這個CGR點對應的DNA堿基一定是A, 其他三個分塊類似。 ②參照第一條性質, 當將CGR圖用x=0,1,2,3和y=0,1,2,3分割成16個分塊時, 以AT塊為例, 若CGRi(x,y)落在AT塊, 按以上第一個迭代公式得到這個CGR點對應的DNA堿基一定是A, 上一個DNA堿基為T, 其他分塊類似。 ③當將CGR正方形進行更高維的剖分時, 類似的結論仍然成立。 基于CGR圖的這個性質, 可以認為在CGR圖中, 序列的順序被充分表達。 將圖2中的16個分塊按1 ~ 16進行編號, 令Sk(k=1,2,…,16)為落在第k個分塊內的CGR點數, 則Fk=Sk/N(k=1,2,…,16)。 其中N為DNA序列的長度, 這樣任意一個序列都將能轉化為一個16維的向量。

3. 混沌映射聚類算法。 在混沌映射聚類算法被引入作為主要算法時, 是將要被聚類的那些元素嵌入一個D維的特征空間里。 在這個框架下, 每個數據點都被看成在承載混沌映射動力學的網格上有一個對應的位置。 相應在原始數據空間中的高密度區域, 在靜態的體系下同步映射聚類會出現。

4. 自適應仿射傳播聚類算法。 仿射傳播聚類在算法進行之前不需要確定最終聚類族的個數, 且適合大類數的聚類。 在算法開始時, 所有的數據點都被看作潛在的聚類中心。 在算法進行中, 仿射傳播聚類算法為數據集收集信息得到兩個重要的證據矩陣:吸引信息矩陣R和歸屬信息矩陣A。 r(i,k)描述了數據點k適合作為數據點i的聚類中心的程度; a(i,k)描述了數據點i選擇數據點k作為其聚類中心的程度。 r(i,k)和a(i,k)越大, 證據越強, 數據點k作為最終聚類中心的可能性就越大。 仿射傳播聚類算法在信息傳遞過程中, 兩個矩陣的迭代過程如下:rt+1(i,k)=s(i,k)-max{at(i,k')+s(i,k')}, k'≠k; at+1(i,k)=min{0,rt(k,k)}+ ? ?max{0,rt(i',k)}, i≠i,k。 迭代完成后得到m個可行度較高的聚類中心和對應的聚類結果。

自適應仿射傳播聚類算法輸入變量數據集為待聚類變量集, 主要輸出參數有以下幾個:①矩陣“labels”, 以類標的形式存儲不同類數的聚類結果; ②向量“NCs”,存放“labels”對應的類數;③“NCopt”, 存放最優類數, 最優類數對應的聚類結果可在“labels”中查找; ④“Sil”, 存放不同類數的聚類結果的Silhouette指標的平均值; ⑤“Silmin”, 存放每一個聚類結果中任意兩個聚類Silhouette指標中的最小值。 Silhouette指標記為Sil(t):Sil(t)=[b(t)-a(t)]/max{a(t),b(t)}。 其中, a(t)為樣本t和與它同一類內的其他樣本的平均距離, b(t)表示樣本t和其他類距離的平均值。 自適應仿射傳播聚類中, 用Silhouette指標的平均值來反映聚類結果的優劣程度, 值越大表示聚類結果越好, 數據可分性越高, 最大值對應的分類結果為最優聚類結果。

三、實證與結果

1. 板塊分類效果評價指標。 對股票進行板塊分類是為了方便構建投資組合以對沖非系統風險。 本文采用板塊內部股票價格波動的相關系數和板塊之間股票價格波動的相關系數來判斷板塊分類方法的有效性。

假設滬深市場一共有N只股票, 并將它們分成M個板塊, 每個板塊對應有Nm只股票, 則對于第i(i=1,2…,N)只股票, 設它屬于第m個板塊, 它與板塊內外的相關系數分別按如下定義:

板塊內:Pim= ? ?pij/(Nm-1), j≠i。 版塊外:Qim= ? ? pij/(N-Nm), j≠i。 pij表示第i只股票和第j只股票之間的相關系數。 板塊內部股票價格波動的相關系數Pm= ? Pim/Nm。 與板塊外部股票價格波動的相關系數Qm= ? ? Qim/Nm。 平均板塊內股票價格波動的相關系數P= ? ?Pm/M。 平均板塊外股票價格波動的相關系數Q= ? ?Qm/M。 通過比較板塊內外相關系數差值的大小, 可以評價板塊分類方法的優劣。

2. 股票CGR圖。 下面以平安銀行(股票代碼:000001)股票為例作展示。 圖3是某財經網站的平安銀行股票的K線圖。

K線圖按時間順序展示股票的交易價格數據, 但作為聚類算法輸入數據, 維數太大, 對聚類要求高。 通過混沌游戲表示算法處理股票日收益率數據, 得到平安銀行(000001)股票的日收益率CGR圖, 如圖4所示。

混沌游戲表示算法將股票日收益數據以迭代形式繪制在正方形圖上, 其落點嚴格按照時間順序產生, 也展示了部分分形特征, 如平安銀行的CGR圖無論是從整體來看還是按分塊來看, 其落點都具有向右下角集中的特征, 這個特征意味著平安銀行的日收益數據落在B集合, 即(-2.04%, 0.391%)這個區間的頻率很高。

3. 自適應仿射傳播聚類結果。 將16維向量集作為自適應仿射傳播聚類算法的輸入變量數據集, 在Matlab中運行后得到從2 ~ 78共計77種類數情況下的各項指標, 包含每種類數對應的各只股票的類標、分類優劣評判指標Sil和Silmin的值等。 整理不同類數對應的Sil和Silmin指標值得到表1, 類數大于18類之后Sil和Silmin兩個指標值都越來越小, 受篇幅限制, 不再羅列。

可以看到, Sil的最大值是0.3479, 最優聚類結果為兩類, 考慮到Sil的最大值小于0.5, 表明聚類有一些重疊的情況, 在聚類結果指標Sil值較小的情況下, 應優先考慮最靠近兩類的可分性, 故取指標Silmin最大值0.1973對應的聚類數5類, 參考其他行業分類都是超過10類的情況, 再取次高點0.1688對應的聚類數11類。

4. 板塊內外相關系數的比較。 用證監會網站發布的2016年四季度上市公司行業分類結果分別計算類內和類外相關系數, 得到表2。

用本文的方法得到的分類結果分別計算類內和類外相關系數, 得到表3和表4。

分為5類時, 主要包括A、B、H、P以及其他類。 類內外相關系數差均值為0.028361795, 類內外相關系數差值較為明顯, 僅一類存在類內相關系數小于類外相關系數的情況。 分為11類時, 主要包括A、B、H、P、D、E、G、I、N、R以及其他類。 相關系數情況如下:類內外相關系數差均值為0.026968596, 類內相關系數小于類外相關系數的情況增加。 整體而言, 無論是將所有股票分為5類還是分為11類, 類內外相關系數差均值都比證監會行業分類結果大, 區分度高。

從實際運用場景來看, 當股票投資者不需要對投資行業進行甄選細分, 僅對特殊行業進行統籌考慮時, 可以選用5類分析法進行分析; 當投資者需要進一步深入挖掘細分行業的投資機會或者行業特性時, 可以選用11類分析法進行甄選分析, 這樣能夠提高分析的精準度。

四、結論

本文以A股日收益率數據為數據源, 基于混沌游戲表示算法和自適應仿射傳播聚類算法對我國A股進行板塊分類研究。 利用生物信息學中的混沌游戲表示算法將股票日收益率數據轉化為CGR圖, 為股票數據展示提供了一種新的形式, 再對CGR圖進行4×4的網格剖分, 將股票日收益序列轉化為16維的向量, 降低聚類數據維度, 提高聚類效果。 通過自適應仿射傳播聚類算法聚類得到新的A股板塊分類結果, 與證監會行業分類相比, 類內外平均相關系數差別更大, 區分度更高。 本文提出的方法給股票板塊分類提供了新的參考, 但仍存在一些不足, 本文主要側重利用自適應仿射傳播聚類算法對股票進行板塊分類研究, 沒有對通過混沌游戲表示算法得到的股票數據CGR圖的分形特征進行深入研究。

【 主 要 參 考 文 獻 】

[ 1 ] ? Kahle K. M., Walkling R. A.. The Impact of Industry Classifications on Financial Research[ J].Journal of Financial and Quantitative Analysis,?1996(3):309 ~ 335.

[ 2 ] ? Moskowitz T., Grinblatt M.. Do Industries Explain Momentum?[ J].Journal of Finance,1999(54):1249 ~ 129.

主站蜘蛛池模板: 亚洲精品自拍区在线观看| 一级毛片网| 一级毛片高清| 久久亚洲天堂| 中文成人在线视频| 4虎影视国产在线观看精品| 欧美亚洲欧美| 99在线观看国产| 四虎影视国产精品| 亚洲乱码在线视频| 视频二区中文无码| 国产人成在线视频| 日韩福利在线观看| 国精品91人妻无码一区二区三区| 美女被操91视频| 久久无码av一区二区三区| 亚洲欧洲自拍拍偷午夜色无码| 久草中文网| 欧美日韩激情在线| 欧美成人精品高清在线下载| 亚洲日韩高清无码| 亚洲国产成人自拍| 99热精品久久| www.日韩三级| 欧美在线黄| 欧美日韩另类国产| 99爱在线| 蜜桃视频一区二区| 国产杨幂丝袜av在线播放| 久久这里只有精品66| 99re经典视频在线| 久久大香伊蕉在人线观看热2| 青草娱乐极品免费视频| 日本五区在线不卡精品| 欧美日韩中文国产| 麻豆AV网站免费进入| 伦精品一区二区三区视频| 一级成人a做片免费| 欧美亚洲第一页| 日本精品一在线观看视频| 亚洲综合18p| 亚洲女同欧美在线| 欧美国产日韩另类| 成人亚洲国产| 狠狠久久综合伊人不卡| 欧美日韩在线成人| 日本国产在线| 国产精品福利一区二区久久| 91久久偷偷做嫩草影院| 国产在线98福利播放视频免费| 色天天综合久久久久综合片| 538国产在线| 无码网站免费观看| 在线观看网站国产| 日本午夜视频在线观看| 亚洲国产欧洲精品路线久久| 国内精品91| 91系列在线观看| 在线欧美日韩国产| 欧美成人午夜视频免看| 久久精品无码一区二区国产区| 亚洲高清资源| 日本五区在线不卡精品| 综合人妻久久一区二区精品| 亚洲欧美日韩久久精品| 国产激情在线视频| 天天躁夜夜躁狠狠躁躁88| 色偷偷综合网| 国产资源免费观看| 色综合久久无码网| 国产自视频| 国产传媒一区二区三区四区五区| 日韩成人午夜| 欧美国产日韩在线播放| 浮力影院国产第一页| 亚洲熟女中文字幕男人总站 | a级毛片网| 91丝袜美腿高跟国产极品老师| 在线视频97| 漂亮人妻被中出中文字幕久久| 国产一级二级三级毛片| 欧美成人综合在线|