潘春玲
摘 要: 針對傳統限價指令驅動市場信息聚類分析不準確,且存在耗時長的問題,提出基于信息相似度計算的限價指令驅動市場中信息聚類分析模型。首先給出信息聚類模型的模塊結構圖,并導入限價指令驅動條例,以條例為制約,根據信息熵獲取指標權重,計算信息相似度,將每一個帶有趨向性的信息進行簇源追蹤,對于遠離簇中心的信息進行剝離,將剩下的信息重新賦予數據族編,實現信息聚類分析模型建立。實驗數據表明,構建的信息聚類分析模型能夠依據信息相似度進行同源信息的聚類,聚類分析準確度較高,且耗時較短。
關鍵詞: 限價指令; 市場信息; 聚類分析; 相似度; 信息分類; 數據族編
中圖分類號: TN911?34; TN393 文獻標識碼: A 文章編號: 1004?373X(2018)06?0169?03
Abstract: Since the information clustering analysis of the traditional limit order driven market is inaccurate, and has long time consumption, an information clustering analysis model of limit order driven market is put forward, which is based on information similarity calculation. The module structure diagram of the information clustering model is given, and the limit order driven regulation is imported. Taking the regulation as the restriction, the index weight is acquired according to information entropy, and the information similarity is calculated. The cluster source tracking is performed for each information with tendency. The information away from the cluster center is eliminated, and the rest of information is endowed with data family compilation renewedly to realize the establishment of information clustering analysis model. The experimental data shows that the constructed information clustering analysis model can cluster the homologous information according to information similarity, and has high clustering analysis accuracy and short time consumption.
Keywords: limit order; market information; clustering analysis; similarity; information classification; data family compilation
0 引 言
在限價指令驅動的市場中,市場中信息數據之間是一個復雜的交互作用過程。限價指令驅動下,市場信息具有一定的流動供給功能。信息流動性促進市場交易策略信息互相參雜,致使市場中信息雜亂無序[1?2]。每一類型的市場信息具有特有的屬性,不同屬性下的信息代表的意義也是不同的,但在限價指令驅動下的市場中找到同一類的信息變得十分困難。傳統的市場信息聚類方法能夠對市場中的信息進行簡單分類,但是無法區分同源信息數據的歸類源,數據間的相似度無法比較,造成同一簇的信息可能是非同族數據。針對上述問題,本文設計了限價指令驅動市場中的信息聚類分析模型,并進行試驗分析。
1 限價指令驅動市場中信息聚類分析模型設計
本文設計的信息聚類分析模型,以限價指令為信息數據的主導,將每一項指標都視為同等二級指標,使用權重指標為特級指標,解決市場信息的相似度的問題[3],利用冗余性對數據信息進行同族處理,實現信息簇族化,實現信息聚類分析模型的建立以及信息聚類分析。本文設計信息聚類模型模塊結構如圖1所示。
1.1 限價指令驅動條例
限價指令在市場中,能夠對信息數據進行一定的制約,由于限價指令能夠將信息數據進行累積,累積的數據信息會按照限價指令的先后進行時間上的排序,這種按照時間的排序就稱為信息的優先權重[3?4]。限價指令能夠直接影響市場上的交易量,從而控制信息的走向。不同的限價指令推行下,累積的信息數據會產生交互作用,將非同族的信息進行交互混雜,致使最終的信息走向偏向于雜亂無序的狀態。本文使用限價指令驅動能夠激活數據信息,使其具有一定的信息流動性,在流動性的驅使下能夠產生一定的信息簇族效應,方便數據的聚類處理。
假設限價指令驅動能力為[T],利用市場的信息發展趨勢進行條件限制函數的建立,用公式表示為:
[S=PrT>tX∈P?S?I]
式中:[S]為限價指令驅動限制能力,利用限價指令驅動的條件限定[T>t],致使信息具有單一的趨向性。即使限價指令驅動在[t]之下,仍然有信息補縮的趨勢,因此信息仍然具有趨向性[5]。使用[X],[P],[S],[I]四項條件限制使用過程的信息外延展。[X]為信息的動向力,能夠提升市場信息的格局化;[P]表示信息的過程交互概率,是衡量信息的雜亂度的條件;[I]為數據信息的向心趨勢。經過上述的限價指令驅動條例的引入完成對數據信息的限定。endprint
1.2 指標權重的確定
由于限價指令的使用,本文需要對指標權重進行重新確定,在信息聚類分析中各個指標的權重程度是不同的,通常需要對同源信息進行簇族權重重新確認[6?7]。根據信息熵的概念,市場信息在熵度量的獲取中,能夠提供適度的專項同源族簇。將市場數據的整體想象成為一個具有理想尺度的綜合體,歸一化的數據信息權重便可以進行確認,信息聚類分析過程的指標權重可以定義為,由信息熵以及過程權重所組成,過程權重只能說明整體權重的量,無法實現單一分類。因此,重新定義信息的過程交互概率是一個定值,將每一個信息源中的使用概率、信息驅動程度以及權重決定因子進行指標化處理,便可以得到總體信息權重分量,使用轉化信息矩陣將定義的指標化分量與其結合,信息權重矩陣會變得有序化,對每一個同源信息進行多次提取,把整體信息權重分配給每一個信息源中,便可以得到具有指標化的權重。
通過上述過程的分配,能夠確認每項同源信息的權重,其中分配到的權重可能與信息的發展趨勢有偏差,但是信息的趨勢是矢量,權重也是矢量,在不同的分布狀態下也可進行疊加或類減。至此,完成指標權重的重新確定過程。
1.3 信息聚類分析模型建立
本文設計的市場信息聚類分析模型,能夠進行信息的劃分或分組處理。設計的信息聚類分析模型,能夠將市場信息中的限價指令驅動以矢量的形式進行子集化,每一個子集代表限價指令驅動樣本或者是限價指令驅動趨勢[8]。通過上述確認的指標權重,能夠對子集中的元素進行同源化處理,方便進行信息聚類分析。本文利用[K]進行信息相似度計算,將每一個帶有趨向性的信息進行簇源追蹤,對于遠離簇中心的信息進行剝離,將剩下的信息重新賦予數據族編,便完成信息聚類分析模型建立[9]。假設每個信息簇的數據源值是相同的,聚類過程是不斷重復的,信息聚類過程函數分別使用市場信息原始信息分類源以及限價指令驅動下的信息聚類能力進行信息聚類處理。經過信息的甄別,完成聚類分析過程,至此信息聚類分析模型構建完成,見圖2。
2 實驗分析
2.1 實驗參數設定
本文為了檢驗限價指令驅動市場中信息聚類分析模型的有效性,對原始市場信息和限價指令驅動后的市場信息,分別設計了兩組實驗。在第一組實驗中,使用限價指令驅動市場中信息聚類分析模型與傳統信息聚類分析方法,在原始市場信息狀態下進行實驗。在第二組實驗中,使用限價指令驅動市場中信息聚類分析模型與傳統信息聚類分析方法,但市場信息受到限價指令驅動。模擬實驗每組執行10天,每天對10期市場信息運行結果數據的聚類分析。分析過程觀察每組實驗中不同市場信息的實驗結果,以此判斷該方法的適用度。為了試驗的嚴謹性,對試驗參數進行設置,設置結果如表1所示。
2.2 試驗結果分析
表2是在不同市場狀態下的同源性測試結果。溫和市場對應的信息趨向性;急躁市場對應的信息同源率;耐心市場對應的信息歸屬速率。三種市場中最具有代表性的數據能夠反映出信息的同源規律。溫和市場選用信息趨向性能夠反映信息同源的規律變化,溫和市場的信息波動不劇烈沒有信息斷代,使用信息趨向性足以說明。急躁市場狀態下帶有強烈的信息波動性,選用其他數據不能進行代表性說明,因此選用信息同源率。耐心市場存在信息斷代,其他數據不具有說明性。
%
通過表2的數據對比結果可以看出本設計的聚類模型比傳統方法更佳具有信息趨向性,信息同源性結果說明,本文設計的聚類模型比傳統方法更具有說明性。
3 結 語
本文設計的限價指令驅動市場中信息聚類分析模型,導入了限價指令驅動條例,以條例信息為制約,優化指標權重確認過程。希望通過本文研究能夠促進市場信息聚類能力。
參考文獻
[1] 王碩,李鵬程,楊寶臣.基于指令驅動市場EKOP模型的異質期望研究[J].管理科學,2016,29(3):123?135.
WANG Shuo, LI Pengcheng, YANG Baochen. Heterogeneous expectations study based on EKOP model under order driven market [J]. Journal of management science, 2016, 29(3): 123?135.
[2] 邴濤,劉善存,張強,等.指令驅動市場中非知情交易者的最優交易策略[J].管理科學學報,2017,20(3):24?45.
BING Tao, LIU Shancun, ZHANG Qiang, et al. The optimal trading strategy of uninformed traders in an order driven market [J]. Journal of management sciences in China, 2017, 20(3): 24?45.
[3] 劉翠霞,史代敏.基于關系聚類的動態面板數據模型及其應用研究[J].統計與信息論壇,2015,30(3):10?16.
LIU Cuixia, SHI Daimin. Dynamic panel data model and its application based on structural relationships of clustering analysis [J]. Statistics & information forum, 2015, 30(3): 10?16.endprint
[4] 謝洪安,李棟,蘇旸,等.基于聚類分析的可信網絡管理模型[J].計算機應用,2016,36(9):2447?2451.
XIE Hongan, LI Dong, SU Yang, et al. Trusted network management model based on clustering analysis [J]. Journal of computer applications, 2016, 36(9): 2447?2451.
[5] 李鎮鎮,李曉東,李飛,等.基于動態聚類分析和盲數理論的綜合營養狀態指數評價模型[J].環境工程學報,2015,9(4):2021?2026.
LI Zhenzhen, LI Xiaodong, LI Fei, et al. Improved assessment model for comprehensive trophic state index based on dynamic cluster analysis and blind theory [J]. Chinese journal of environmental engineering, 2015, 9(4): 2021?2026.
[6] 李娜,王磊,張文月,等.基于高維數據優化聚類的長周期峰谷時段劃分模型研究[J].現代電力,2016,33(4):67?71.
LI Na, WANG Lei, ZHANG Wenyue, et al. Research on the partition model of long period peak and valley time based on high dimensional data clustering [J]. Modern electric power, 2016, 33(4): 67?71.
[7] 孫善武,王楠,歐陽丹彤.基于聚類分析的業務流程模型抽象[J].計算機科學,2016,43(5):193?197.
SUN Shanwu, WANG Nan, OUYANG Dantong. Business process model abstraction based on cluster analysis [J]. Computer science, 2016, 43(5): 193?197.
[8] 遲志浩,于艷雪,周萍,等.基于有害生物集群的聚類分析在入侵生物定殖研究中的應用[J].中國植保導刊,2017,37(1):17?22.
CHI Zhihao, YU Yanxue, ZHOU Ping, et al. Application of clustering analysis based on invasive pest assemblage in invasive pest establishment [J]. China plant protection, 2017, 37(1): 17?22.
[9] 楊超宇,楊頂田.基于聚類分析算法的浮游植物吸收系數非線性模型[J].中國激光,2015,42(z1):244?249.
YANG Chaoyu, YANG Dingtian. A non?linear model of phytoplankton absorption based on cluster analysis [J]. Chinese journal of lasers, 2015, 42(S1): 244?249.
[10] 陳玉川.物聯網走進中國家庭的技術條件分析[J].物聯網技術,2015,5(11):66?69.
CHEN Yuchuan. Technical condition analysis for Internet of Things going into Chinese families [J]. Internet of Things technologies, 2015, 5(11): 66?69.endprint