萬梅杰
金融交易數據的圖形化技術分析研究
萬梅杰
(深恒和投資管理(深圳)有限公司,廣東 深圳 518042)
通過對金融交易數據進行采集和處理,計算各板塊的相對成交量,應用Surfer 11軟件對數據進行圖形化,生成各板塊的相對成交量的二維等值線圖、二維剖面圖、三維地形圖等圖形.通過對圖形的分析研究,判斷各板塊的成交活躍度,為金融交易提供參考.對金融數據進行圖形化分析,可以為相關技術人員提供借鑒.
金融數據;數據處理;數據挖掘;三維圖形;圖形化
金融交易是當代社會活動中最具挑戰性的一類活動,而其中股票證券、外匯、債券、黃金和原油、各類期貨、期權等交易最為人們所熟悉.全球金融交易市場每天產生大量數據,如何從這些海量的數據中發掘其中隱藏的信息與知識,從而指導我們的金融交易,一直是金融行業分析和交易人員以及決策者們的努力目標.傳統方式是通過對交易數據和簡單圖形的閱讀或檢索,以及輔以一些統計方法來提取知識或藉此建模.近十幾年來,隨著計算機技術的發展,融合數據庫、統計、人工智能等技術的數據挖掘技術來分析金融交易數據的方法,得到了很大的發展.相關機構利用各種計算機軟件對金融數據進行統計和分析[1-5].
金融交易數據有三大因子,價格、時間、成交量(成交額).本文借助計算機圖形技術,利用Software公司的三維圖形生成軟件Golden Surfer 11.0,嘗試將金融交易數據三大因子中的成交量作為研究對象,把離散的金融數據表示為二維及三維圖形,從而給金融交易數據挖掘開辟一個新的思路,希望能為金融交易人員的金融分析與交易系統的形成提供可視化的金融數據模型.
通過對金融交易的成交量因子進行數據采集、數據預處理、數據再加工,繪制圖形(二維或三維)4個步驟,將交易數據表圖形化,把金融交易成交量數據模擬成山峰、山谷、丘陵、平原等,構成三維地形地貌,通過地形地貌高低起伏直觀顯示成交量在橫向比對與縱向發展的變化,發掘有用的知識與信息,為金融交易的決策提供服務.技術框圖如圖1所示.

圖1 技術方案框圖
本文中的數據來自上海證券交易所A股在一定時間段的交易數據.上證指數在2015年6月12日這一周達到階段性高位5178點后,隨后上證指數開始長時間的調整.為了使圖形化處理結果更有意義,成交量的數據選取的時間段為2015年6月12日至2019年9月30日.通過對2015-2019年長達四年多的成交量分析,可以對上證交易市場自5178點這個階段性高點以來的大調整過程有一個全貌性的認識.數據采集的周期窗口為一周,即大致按5個交易日的上證A股(綜合)周成交量(特殊節假日的周成交量對應的天數略有減少)提取成一個數據,同時還采集了各板塊的周成交量,例如:工業板塊B2、商業板塊C3、房地產板塊D4、公用板塊E5、能源板塊F6、材料板塊G7、消費板塊H8、醫藥板塊I9、金融板塊J10、信息板塊K11等,數據見表1.

表1 上證A股和各板塊的每周成交量(106股)
數據采集后,為了便于后續的圖形化處理和比較各板塊的成交趨勢,定義一個參數為相對周成交量,并建立坐標系統.
因為各子板塊股票構成數目不同,活躍度不同,成交量區間較大,為了便于比較分析,計算相對周成交量:

相對周成交量為各子板塊的第周成交量(具體為B2()、C3()、D4()、E5()、F6()、G7()、H8()、I9()、J9()、K9()等)與上證綜指對應的周成交量A1()的百分比,各板塊的相對周成交量,即為B2()/A1()、C3()/A1()、D4()/A1()、E5()/A1()、F6()/A1()、G7()/A1()、H8()/A1()、I9()/A1()、J10()/A1()、K11()/A1().為描述方便,簡稱相對成交量.各板塊的相對成交量見表2.
為圖形化需要,建立直角坐標系,坐標定義如下.
橫坐標表示周數,以2015年6月12日(上證指數為5178點)所在的周為起始周,以2019年9月30日為統計終止周.周數區間為1到215.
縱坐標表示子版塊代號,子版塊代號人為設定,如工業板塊坐標設為2,商業板塊坐標為3,房地產坐標為4,公用板塊坐標為5,能源坐標為6,材料板塊坐標為7,消費板塊坐標為8,醫藥板塊為9,金融板塊為10,信息板塊為11等.
坐標,表示各子板塊的相對成交量.
以醫藥板塊I9和房地產板塊D4為例,定義坐標,相對成交量見表3、表4.

表2 各板塊的相對成交量(%)

表3 醫藥板塊I9的相對成交量(%)

表4 房地產板塊D4的相對成交量(%)
以上處理可在電子表格軟件中完成,可選擇CSV格式,或TXT格式或DBF等格式保存,提供給Golden Surfer 11.0調用.
需要說明的是:上述數據在最終實際成圖時,為了突出所關注的板塊相對成交量,需要進行微調.通過調整數據中縱坐標排列順序,將相對成交量大和相對成交量小的板塊或錯開、或集中,生成不同版本的圖形.
1)打開美國GOLDEN公司的surfer 11版本軟件,在菜單網格(GRID)的數據菜單項,調入CSV格式的上證各板塊成交量帶坐標的數據,設定合理的間距,以及選定合適的網絡化的方法,對于跳躍性不大的數據一般選用“與距離成反比的網絡化方法”,隨后軟件生成專用的網格文件.
2)在圖形(Graph)菜單下的“新建菜單”,可先進行二維信息的挖掘,選擇“等值線圖”選項,調入上一步生成的上證板塊成交量之網格文件,確定后即生成板塊相對成交量二維等值線圖,如圖2所示.

圖2 上證各板塊成交量等值線圖
相對成交量二維等值線圖表達了各板塊在二維時空坐標下的分布圖,高值(深色表示)對應的圖形分布區表示相應板塊在該期間成交較活躍,間接說明此期間的該板塊的獲利可能性較大,適合短期投資交易;低值(淺色表示)對應的圖形分布區表示該板塊成交稀少,也間接說明期間的獲利空間小,不適于大資金交易,也不宜短期的投資交易.
與相對成交量的二維圖形相比,相對成交量的三維圖形可以更直觀的體現各板塊的活躍度.三維圖形的獲取方法和二維圖形獲取類似,在圖形菜單下的“新建菜單”,選擇“3D曲面圖”選項,調入前面生成的上證板塊成交量之網格文件,生成上證板塊三維成交量圖,如圖3所示.

圖3 各板塊相對成交量三維地形圖2
在三維地形圖中,某個板塊在某段周期的成交量在三維地形圖中形成“高山”,就表示同期成交量占比最大,最活躍,如果該板塊持續構成高地,表示此板塊持續獲得市場主力的青睞,其他投資者參與其中獲利可能性增大,某個板塊在某段周期的成交量在三維圖形中形成相對的在低洼的“山谷”,或類似于“丘陵地帶”則表示同期內相對其他板塊而言,該板塊不活躍,因此投資者參與其中的獲利機會相對也少.
在三維地形圖中,選取了第33周表現出高谷的醫藥板塊,和第31周表現出高谷的房地產板塊,可以見到醫藥板塊中如康龍化成(圖4)、房地產板塊如碧桂園(圖5)等股價均呈現上行趨勢,與三維圖表現相吻合,證明了其具有一定可靠性.

圖4 第33周醫藥板塊康龍化成股票表現

圖5 第31周房地產板塊碧桂園股價表現
本文通過采集上證綜指階段性高位(5178點)后4年多各板塊的交易數據,計算了各板塊相對成交量.建立適當的坐標系,通過調整數據中縱坐標排列順序,將相對成交量大和相對成交量小的板塊或錯開、或集中等,對交易數據進行處理,將成交量數據存入CSV文件.利用surfer軟件,調入成交量數據文件,生成二維等值線圖、二維剖面圖和三維地形圖等.根據圖形特征判斷各板塊的交易活躍度,各種圖中數值的高低表達了相應板塊交易活躍度的高低,從而為投資者進行投資交易提供指導.本文對金融數據的圖形化分析方法,可以為相關技術人員提供借鑒.
[1] 胡珉,孫瑜峰.基于狀態演化的股市變化趨勢可視化預測方法[J].計算機輔助設計與圖形學學報,2014,26(2):302-313.
[2] 李紹榮.SURFER軟件圖形數據的進一步處理和利用[J].探化探計算技術,1997(2):174-180.
[3] 劉麗峰.一種基于清洗關聯規則的金融數據挖掘算法[J].微電子學與計算機,2012(5):174-177.
[4] 李永福,張冬梅,周成偉.用Surfer軟件對圖形間接數字化方法[J].微計算機應用,2004,19(5):635-635.
[5] 易東云,張維明.金融數據挖掘中的非線性相關跟蹤技術[J].軟件學報,2000,11(12):1581-1586.
Analysis and Research on Graphic Technology of Financial Transaction Data
WAN Meijie
()
Through the collection and processing of financial transaction data, the relative trading volumes of various stock sectors are calculated, the two-dimensional isogram, sectional drawing, three-dimensional topographic and other graphics of the relative trading volume of each stock sector are generated with “surfer 11”software. Then, through the analysis and research of the graphs, the transaction activity of each stock sector is judged, and reference for financial transactions is provided. In this paper, the method of graphical analysis of financial data can provide reference for the relevant technical personnel.
financial data; processing data; data mining; 3D graphics; graphics
TP3-05
A
1672-0318(2022)03-0050-05
10.13899/j.cnki.szptxb.2022.03.008
2021-10-10
萬梅杰,男,湖北隨州人,碩士,深恒和投資管理(深圳)有限公司研究員,研究方向:金融、財務管理.
(責任編輯:王璐)