摘 要:股市作為一個特殊的交易市場,具有變化多端的特點,在整體上很難進行把控。所以,股市上的盈利人員畢竟是少數的。為了可以在股市技術上進行深入的分析和了解,可應用數據挖掘算法來完成相關的操作,同時在多方面來觀察股市的具體走向以及客觀上的動態情況,避免錯誤的操作所引起的不必要的損失。文章針對數據挖掘算法及其在股市技術分析中的應用展開討論,并提出合理化建議。
關鍵詞:數據挖掘算法;股市;分析;技術
隨著經濟的發展和社會生活水平的提升,股市表現為一定的繁榮狀態。但從股票的角度來分析,其作為一種虛擬的有價證券,本身并不是特別的穩定,很容易受到外界因素的影響,同時受到操控者的影響較大,波動性較強。有相當數量的股民,由于在股市技術分析上沒有從客觀情況出發,單純憑借主觀上的經驗來完成,致使最終的損失較為嚴重。
一、概述
近年來,計算機網絡發展較快,相關的內容及研究領域也在不斷的拓寬。從客觀的角度來分析,數據挖掘算法在目前是非常高度關注的算法技術,同時在很多方面都與股市技術具有密切的關系。數據挖掘算法在應用過程中,主要是根據數據所創建數據挖掘模型的一組試探法和計算。為了能夠更好的創建模型,該算法可以首先分析固有的數據內容,同時查找特定的類型模式、相關趨勢等等。由此可見,我們在股市技術分析過程中,有效的應用數據挖掘算法后,能夠實現以下目的:第一,股市技術分析所提供的數據較多,涵蓋了各個方面的數據,為算法的應用提供了較強的基礎。第二,經過數據挖掘算法分析后,股市技術的趨向以及可能出現的情況,都會被人一目了然,避免了操作失誤的現象,保護了股民的權益,減少了外部的影響和內部的操作水平。
二、數據挖掘算法在股市技術分析中的應用
針對股市技術的分析工作,必須要從客觀實際出發,理論上給出的數據和信息,與現實其概況存在一定的差異,因此即便獲得了正確的分析結果,依然不能將其應用到實踐的股市操作當中。
1.實驗數據
在本次實驗分析當中,選擇的股市技術數據,主要是從2000年1月--3月的某股市指數。在選擇的時間段方面,選定周期為60分鐘的股市指數走勢圖進行分析。在每一個交易日當中,選擇了開市時間(9:30)、10:30、13:30、14:00以及收市時間(15:00)作為具體的指標進行分析。實驗過程中,倘若具體的交易日數量設定為M,那么數據的總數則為5*M。分析認為,針對每一個型態的模版而言,可以應用一個一維的數據組進行相應的表示,這樣就避免了數據的雜亂和信息的錯誤。建議在分析工作中,為了進一步發揮出數據挖掘算法的優勢和功能,首先要將模版進行有效的劃分,可以嘗試將其劃分為時間差異相等的10段,每段提取出1個具體的數字,也就是數軸上的具體高度。通過上述的操作方法,可以使用10個數字來表示每一個模版,得到的效果比較突出,操作簡便。
2.算法的應用
數據挖掘算法在股市分析中的應用時,必須要做出一些假設,由此來配合股市的多變特點。在算法的處理、應用過程中,想要更加簡單的處理數據的擬合問題,可通過“對稱形式”的方法來進行解決,同時不建議做傾斜約束的限制。在本文當中,初始化的條件設定為:g(1,1)=2d(1,1)。通過分析和歸納,得到的動態規劃方程如下:
經過相關的分析和處理后,窗口的調整條件確定為:j-r≤i≤j+r。時間規范化的距離設計和分析中,對整體的算法應用具有很大的影響。為此,將具體的距離控制為:D(A,B)=g(I,J)/N,在距離的條件當中,N=I+J。
實驗中,給定的型態模板作為模式A,同時一段給定的走勢曲線作為模式B。由于股市走勢是市場各方力量的綜合體現,股票在單個或連續若干個交易日的某個時間段更富規律性(如在1999年的519行情中,和1999年末2000年初網絡股帶動股市進入牛市中的行情中,某個交易日中指數下滑并不體現指數整體在攀升的情況)。故認為形態模板與走勢的擬合應以形態模板縮放到N個交易日為準(N為正整數),才符合現實世界的規律(當然,N也不能很大)。把模板分成10段,同時用10個指數為一段的走勢曲線與模板比較,與股市中一、兩天就形成一種形態走勢的客觀事實相符。
3.實驗結果及分析
數據挖掘算法在股市技術分析當中應用時,通過對固有的數據進行搜集和分析,從而能在很大程度上充分的掌握好股市發展趨勢及具體的表現。在本次實驗當中,選擇了多個類型的模版進行系統的分析,包括潛伏頂、箱形整理等等。在最終的結果方面,每一個階段的時間規范化距離,經過大量的比較發現,陰跌形態當中,其時間規范化的距離對比當中,基本上是最大的。除此之外,潛伏頂排列在第二位,證明陰跌、潛伏頂的時間規范化距離表現為較大的狀態。分析原因為,該股市指數在1月份--3月份,主要表現出了牛市的狀態,而陰跌和潛伏頂隸屬于熊市的兩種模塊。綜上所述,數據挖掘算法本身的優異性比較突出,能夠在很多方面對股市技術進行分析,從而獲得正確的走向及趨勢。另外,將數據挖掘算法充分的應用后,減少了股民的損失,對于國家的宏觀調控而言,也可以提供較多的數據與參考,實現了經濟上的平穩運行。日后,可以深入分析數據挖掘算法的相關內容,加強對股市技術分析的掌控,在客觀上和主觀上,穩定國內的股市情況。
三、結語
本文對數據挖掘算法及其在股市技術分析中的應用展開討論,從得到的結果來看,數據挖掘算法的分析結果及可行性,都比較符合客觀上的需求,整體上獲得了較高的保障,未出現惡性循環。另一方面,由于股市技術分析受到的影響較多,因此在應用數據挖掘算法時,還必須融入到其他的因素及相關的算法內容,避免造成分析技術的單一性。
參考文獻:
[1]楊琬琪,高陽,周新民,楊育彬,商琳. 多模態張量數據挖掘算法及應用[J]. 計算機科學,2012,01:9-13.
[2]王權,王軍,史子新. 數據挖掘技術與關聯規則挖掘算法及其應用[J]. 計算機光盤軟件與應用,2014,19:126-127.
[3]付海辰. 基于數據挖掘技術的聚類分析算法在異常入侵檢測中的應用[J]. 軟件導刊,2011,05:73-74.
[4]張銘. 數據挖掘技術及其在中藥分析中的應用[J]. 中醫雜志,2011,13:1105-1107.
[5]楊秀萍. 數據挖掘技術及其在收視行為分析中的應用[J]. 福建電腦,2013,04:124-126+59.
作者簡介:陳格(1992-),男,廣東省吳川市人,民族:漢,廣東金融學院應用數學系,學生, 學歷:本科,研究方向:數學與應用數學(金融數學與金融工程)。