999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

數據挖掘技術在股票數據分析中的應用研究

2021-11-29 01:50:12王穎穎晁緒耀
科技創新與生產力 2021年10期
關鍵詞:數據挖掘分析信息

王穎穎,晁緒耀

(1.鄭州升達經貿管理學院,河南 新鄭 450001;2.鄭州職業技術學院,河南 鄭州 450007)

作為一門新興的數據分析技術,數據挖掘適用于擁有海量相關數據的領域,以及基于某一知識決策的領域。股票市場每天都會產生大量實時數據,這些數據看似沒有關聯,但是數據背后隱藏著很多有價值的信息及數據規律,因此從這個意義上講非常適合采用數據挖掘技術進行股票數據分析。此外,股票分析預測過程本身就是基于一定知識的決策過程[1],所以從這個層面上講,其又與數據挖掘的適用領域相符,因此在股票數據分析過程中應用數據挖掘技術是可行的、必要的。

1 股票數據分析預測的特點

相比數據挖掘技術應用的其他領域,股票數據分析體現出一定的特殊性。首先,單一性。股票數據的類型是單一的,即都是實數型,這無形中降低了數據處理難度,且股票數據分析的對象具有單一性,雖然個股數據存在較大差異,但是股票的屬性信息是相同的[2]。其次,多樣性。每個專家對股票數據的分析有著不同的目的,自然會使用不同的分析方法,有著不同的側重點、分析角度及提取數據的時間,且每種方法都有對應的理論支持,因此基于某種目的而言,無法評判每種分析方法的好壞。最后,隱蔽性。由于多種因素都會對股票數據變化產生影響,不同指標受不同影響因子的作用,因此各個指標之間會表現出特定的發展規律及特征,但是這些規律及特征并不能立即作為決策的依據,因此要應用數據挖掘技術對股票數據信息的變化進行集成分析,挖掘出數據背后隱含的信息及知識[3]。

2 數據挖掘的基本流程

數據挖掘使用機器學習技術分析數據,挖掘過程需要根據規范程序一步步完成,因此一個完整的數據挖掘過程包括以下環節。

1)確定挖掘對象。雖然數據挖掘結果具有不可預測性,但是在開始挖掘時選擇一個明確的目標非常重要,因此挖掘目標的選擇對于挖掘結果具有指向性。數據挖掘是一個涉及面非常廣的過程,有時候需要技術人員提供經驗知識,這種經驗知識可能來自于用戶的業務領域,也可能來自于之前數據挖掘的成果。無論基于哪種經驗知識,數據挖掘過程中隨時都有可能出現新問題[4]。

2)收集數據。收集數據時要對無效數據進行篩選,以保證數據挖掘結果的有效性,提高數據信息的價值。通常收集相關數據后需要確定與目標信息相關的屬性。

3)數據預處理。完成數據采集后需要對數據信息進行預處理,即將數據由高維空間轉換到低維空間。預處理主要是剔除錯誤數據并轉換數據,所謂錯誤數據就是異常值,剔除異常值可以減少數據挖掘過程中的負擔,找到更多數據特征。

4)數據挖掘。挖掘過程中應用各種數據挖掘算法及技術并根據數據建模,在特定的時候選擇特定的算法解決特定的問題。

5)信息解釋。數據挖掘完成后會呈現出一堆毫無意義的數字,只有對直接挖掘出的結果進行解釋,才能將挖掘結果真正應用于實踐中。不過在結果呈現過程中,用戶往往很難看懂一些繁瑣的指標,因此需要通過簡單、明了的圖表將挖掘結果直觀地展示出來。可視化展示數據及信息可以大大提高結果的可讀性。

3 股票數據分析中應用數據挖掘的關鍵技術

股票趨勢分析涉及非常多的指標,多數指標是企業的財務指標,包括成長能力、經營能力、償還能力、營運能力、盈利能力、現金流等,在數據挖掘之前要選擇股票指標[5]。

3.1 應用關聯規則確定關鍵指標

上市公司的數據都是連續性的變量,無法直接挖掘關聯規則,因此需要對收集的數據進行離散化處理,最終挖掘出財務指標的頻繁項集及規則數目。本研究利用東方財富Choice資訊獲取股票數據,利用軟件收集到的數據都是無法直接分析的原始數據,包含了很多噪聲數據、重復數據以及不完整數據。因此,要對原始數據進行基本預處理,包括將缺失股票數據的股票去除,如股票名稱前帶有ST、*ST的經過處理的股票以及股票名稱中帶有S的未改股股票等均要去除,新加入的股票由于數據較少不具有分析價值,因此也要去除[6]。股票數據經過預處理后再進行深層處理,先計算出各個指標的平均值,再用指標均值對比每個股票的數據,大于均值的股票為A,小于等于均值的股票為B,實現股票數據由數值型向字母型轉化,避免因股票數據數量級不同而影響分析結果的準確性。

根據篩選結果可知,與股票上漲概率成正比的相關指標包括股票上市公司營業總收入同比增長率、股票上市公司總資產凈利率、股票上市公司歸屬母公司股東的權益/負債合計、股票上市公司銷售期間費用率、股票經營活動凈收益/利潤總額、凈資產收益率同比增長率、總資產周轉率以及經營活動產生的現金流量凈額/營業收入等。

3.2 利用決策樹確定最佳投資股票

利用關聯分析算法可以確定與股票上漲關聯度較高的指標,接下來應用決策樹中ID3算法對股票進行分類,確定漲跌值高于平均值的股票,即優質股票池。利用決策樹進行分析時要先刪除與股票漲跌值無關或者相關程度較小的指標,以此來提高股票分類效果。應用決策樹ID3算法對所研究的股票進行分類,從股票數據集中找出每個指標對應的股票數目,進而計算信息增益。ID3算法的具體分類過程如下。

先計算股票數據集合信息熵,計算公式為

計算出每個指標的信息熵后再計算每個指標的信息增益值,然后進行對比,信息增益值最大的指標為決策樹根節點。

接下來對決策樹上每個葉子節點重復上述過程,直到產生一個完整的決策樹。由計算結果可知,在所有股票屬性指標中,信息增益值最大的為總資產凈利率,其包含最多信息量,因此決策樹根節點就選擇“總資產凈利率”。在股票數據集合中“總資產凈利率”取值有兩種,可以將其分為兩個子集,對應決策樹兩個葉子節點,其余股票指標為樹的分枝。

3.3 應用BP神經網絡預測股票價格變化

利用神經網絡技術分析和預測股票數據主要是學習股票的歷史價格,存儲其非線性變化趨勢,再根據這個趨勢對未來股票的變化趨勢進行預測,幫助投資者了解股票價格變化趨勢,為其投資決策提供依據[7]。本研究選擇的神經網絡輸入元包括開盤價、最高價、最低價、收盤價、成交量、成交額、5日移動平均線、10日移動平均線、20日移動平均線等,神經網絡輸出元為股票收盤價。由于分析過程中股票指標很多,每個指標數據的數量級存在較大差異,神經網絡無法利用原始數據進行分析,因此需要對數據進行歸一化處理。股票分析預測中BP神經網絡的應用如下。

首先設計BP神經網絡,其包括隱含層數、隱含層單元數及其他參數的設定等幾個環節。包含1個隱含層的BP神經網絡可以將所有非線性函數映射出來,因此本研究中隱含層數目設為1。采用試湊法同時結合經驗公式確定隱含層單元數,經驗公式為

式中:M為隱含層單元數;N為輸入層單元數;L為輸出層單元數;ɑ的取值為1~10。

采用式(4)計算隱含層單元數。為提高神經網絡訓練速度,降低誤差,最終確定隱含層節點數為3~15。變動隱含層節點數,測試每個股票樣本,根據預測誤差最小、預測效果最好的訓練目標確定最佳隱含層節點數,本研究中隱含層單元數為9。

其次設定學習率、目標誤差及訓練次數等其他重要目標,此處著重強調學習率的設定。學習率表示權重變化量,學習率過高會導致網絡振蕩,降低計算效率,因此設定范圍為0.01~0.8,本研究中的學習率為0.1。

最后對BP神經網絡結果進行分析。將股票數據帶入MATLAB系統,通過系統計算可得出股票價格的預測結果,再對比其實際股票價格。需要注意一點,神經網絡初始值帶有顯著的隨機性特點,因此預測結果也是隨機的,需要通過多次試驗將隨機性的影響降至最低[8]。本研究進行10次重復試驗,平均10次預測結果得出的數值即為最終結果。對比股票的實際價格可知,系統預測曲線與實際股票價格曲線基本重合,因此利用BP神經網絡預測股票價格走勢可以獲得較為理想的預測效果,可以作為股票投資決策時的重要依據。然而,個別預測值還存在較大誤差,因此后續需要進一步改進,以提高預測精度。

4 結束語

利用數據挖掘技術可以從大量股票數據中挖掘出隱含的信息價值,投資者參考這些有價值的信息可以提高投資決策的科學性與準確性。在股票數據信息分析過程中,投資者可以先利用關聯規則算法挖掘出影響股票漲跌值的指標,再利用決策樹算法找出最具有投資價值的股票池,最后應用神經網絡算法預測股票價格的變化。當然,股票市場是一個影響因素眾多、環境復雜的非線性系統,國家政策、經濟環境、投資心理等均會對其發展產生影響。因此,在未考慮這些因素的基礎上進行預測可能會導致一定的預測誤差,并且神經網絡預測初始值是隨機選擇的,反復試驗后才確定神經網絡隱含層節點數目,這些均會影響到預測結果的準確性,后續需要加強研究,進一步優化。

猜你喜歡
數據挖掘分析信息
探討人工智能與數據挖掘發展趨勢
隱蔽失效適航要求符合性驗證分析
電力系統不平衡分析
電子制作(2018年18期)2018-11-14 01:48:24
訂閱信息
中華手工(2017年2期)2017-06-06 23:00:31
基于并行計算的大數據挖掘在電網中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
電力系統及其自動化發展趨勢分析
一種基于Hadoop的大數據挖掘云服務及應用
展會信息
中外會展(2014年4期)2014-11-27 07:46:46
基于GPGPU的離散數據挖掘研究
健康信息
祝您健康(1987年3期)1987-12-30 09:52:32
主站蜘蛛池模板: 99久久精品美女高潮喷水| 999精品在线视频| 五月天综合网亚洲综合天堂网| 亚洲人成网站色7777| 露脸一二三区国语对白| 色哟哟国产精品一区二区| 99ri国产在线| 国内精品九九久久久精品| 亚洲中文字幕无码爆乳| 四虎影视无码永久免费观看| 久久久久九九精品影院| 久久a毛片| 天天摸天天操免费播放小视频| 亚洲综合天堂网| 婷婷色丁香综合激情| 中文字幕欧美日韩高清| 亚洲国产精品美女| 欧美精品v日韩精品v国产精品| 乱系列中文字幕在线视频| 55夜色66夜色国产精品视频| 中文字幕不卡免费高清视频| 久久久受www免费人成| 久久精品只有这里有| 久久这里只有精品66| 国模粉嫩小泬视频在线观看| 欧美精品H在线播放| 国产又爽又黄无遮挡免费观看| 亚洲熟女偷拍| 久久精品亚洲中文字幕乱码| 找国产毛片看| 最新国语自产精品视频在| 噜噜噜久久| 在线国产你懂的| 亚洲性日韩精品一区二区| 欧美无专区| 综合网天天| 欧美一区福利| 伊人激情久久综合中文字幕| 国产一在线观看| 亚洲精品老司机| 亚洲女人在线| 国产亚洲精久久久久久久91| 精品福利国产| 天堂中文在线资源| 亚洲av无码人妻| 国产女同自拍视频| 在线欧美a| 亚洲第一视频网站| 91区国产福利在线观看午夜 | 欧美一区二区福利视频| 亚洲成人77777| 精品福利视频导航| 亚洲性一区| 精品人妻一区无码视频| 五月天综合婷婷| 国产鲁鲁视频在线观看| 97超爽成人免费视频在线播放| 亚洲女同欧美在线| 亚洲精品黄| 欧美v在线| 日韩精品亚洲一区中文字幕| 九色视频一区| 亚洲综合第一页| 国产网站黄| 亚洲精品欧美重口| 91久久精品日日躁夜夜躁欧美| 在线观看无码a∨| 女人18毛片水真多国产| 综合色亚洲| 精品无码国产一区二区三区AV| 色综合久久88色综合天天提莫 | a网站在线观看| 国产成a人片在线播放| 熟妇人妻无乱码中文字幕真矢织江| 国产极品美女在线观看| 欧美国产在线精品17p| 日韩欧美网址| 综合亚洲色图| 亚洲视频在线观看免费视频| 一级黄色片网| 日本免费一区视频| 伊人查蕉在线观看国产精品|