胡濱
【摘要】 針對國內(nèi)證券行業(yè)數(shù)據(jù)信息分散、系統(tǒng)功能單一的情況,設(shè)計(jì)了基于數(shù)據(jù)挖掘技術(shù)的證券投資分析系統(tǒng)。在Microsoft.NET的框架上,利用SQL SeNer技術(shù)、ADO.NET技術(shù)進(jìn)行數(shù)據(jù)庫搭建、智能數(shù)據(jù)采集、轉(zhuǎn)換及分析處理,快速地從大量數(shù)據(jù)中得到即時(shí)的有效信息并做出決策。
【關(guān)鍵詞】 數(shù)據(jù)挖掘 蟻群分析 證券 投資決策
一、數(shù)據(jù)挖掘與證券的關(guān)系
1989年8月,第十一屆國際聯(lián)合人工智能學(xué)術(shù)會議在美國Detroit市召開,在這次會議上,數(shù)據(jù)挖掘第一次形成了一個(gè)正式的概念。此后,每年會舉辦一屆KDD國際會議來推進(jìn)對數(shù)據(jù)挖掘和知識發(fā)現(xiàn)的研究進(jìn)程。
在商業(yè)領(lǐng)域中,數(shù)據(jù)挖掘給企業(yè)的商業(yè)信息處理帶來了一個(gè)全新的思維方式。證券行業(yè)是一個(gè)交易量巨大的行業(yè),我國的證券交易系統(tǒng)具有成熟的事物處理系統(tǒng),多年的運(yùn)營中,交易數(shù)據(jù)庫中累積了巨量的數(shù)據(jù)。利用數(shù)據(jù)挖掘工具來發(fā)掘其中有價(jià)值的知識和信息,將會為證券投資的正確決策帶來不可估量的作用。如何對交易數(shù)據(jù)進(jìn)行挖掘成為了證券投資研究的重中之重。
在證券投資領(lǐng)域,較為新穎的是蟻群算法,它具有很高的計(jì)算效率,而且不需設(shè)定最終簇的數(shù)量。在今年來不斷的發(fā)展改進(jìn)中,蟻群算法在某些方面的問題中表現(xiàn)出了更接近實(shí)際的效果。
本文將使用這種新的算法工具來對證券投資決策過程進(jìn)行分析,對股票的行業(yè)因素、公司因素、收益和成長因素等加以考慮,建立全面的評價(jià)體系,并通過聚類分析方法來決策投資過程。
二、開發(fā)平臺
該數(shù)據(jù)挖掘系統(tǒng)是在MicrosofLNet的框架基礎(chǔ)上設(shè)計(jì)的。.NET框架是一種高度分布式的應(yīng)用程序開發(fā)平臺。該平臺含有內(nèi)部網(wǎng)絡(luò)和外部網(wǎng)絡(luò)快捷開發(fā)的多項(xiàng)技術(shù),可以進(jìn)行敏捷軟件開發(fā)、快速應(yīng)用開發(fā),支持多種語言,通用性、可移植性強(qiáng)、開發(fā)成本低、數(shù)據(jù)庫使用便捷。
ADO.NET是.NET環(huán)境中最常用到的數(shù)據(jù)接口,提供數(shù)據(jù)訪問服務(wù)。ADO.NET使用了多層次的資料處理架構(gòu),將中斷連接方式應(yīng)用到程序設(shè)計(jì)中,提高了程序的延展性。
三、系統(tǒng)結(jié)構(gòu)功能設(shè)計(jì)與設(shè)計(jì)
3.1 數(shù)據(jù)庫連接配置
對數(shù)據(jù)庫進(jìn)行操作的過程要保證安全性,在ADO.NET中實(shí)現(xiàn)這一功能時(shí),需要請求連接,并對相關(guān)信息進(jìn)行認(rèn)證,認(rèn)證成功后便可以通過客戶端對數(shù)據(jù)庫進(jìn)行操作。為了實(shí)現(xiàn)數(shù)據(jù)檢索功能,定義了一系列基本方法,設(shè)置不同的鏈接字符串,用于對數(shù)據(jù)庫進(jìn)行動態(tài)鏈接,以滿足業(yè)務(wù)查詢的需求。
3.2 數(shù)據(jù)采集
數(shù)據(jù)采集系統(tǒng)不但要對數(shù)據(jù)進(jìn)行定時(shí)采集、壓縮和傳送,還要保證接收和加載等過程。為了使采集程序有更強(qiáng)的適應(yīng)性,數(shù)據(jù)采集系統(tǒng)采用了兩級分工的工作模式:客戶端采集傳送,由服務(wù)端負(fù)責(zé)接收和加載,這樣可以大大提高在廣域網(wǎng)中可能出現(xiàn)的傳輸性能不佳情況下的傳輸效率。為了對不同采集條件、不同的數(shù)據(jù)源進(jìn)行智能采集,客戶端采用了多模塊的工作方式,以實(shí)現(xiàn)不同的采集功能。
3.3 數(shù)據(jù)轉(zhuǎn)換
證券、銀行等系統(tǒng)進(jìn)行系統(tǒng)切換時(shí),需要進(jìn)行數(shù)據(jù)遷移。數(shù)據(jù)遷移技術(shù)能夠?qū)㈦x線存儲和在線存儲進(jìn)行融合,常常應(yīng)用于系統(tǒng)升級、數(shù)據(jù)更新等工作中。數(shù)據(jù)遷移對于新系統(tǒng)的成功切換是至關(guān)重要的,它的質(zhì)量影響著系統(tǒng)上線和之后運(yùn)行的穩(wěn)定。由于證券市場的特點(diǎn),股票交易等信息變化迅速,必須要一種數(shù)據(jù)轉(zhuǎn)換系統(tǒng)來應(yīng)對不斷動態(tài)變化的數(shù)據(jù)信息,及時(shí)地更新股票信息。
數(shù)據(jù)轉(zhuǎn)換系統(tǒng)使用了.NET平臺技術(shù)進(jìn)行開發(fā),在源數(shù)據(jù)庫和目的數(shù)據(jù)庫之間進(jìn)行直接轉(zhuǎn)換。
3.4 數(shù)據(jù)挖掘分析
經(jīng)過連接數(shù)據(jù)庫,采集數(shù)據(jù),數(shù)據(jù)轉(zhuǎn)換后得到的信息將被用于數(shù)據(jù)挖掘分析,采用蟻群算法對數(shù)據(jù)進(jìn)行挖掘分析,主要步驟如下:(1)建立股票綜合評價(jià)指標(biāo)體系;(2)選定蟻群分析范圍;(3)收集股票樣本指標(biāo)數(shù)據(jù);(4)求行業(yè)指標(biāo)均值;(5)數(shù)據(jù)標(biāo)準(zhǔn)化處理;(6)運(yùn)行蟻群分析;(7)生成類譜圖;(8)分析聚類結(jié)果,尋找具有投資價(jià)值的股票,進(jìn)行決策。
四、總結(jié)
證券行業(yè)形勢復(fù)雜多變,對大量的數(shù)據(jù)進(jìn)行簡單的存儲記錄對開展業(yè)務(wù)、投資分析、推斷決策助力甚微。將數(shù)據(jù)挖掘技術(shù)應(yīng)用于證券分析投資中,可以降低數(shù)據(jù)的冗余度。本文搭建基于.NET及SQL Sever平臺的證券分析系統(tǒng),對數(shù)據(jù)進(jìn)行提取、轉(zhuǎn)化,根據(jù)一定模式進(jìn)行處理,克服證券行業(yè)信息系統(tǒng)智能化水平低、數(shù)據(jù)簡單堆積的缺點(diǎn),提高了數(shù)據(jù)的利用效率。