余懷?婁必偉 余廷忠




針對股市常規基本面和技術面分析的局限性,基于大數據的股市預測及投資分析越加凸顯其投資收益的科學性和可靠性。文章從大數據技術視角,對神經網絡和機器學習等算法、以及對投資情緒和量化投資等問題進行研究綜述。
股票投資是高收益與高風險并存的,自股市誕生以來,股票波動及走勢一直是每個投資者高度關注和研究的話題。投資者希望通過股市研究,揭示大盤及個股走勢規律,從而對個股行情及走勢進行預判。但由于股票投資市場存在非線性、不平穩性及高度復雜性等特征,使得投資者對股票走勢預測研判具有很多不確定性。但隨著大數據技術在各個行列的應用不斷普及和深入,特別對股票走勢預測及研判的指導作用必將越來越凸顯其重要性。
一、股市行情分析概述
(一)常規股市行情分析方法
人們通常對股市行情分析主要包括基本面和技術面兩方面。
1.基本面分析
基本面分析有廣義和狹義之分:廣義的基本面分析,是指以經濟學中的供求關系為研究基礎,通過分析歷史經濟數據和政治環境,主要對利率水平及通貨膨脹等為主要指標的宏觀經濟運行狀況、企業素質等為主導的微觀經濟情況和政治環境等進行分析,以便對金融市場趨勢進行預測;狹義的基本面分析,主要針對企業財務報表中的機構管理成員素質、財務指標、所屬行業發展及主打產品競爭強度等進行分析,著重對公司的經營管理分析、市場狀況和行業地位等方面的分析,主要分析公司主營業務成長性和宏觀經濟運行態勢,對公司價值及股價走勢的影響進行預測及研判。基本面分析將為中長線投資者提供投資決策的主要依據。
2.技術面分析
技術面分析是通過對市場行為研究來預判市場運作趨勢,通過市場運作趨勢的變化周期來進行股票交易的決策。技術分析者認為股票市場行為具有重復性,市場交易的歷史必會重演。技術面分析著重以供求關系為基礎對股市行情進行分析研究。主要研究股票價格動向、換手率、交易量、交易趨勢等技術指標(包括持股人對未來的希望、擔心及恐懼等,都將直接反映在股票價格和交易量上),使用這些指標,以便對該股票的未來價格進行預判,從而進行投資決策。
二、基于大數據技術的股市分析
隨著大數據技術應用的普及,股票市場交易海量數據越來越引起眾多學者關注。當前大數據在證券行業中的應用大致分為三個方面,一是對股價進行預測;二是對客戶關系進行管理;三是對投資景氣指數預測。基于大數據技術的股市分析包含可視化分析、數據挖掘算法、預測性分析能力、語義引擎、數據質量和數據管理、數據存儲與數據倉庫等六個基本方面。特別值得關注的是,支持向量機、神經網絡、決策樹等方法已被廣泛應用于股票預測領域。
(一)基于神經網絡算法分析
基于神經網絡的算法對股票進行技術分析,主要通過確定預測樣本并設定目標變量進行預測,將實際值與預測值相互比較,最后通過建立擬合方程得出實際值與預測值之間的關系,以便為投資者提供決策參考。
(二)基于機器學習算法分析
股票研究學者還通過股票交易過程中獲得的歷史大數據使用機器學習算法,進行建模和訓練,并將訓練出來的模型對股票預期走勢進行預測研判。例如,就股票成交量來說,它是取值于非負整數的時間序列數據,對此類數據的建模,常常會出現估計偏差過大或預測值是非整數等問題,使傳統時間序列模型不再適用。因此其主流建模方法采用基于各類稀疏算子所建立的整數值時間序列模型。由于INAR 模型結構較簡單、解釋性強,因此受到廣大學者普遍關注。當前許多學者還利用大數據將股票每日收盤價,按時間先后次序排列構造成股票交易的時間序列模型,根據該模型來對股票未來變化趨勢預測。其中相當著名的是ARIMA模型。
(三)基于高頻大數據的應用
當前基于大數據的倉庫存儲技術愈加成熟,而高頻數據是其中最常見的數據之一。人們對高頻數據的分析越來越關注和重視,特別是對金融交易規律高頻數據的分析, 已成為眾多投資者和金融研究者的共同訴求。每日股票交易成交量已真實地記錄并反饋出股市的走勢及盤口變化的趨勢,同時也反映出證券市場的交易活躍程度,研究股票日內交易的高頻成交量變化規律,不僅能夠輔助機構投資者有效評估并預測股市走勢及動態,還可使股民及時規避投資風險,因此研究股票交易的高頻數據其重要性不言而喻。
(四)基于大數據的投資情緒分析
投資情緒包含影響投資者對股票估值及市場預期看法的眾多因素。長期以來,券商或證券研究者對投資者情緒的評估測量及量化分析,既是突出的難題也顯得至關重要。當前利用大數據技術對投資情緒的分析,主要體現在通過網民微博、論壇、博客及各種龐大繁雜的網絡媒體介質中挖掘獲取有價值的非結構化的信息,并經過數據分析和處理轉化為結構化信息,結合情感詞典,應用情感分析引擎獲取投資者情緒評價指標,從而得到投資者情緒分析的結果。
(五)基于大數據的量化投資分析
量化投資,是指對證券市場及產品根據歷史交易相關數據進行量化分析,建立相關數據算法模型,并根據模型做出投資決策,再由算法自動完成下單交易。通過人工智能、數據挖掘、支持向量機等大數據分析工具,可使證券投資實現智能化和高頻化。應用量化投資,其特點是借助建模和編程方法,使用Python、MATLAB、R等工具軟件建立投資策略。通過投資策略進行量化選股,可使工作效率大大提高,并且使用機器操作可排除人工操作的不理智及隨意性,使決策結果更加客觀,避免了盲目跟風等決策方式。
下面我們將根據上市公司財務報表、股市行情基本數據及股票相關影響因素,結合學者盛光進的股票價值量化投資模型,建立的股票量化分析模型如表1所示:
可根據股票量化分析模型對任何一個股票量化出一個分數,根據該分數的高與低表示此股票的好與壞(得分越高,表明股票的投資價值越大)。
充分考慮股票得分,并結合股票所屬板塊、題材及國家政策支持等各種其他因素綜合分析,進行股票買賣決策,投資收益概率會更高。
三、大數據及人工智能技術在股票交易市場中的應用
顯然應用股票量化分析模型進行投資決策,需要對其模型中的各項指標參數進行量化,這需要統計和分析大量數據資料,才可能獲得真實可靠的參數,其難度較大。這不是一般投資者能掌握的,為此下面介紹一般投資者都能掌握的方法。
目前很多股票交易軟件都使用了大數據及人工智能技術為投資者提供股市及股票咨詢、智能診股及選股,以及智能統計交易產生的各種數據等諸多服務。例如,同花順軟件提供了基于大數據的AI信息查詢及數據分析和智能選股的“問財”、動態板塊、競價分析等功能,可以為投資者對當日及未來的大盤指數及股票走勢預測作輔助研判;指南針炒股軟件應用大數據技術為投資者提供了實時直觀顯示的主力資金流向圖(包括主力大單、主力資金、敢死隊資金及多空資金)。
下面以同花順“問財”投資策略為例,對基于大數據及人工智能技術的投資策略進行分析。
(一)“問財”功能的技術背景分析
同花順的“問財”熱搜策略是基于人工智能技術,利用多因子模型構建的選股策略,洞察智能投資行業未來發展趨勢,致力于將人工智能、大數據、知識圖譜等信息技術和專業的投資理念相結合,打造下一代智能投資平臺,致力于為中小投資者提供專業的數據服務,具有對話算法、知識圖譜及智能搜索等功能。對話算法功能將多輪對話、圖譜問答、全雙工、多模態、機器閱讀等領域前沿算法技術轉化為智能投資、智能客服、智能營銷等智能機器人產品;知識圖譜功能將自然語言、圖像中的深度學習技術、本體推理技術、因果推理技術,以及傳統機器學習技術集成到金融信息生產線、金融知識融合、金融邏輯框架自動生成等產品中,為智能投資提供堅實的數據支撐和邏輯支撐;智能搜索功能擁有百萬級站點的分布式抓取,整合百億級全網文本、視頻以及金融領域多年積累數據,利用語義理解,情感分析和知識圖譜技術,通過在海量信息中挖掘行業、公司及人物之間關系,構建事件圖譜,為千萬用戶提供全面及時準確的一站式智能搜索服務。
(二)“問財”投資策略功能的應用分析同花順的“問財”投資策略在每個交易日都將根據大數據及人工智能算法模型,在集合進價結束,即9:25及盤中的時候,分別按照跟著主力、溫和放量、趨勢向上、機構大舉買入、主力進入及趨勢良好等板塊推出1只或多只股票。
跟著主力板塊:系統將根據量能理論,使用成交量,主力資金等多維度指標分析,在每日9:25開盤,選出當日最具上漲潛力的股票。
溫和放量板塊:系統將根據量能理論,使用近兩日成交量,前一交易日漲停封流比等多維度指標分析,在每日9:25開盤,選出當日最具連板潛力的股票。
趨勢向上板塊:系統將根據道氏理論,使用均線,CR機構多空線等多維度指標分析,在每日9:25開盤,選出最具上漲潛力的股票。
機構大舉買入板塊:系統根據機構席位大額凈買入,籌碼集中在機構手中等維度分析,在每日9:25開盤,選出近期最具上漲潛力的股票。
主力進入板塊:系統將通過DDE大單、中單等多個資金指標綜合判斷主力強弱,同時選取成交量放量,股價低于最高點50%以上的個股。
趨勢良好板塊:系統將根據均線和量能理論,結合近3天振幅大于5%、近5天漲跌幅小于15%,在盤中選出符合條件的股票,代表具備一定的趨勢潛力。
例如,表2表示“問財”投資策略系統從2021年8月10日至2021年8月20日(共9個交易日),跟著主力、股價低估、溫和放量、趨勢向上、機構買入、主力進入共六個板塊所推出的131支股票交易按板塊平均值計算的行情數據。
從表中可看出,在股票推出當天如果投資者以開盤價買進,等到次日再以開盤價賣出都會獲得普遍不錯的收益。特別是屬于機構買入和趨勢向上的板塊,平均收益率會更高。如果按開盤價當天買入所屬“機構買入”板塊推出的股票,當天的平均收益率將達到4.54%,次日開盤平均收益率為2.38%,若以次日開盤價賣出,平均收益率將達到6.92%。
結 語
雖然大數據及人工智能技術在證券市場得到廣泛應用,為投資者提供股市及股票咨詢、智能診股及選股,以及智能統計交易產生的各種數據等諸多服務,使投資者對股票的交易行為更加理智和科學。但投資者應當知道,影響證券市場的因素極其復雜,任何軟件和技術都有一定的局限性,故大數據及人工智能技術的使用只能作為參考。
(作者單位:貴州工程應用技術學院;信息工程學院)
本文系2021年貴州工程應用技術學院大學生創新訓練省級項目“基于大數據的股票量化分析及趨勢研究” (編號:S202110668070)。