周涵
摘要: 在高度信息化的今天,大數據已經充斥在我們每個人的生活中,數據信息化也離我們越來越近,不僅如此,在傳統金融行業里同樣也逐漸開始運用大數據技術來分析市場走向以及人們的消費習慣等等。如何從海量的大數據中挖掘出有價值的信息,并且利用其來做出正確的投資判斷,是本文研究的根本話題。
關鍵詞:計算機、大數據、金融、運用模式
一、引言
眾所周知,金融是市場主體利用金融工具將資金從資金盈余方流向資金稀缺方的經濟活動。現如今大數據的出現使各種數據飛速增長,對大數據的研究和利用慢慢拓寬到了各個領域,而金融領域則是涉及最多的領域之一。
二、互聯網金融的相關概念與意義
從2013年開始互聯網金融開始興起,和傳統金融不同,互聯網金融是指用互聯網技術完成相關的金融活動,這種新型金融模式突破了時間和空間的限制,使原有的服務成本大幅降低,如掌上銀行、移動支付、網絡借貸、基金理財等等,這些原本需要去營業廳辦理的業務如今在手機上就可以輕松做到。對于非傳統意義上的金融機構以及個人來說,金融對于他們更像是余額寶等活期理財服務以及花唄、京東白條等小微貸服務,這些服務的最大共同點就是回款周期較長,基本都是一個月左右甚至還有36期也就是三年時間,當然以這種形式的小微貸貸款金額通常較小,對機構來說,金額小意味著風險低,不用擔心用戶還不上款,而對于用戶來說買個手機可以分12期還款,他們可以買到自己想要的東西,同時也大大提高了手里現金的流動度。對金融機構、用戶和企業來說,這是一個雙贏的局面。對于傳統金融機構來說,互聯網金融主要表現為網絡銀行業務,如工商銀行的網絡銀行業務占到了全部業務的78%,平均每秒就有6500筆業務產生。[1]
由此觀之,互聯網金融作為一種新的金融方式,在日常中起到了非常大的作用,也是傳統金融行業的一次技術革新。
三、大數據相關技術
3.1數據采集
數據采集就是從龐大的信息量中收集到各種各樣的結構化和非結構化數據。
數據庫采集:目前比較常見的傳輸數據的工具有Sqoop和ETL,傳統的關系型數據庫MySQL和Oracle等等也依然是許多企業主要的數據存儲方式。對于 kettle 和 talend 本身,現在可以進行大數據集成,使 hdfs、hbase 和當前主流 nosql 數據庫之間的數據同步和集成成為可能。
Web 數據捕獲:這是一種通過 web 爬蟲或 web 公共 api 從 web 頁面獲取非結構化或半結構化數據的方法,不僅如此,它還可以統一地結構化為本地數據。
3.2數據挖掘
大數據挖掘,需要大數據技術框架的支持,早期的Hadoop MapReduce框架,是解決大數據挖掘問題的第一代框架,而隨著數據處理需求的變化,緊隨其后又出現了很多的解決方案,比如說UCBerkeley的Spark,斯坦福大學的Phoenix等。
在龐大的數據量中尋找某種關系的被稱為無指導數據挖掘,而我們常用的分類、預測、估值等則屬于有指導的數據挖掘。目前,數據挖掘的算法主要包括神經網絡法、決策樹法、遺傳算法、粗糙集法、關聯規則法等。
四、大數據技術在金融領域的運用
4.1大數據在金融市場中的作用
大數據具有一個很重要的特性就是可以通過對現有采集到的數據進行分析,從而對該事物進行一個全方面的判斷與。而在金融行業里這更顯得尤為重要,我們可以借助于大規模的數據技術,幫助金融機構在相關的金融衍生產品中進行創新,通過對用戶的個人信息如愛好、收入等方面進行分析,由此來推薦給他最適合他的金融產品,這是傳統金融行業所不能做到的。
4.2大數據在進行金融投資中的作用
大數據技術的核心是利用相應的計算機來掌握數據的價值,而機器學習則是利用我們來掌握數據的價值核心技術,對于利用大數據,機器學習非常重要。在股票等金融市場中,投資者可以使用機器學習中的相應算法來選擇股票。本文介紹了隨機森林算法,隨機森林是一種將多樹與集成學習思想相結合的算法,它的基本單元是決策樹,每個決策樹是一個分類器,然后對于一個輸入樣本,n個樹將有 n 個分類結果。隨機森林集成了分類投票的所有結果,得票最多的類別被指定為最終輸出,這是最簡單的裝袋思想。同時,隨機森林模型在訓練完樣本之后,可以通過基尼系數來評價各個特征,這一點降低了機器學習方法“黑箱”的特性。通過選用股市常用的一些判別因子(如價值、成長、動量以及盈利等四大類因子)對股票走向進行預測,在李斌等人所做的實驗基礎上,基于A股市場的96個基本面異常因素,采用12種機器學習算法構建股票收益預測模型和投資組合,表現最好的深度前饋網絡預測的多空組合可以獲得2.78%的月度收益。[2]因此,我們可以通過機器學習有效地預測股票等金融產品的未來方向。
4.3大數據在供應鏈金融中的作用
供應鏈管理是指在實現一定供應鏈效益的前提下,通過對供應商、制造商、倉庫、配送中心和渠道商等實體進行有效組裝而使整個供應鏈系統成本達到最小的管理方法。[3]在如今大數據的背景下,供應鏈金融也出現了更多不同的特點,一是速度快,這個快不僅僅說的是供應物流速度快,也包括支付交易的速度快;二是可預測,我們可以通過對處于供應鏈下流的的企業或者物流收貨人群進行預估,從而得知哪種物流方式或者物流布局更適用于目標客戶,減少成本提高效率。
五、結論
總的來說,大數據與現代的新金融相輔相成,文章解釋了相應的計算機與大數據技術,并且分析了大數據在金融行業里所起到的作用,也討論了未來的方向。
參考文獻:
[1]姜超峰.供應鏈金融服務創新[J].中國流通經濟,2015,29(01):64-67.
[2]李斌,林燕,唐文軒.ml-tea: 一種基于機器學習和技術分析的定量投資算法[ J ].系統工程理論與實踐,2017(5):1081-1092
[3]田陽,陳智罡,宋新霞,李天明.區塊鏈在供應鏈管理中的應用綜述[J/OL].計算機工程與應用:1-18[2021-07-25]