何大安
從機器學習在新科技應用中扮演的角色考察,無論是以許多簡單模型代替單一復雜模型,進而得到大量計算機服務器支持并廣泛運用的“數據驅動法”,還是以計量經濟學為底蘊從而將人工智能作為通用技術使用的分析方法,機器學習都將成為赫然貫穿其間的主要技術方法。
(一)機器學習技術及其類型不斷提升的過程,是大數據金融發展的過程,這個過程代表著金融運行的未來趨勢
機器學習是指通過對海量數據之多維度的分析處理,甄別和剔除扭曲信息和錯誤信息,通過搜尋真實或準確信息來實現最大化決策的一種匹配大數據的人工智能方法。學術界根據機器學習的特征,將之分為監督學習(Supervised Learning)、無監督學習(Unsupervised Learning)和強化學習(Reinforcement Learning)三種類型。監督學習與無監督學習之間的區別,在于學習過程中有沒有標簽的數據樣本。對于大數據金融來說,由于不同金融產品具有不同資本屬性,具有不同的價格數據,金融機構通常會運用具有回歸算法和分類算法的監督學習,按照數據輸入和輸出的一般法則,通過建模對這些數據展開機器學習。另一方面,在大數據金融的運行中,基于任何一種金融產品都不明顯具有反映明確收益的特征,金融機構也會運用沒有數據樣本標識的聚類算法來進行無監督學習,以期通過機器學習來體驗和匹配各種不同金融產品的大數據,進而運用于自己的決策。不過,針對大數據金融之數據多維度的復雜性,監督學習和無監督學習只是金融大數據走向大數據金融中的基礎性機器學習方法;它們通常局限于歷史數據,對現期數據的匹配還有相當大的距離,至于把未來數據轉化成“算法”則是很遙遠的事。目前正在廣泛運用的強化學習(Reinforcement Learning),是一種在動態環境中不斷試錯從而努力使決策最大化的人工智能算法;強化學習比較適合于金融機構對短期金融品種的經營,能在一定程度和范圍內匹配現期數據,但它還是望塵莫及于未來數據。隨著大數據金融的進一步發展,金融機構開始使用迄今為止最先進最深邃的深度學習(Deep Learning)方法,機器深度學習方法之所以被廣泛運用于大數據金融,是因為它將以大數據的多維度為鍥入口,通過多層次神經網絡的設計,把低層級特征數據與高層級特征數據相結合,以揭示大數據的分布特征;深度學習推動了人工智能技術的進一步發展,但它仍然不能處理和匹配現期數據和未來數據。大數據金融的未來發展趨勢,是具備頂級新科技的金融機構能夠匹配現期數據和未來數據,這要求金融機構以機器學習為代表的人工智能技術的快速提升。
(二)大數據思維會代替過去只依據部分數據進行推論的因果思維,隨著大數據金融的發展,在將來金融機構的因果推斷中機器學習會得到越來越多的應用
大數據思維本質上仍然是因果思維,但較之于過去那種只依據部分數據進行推理的因果思維,它是建立在決策信息來源于大數據這個推論之上的,大數據思維反映了工業化時代人類運用有限樣本數據不能準確剖析事物因果關系從而不具有總體性和相關性的缺陷;關于這個問題,舍恩柏格曾通過對大數據分析如何提示人類取舍信息的解說,對大數據思維是一種包含總體思維、相關思維、容錯思維和智能思維的模式作出了論證。總的來講,金融機構投資經營的效用函數會驅動他們放棄傳統因果思維模式,金融大數據的極大量、多維度和完備性等特征,會要求金融機構采取容納總體思維、相關思維、容錯思維和智能思維的大數據思維模式。
機器學習之于選擇行為的預測,越來越顯示出機器學習在因果推斷中的極強應用前景。計量經濟學融合機器學習方法是一種學術趨向。從學科發展和大數據金融的未來發展考察,有一點幾乎可以肯定,那就是這種融合會產生一種以機器學習為主、經濟計量為輔的格局。這可從以下兩方面說明:1.基于利用常規傾向性得分匹配法(Propensity Score Matching)得出的估計難以在協變量眾多的前景下進行,機器學習可以采用套索算法(LASSO)和隨機森林(Random Forest)等方法來篩選眾多協變量,以代替傳統步驟對大數據進行的匹配;2.機器學習重視因果推斷中的異質性處理效應(Heterogeneous Treatment Effect),這將在很大程度上彌補過去因果關系推斷只關注平均處理效應(Average Treatment Effect)的不足。金融大數據包含眾多協變量,它在數據匹配和數據異質性處理等方面,一定會隨大數據金融之覆蓋面的進一步拓寬而復雜化,因而機器學習方法的應用空間是巨大的,這是其他人工智能手段無法比擬的。大數據金融中的機器學習應用空間拓展的效應,突出反映在金融機構對現期數據和未來數據的挖掘、加工、處理和匹配上。對于金融機構來講,如果他們的數據智能化達到很高乃至于達到頂級水平,那便意味著機器學習將會深入應用到各種金融產品及其組合的相對準確的預測上,投資效用是很高的;反之,則表明金融機構駕馭金融大數據的能力還處于較低層級,意味著機器學習的應用水平還有很大的提升空間。
(三)在大數據金融的實際運行中,金融機構的決策行為仍然是理性選擇,他們具有怎樣的數據智能化層級就會有怎樣的效用函數值
金融大數據的完備性和極大量具備了提供完備信息的基礎,金融機構可通過5G通信、互聯網、物聯網、傳感器、定位系統、社交媒體等,去搜集、整合和分類各種金融產品的大數據;可通過云平臺、云計算、機器學習、物聯網、區塊鏈等人工智能手段,去加工和處理各種金融產品的大數據,于是,信息約束的局面將隨金融機構能夠從金融大數據中獲取大量信息而逐漸被打破。就認知約束而論,金融機構可通過云平臺、云計算、機器學習等人工智能手段,通過對金融大數據進行多維度分析以取得正確認知,從而使認知形成過程由以前明顯夾帶主觀判斷的分析路徑轉變成主要依靠新科技的認知路徑。這種轉變實際上是改變了金融機構的理性選擇的內容和過程,以至于悄然改變了金融機構的認知函數、偏好函數和效用函數,值得經濟學家深入思考和研究。大數據金融實踐在理性選擇理論上向我們展現的基本分析線索和畫面,既不是傳統理論在“經濟人假設”基礎上通過給定條件約束和運用嚴密數理邏輯推論所得出的何種選擇才符合理性,也不是運用大量數學模型來解釋什么樣的選擇才是能實現最大化的理性。結合機器學習等人工智能手段的運用來理解,這種畫面可以解釋為是“人與數據對話”以及“數據與數據對話”。需要說明的是,這兩種對話形式與經濟行為主體的新科技層級相關聯。
如上所述,依據云平臺、云計算、網絡協同、機器學習等人工智能技術的掌握和運用,我們可把金融機構劃分為掌握新科技的低級層級、中級層級和高級層級的決策主體;易言之,金融機構運用機器學習等技術手段加工和處理金融大數據的能力,從而取得什么樣的效用函數的能力,是由他們的新科技層級決定的。
在全球經濟一體化的背景下,金融機構面對錯綜復雜的金融產品的價格波動,要實現效用函數最大化,必須能夠對金融大數據有挖掘、加工和處理的能力,這是我們反復強調的。但從嚴格意義或高標準要求來講,金融機構必須具有將客戶和競爭者的偏好和認知等轉化為“算法”的能力,這便要求金融機構在掌握和運用機器學習方法的同時,還能夠掌握和運用諸如邏輯推理、概率推理、專家系統、語音識別、自然語言處理等人工智能技術。金融機構進入新科技的頂級層級的標志,是能夠挖掘正在發生的現期數據和尚未發生的未來數據,因此,問題的討論又回到了機器學習這一人工智能技術的掌握和運用上。