【摘 要】 隨著計算機技術(shù)的發(fā)展,機器學(xué)習(xí)技術(shù)廣泛應(yīng)用于工業(yè)界各個領(lǐng)域。傳統(tǒng)計量經(jīng)濟學(xué)與機器學(xué)習(xí)有著共同的理論基礎(chǔ)和相同的研究方法,同時從研究方式與目的 , 對模型的要求、模型檢驗方式都有著明顯的差異。對于傳統(tǒng)計量經(jīng)濟學(xué)存在諸多不足,例如理論假設(shè)過強、樣本不足、模型泛化能力弱等問題,機器學(xué)習(xí)的范式和方法可以應(yīng)用于其中,可以有效解決傳統(tǒng)計量經(jīng)濟學(xué)中的問題。
【關(guān)鍵詞】 機器學(xué)習(xí) 計量經(jīng)濟學(xué) 模型泛化
一、引言
機器學(xué)習(xí)被視為人工智能的子集,是對算法和統(tǒng)計模型的科學(xué)研究,計算機系統(tǒng)使用這些算法和統(tǒng)計模型來執(zhí)行特定任務(wù)而無需使用明確的指令,而是依靠模式和推理。機器學(xué)習(xí)算法基于樣本數(shù)據(jù)(稱為訓(xùn)練數(shù)據(jù))建立數(shù)學(xué)模型,以便進行預(yù)測或決策,而無需明確程序來執(zhí)行任務(wù)。隨著信息技術(shù)的快速發(fā)展以及互聯(lián)網(wǎng)普及,大數(shù)據(jù)得以產(chǎn)生,機器學(xué)習(xí)在諸多領(lǐng)域如醫(yī)學(xué)、金融、數(shù)據(jù)分析等發(fā)揮著重要的作用。隨著機器學(xué)習(xí)在各行各業(yè)應(yīng)用的不斷深入,經(jīng)濟學(xué)界也開始廣泛應(yīng)用機器學(xué)習(xí)于經(jīng)濟領(lǐng)域的研究。這方面,國外學(xué)者已經(jīng)取得積極進展,如諾貝爾獎得主薩金特就開設(shè)“量化經(jīng)濟”(QuantEco)項目,運用機器學(xué)習(xí)方法對傳統(tǒng)經(jīng)濟學(xué)重新演繹。
計量經(jīng)濟學(xué)是以數(shù)理經(jīng)濟學(xué)和數(shù)理統(tǒng)計學(xué)為方法論基礎(chǔ),對于經(jīng)濟問題試圖對理論上的數(shù)量接近和經(jīng)驗(實證研究)上的數(shù)量接近這兩者進行綜合而產(chǎn)生的經(jīng)濟學(xué)分支。然而,傳統(tǒng)的計量經(jīng)濟學(xué)有著其固有的缺陷,無法對很多現(xiàn)實問題作出令人信服解釋,尤其是在預(yù)測方面。而基于現(xiàn)有的樣本數(shù)據(jù)對測試數(shù)據(jù)作出準(zhǔn)確預(yù)測是機器學(xué)習(xí)基本任務(wù)。因此,將機器學(xué)習(xí)范式和方法運用于計量經(jīng)濟學(xué)中,可以很好地彌補傳統(tǒng)計量經(jīng)濟學(xué)中的不足。
二、機器學(xué)習(xí)與計量經(jīng)濟學(xué)的異同
某種程度上,機器學(xué)習(xí)與計量經(jīng)濟學(xué)是“一枚硬幣的兩面”,許多經(jīng)典的機器學(xué)習(xí)算法如線性回歸、Logit回歸等線性模型最早開始也是在經(jīng)濟學(xué)研究中運用,并隨著計算機技術(shù)的發(fā)展逐漸開始在其他領(lǐng)域中應(yīng)用。線性模型也是機器學(xué)習(xí)算法的基礎(chǔ),近年興起的神經(jīng)網(wǎng)絡(luò)也是從線性模型發(fā)展而來。最優(yōu)化是計量經(jīng)濟學(xué)主要研究手段,同時也是機器學(xué)習(xí)優(yōu)化模型主要方法,因此兩者研究本質(zhì)都是最優(yōu)化問題。從中可以看出,計量經(jīng)濟學(xué)和機器學(xué)習(xí)有著共同的理論基礎(chǔ)和研究方法。
然而,兩者的“任務(wù)”是不同的。傳統(tǒng)計量經(jīng)濟學(xué)主要任務(wù)是對經(jīng)濟理論進行實證分析,對研究者提出理論進行事后檢驗,模型的可解釋性非常重要;機器學(xué)習(xí)的主要任務(wù)是預(yù)測,主要解決回歸和分類問題,模型的可解釋性的重要程度并非最高。
三、機器學(xué)習(xí)能彌補計量經(jīng)濟學(xué)的不足
傳統(tǒng)計量經(jīng)濟學(xué)廣泛應(yīng)用于主流經(jīng)濟學(xué)的研究,在學(xué)術(shù)界引起了許多爭議,一方面,很多學(xué)者認(rèn)為這使得“工具主義”在經(jīng)濟學(xué)界泛濫,忽略經(jīng)濟研究的本質(zhì);另一方面,傳統(tǒng)經(jīng)濟學(xué)一直強于解釋而疏于預(yù)測,對未來經(jīng)濟趨勢總是無法作出準(zhǔn)確合理預(yù)測。傳統(tǒng)計量經(jīng)濟學(xué)的實證結(jié)果僅能對已有數(shù)據(jù)和觀測結(jié)果進行檢驗,往往不重視對新樣本的預(yù)測,這很容易使得模型過擬合。而機器學(xué)習(xí)其中一個主要研究方向是解決模型的過擬合問題,以更好地給出合理的預(yù)測。谷歌首席經(jīng)濟學(xué)家范里安(Hal Varian)認(rèn)為,機器學(xué)習(xí)的范式和可以和計量經(jīng)濟學(xué)無縫銜接,機器學(xué)習(xí)諸多方法解決傳統(tǒng)經(jīng)濟學(xué)存在的諸多問題。
1. 劃分訓(xùn)練-測試數(shù)據(jù)集。傳統(tǒng)計量經(jīng)濟學(xué)主要是通過統(tǒng)計量檢驗?zāi)P偷臄M合好壞,但這種方法有著很大局限,強于解釋而疏于預(yù)測,尤其在對未知數(shù)據(jù)的預(yù)測上。算法模型使用訓(xùn)練集進行擬合,并對訓(xùn)練集預(yù)測,然后再對測試集進行預(yù)測,將兩者的結(jié)果進行比較。如果訓(xùn)練集的預(yù)測結(jié)果與測試集的結(jié)果相差很小,則表示模型的泛化能力很好;反之,模型的泛化能力很差。
傳統(tǒng)計量經(jīng)濟學(xué)一般不會劃分?jǐn)?shù)據(jù)集來檢驗?zāi)P偷臄M合好壞,無法檢測模型的泛化能力,這使得計量經(jīng)濟模型無法應(yīng)用到未知的數(shù)據(jù)。
2. 正則化。正則化在機器學(xué)習(xí)中主要用于防止模型的過擬合,提高模型的泛化能力。正則化是為解決過擬合問題而加入的額外信息的過程,而額外信息一般作為懲罰項加入到最優(yōu)化過程中,以降低模型的復(fù)雜度。復(fù)雜的模型往往無法很好地擬合訓(xùn)練數(shù)據(jù),但無法擬合未知數(shù)據(jù)。 損失函數(shù)內(nèi)置正則化技術(shù),以“懲罰”參數(shù)過多的模型。“正則化”的意思是要讓預(yù)測更加“規(guī)范”或更可接受,讓模型更能適應(yīng)未知的數(shù)據(jù)。
線性回歸、Logit回歸等線性模型在傳統(tǒng)計量經(jīng)濟學(xué)有著廣泛應(yīng)用,但在計量經(jīng)濟學(xué)中線性模型有著很強的假設(shè) ,比如同方差、不存在多重共線性等,這些假設(shè)在現(xiàn)實中很難實現(xiàn)。這就導(dǎo)致計量經(jīng)濟模型都存在過擬合現(xiàn)象。通過在計量模型加入懲罰項可以很好解決計量經(jīng)濟模型中不能滿足假設(shè)的情況,可以很好解決模型過擬合情況。
3. 馬氏鏈蒙特卡洛方法。馬爾可夫鏈蒙特卡洛方法(MCMC)是一組用馬氏鏈從隨機分布取樣的算法,之前步驟的作為底本。它從連續(xù)隨機變量創(chuàng)建樣本,其概率密度與已知函數(shù)成正比。它能有效解決數(shù)據(jù)分析中樣本不足的問題。在傳統(tǒng)的計量經(jīng)濟學(xué)中,數(shù)據(jù)樣本的獲取和樣本質(zhì)量的好壞對實證結(jié)果有著重要的影響。現(xiàn)實中,樣本不僅在獲取上存在困難,而且取得的樣本質(zhì)量上往往參差不齊。因此,MCMC能有效解決計量經(jīng)濟學(xué)中樣本不足的問題。
四、結(jié)論與展望
隨著計算機技術(shù)的發(fā)展和大數(shù)據(jù)的興起,機器學(xué)習(xí)與其他學(xué)科領(lǐng)域融合會越來越多,而傳統(tǒng)計量經(jīng)濟學(xué)與機器學(xué)習(xí)有著共同的理論基礎(chǔ)和相同的研究方法。將機器學(xué)習(xí)的方法和范式運用于計量經(jīng)濟學(xué)中,既可以有效解決傳統(tǒng)計量經(jīng)濟學(xué)強于解釋而疏于預(yù)測的不足,還可放寬傳統(tǒng)計量經(jīng)濟學(xué)過于嚴(yán)苛的理論假設(shè),讓理論模型更貼近于現(xiàn)實。此外,機器學(xué)習(xí)更加注重模型的預(yù)測能力,而不是模型的可解釋性,因而大大降低了研究者的理論門檻。
【參考文獻】
[1] 高華川.機器學(xué)習(xí)在經(jīng)濟學(xué)中的應(yīng)用[J].納稅,2019,13(24):152-153.
[2] 周志華. 《機器學(xué)習(xí)》[J]. 航空港, 2018(2):94-94.
[3] Chevalier J . Comment on "Artificial Intelligence, Economics, and Industrial Organization"[J]. NBER Chapters, 2018.
作者簡介:朱明(1992),男,漢,湖南省郴州市,學(xué)生,碩士,廣東財經(jīng)大學(xué),產(chǎn)業(yè)經(jīng)濟學(xué)