999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于百度搜索數據的區域經濟指標預測模型研究

2021-03-22 05:27:02陽向軍謝金蕓梁宗經
生產力研究 2021年1期
關鍵詞:百度模型

陽向軍,謝金蕓,梁宗經,楊 昕

(1.廣西師范大學經濟管理學院,廣西桂林 541004;2.桂林航天工業學院理學院,廣西桂林 541004)

一、文獻綜述與問題的提出

在以往關于宏觀經濟預警的研究中,我們通常需要通過觀測一組反映經濟發展狀況的敏感性指標的變動情況來判斷經濟系統當前的運動狀況和未來的發展趨勢[1-3]。但由于宏觀經濟系統的非線性和不確定性問題,傳統的預測和預警模型與實際系統存在較大的誤差[3]。近年來國內學者在非線性宏觀經濟預測模型方面進行了許多大膽創新和嘗試,包括神經網絡(賀京同等,2000)[3]、模糊數學(陳又星和徐輝,2010)[4]、行為經濟學理論(肖爭艷和陳彥斌,2006)[5]等。當前各文獻的預測方法所用數據主要來源于各級政府部門、行業協會的統計數據,其具有滯后性特征,根據這些滯后數據所建立的預測不具時效性,不能實現實時預測監測。因此,尋找質量更高的數據資源對預測結果的改善具有重要意義。

近年來,網絡搜索引擎查詢數據的出現使宏觀經濟的實時預測預警成為可能。隨著社會信息化的不斷發展,網絡已成為日常生活、企業發展、政府管理必不可少的信息來源,搜索引擎則是查詢信息的主要工具。搜索引擎查詢數據是用戶使用搜索引擎查詢信息后所記錄下來的歷史數據,包含了用戶的豐富信息。網絡用戶的搜索行為通過關鍵詞搜索來實現。搜索查詢關鍵詞的選取與外部的經濟環境、社會環境和個人情況等密切相關,這種相關性近年來引起了國外學者的關注。Jeremy Ginsberg 等(2009)[6]通過分析發現Google 中與流感相關的部分關鍵詞搜索量與美國疾病控制和防治中心發布的流感看診量數據有很強的相關性,并指出監測每天全世界數百萬用戶在搜索引擎上提交的關于求醫行為的查詢是一種可以改進疾病早期檢測的手段。國外隨后興起了相關研究,研究成果表明網絡搜索數據與經濟周期(Suhoy,2009)[7]、失業率(Askitas 和Zimmermann,2009)[8]、個人消費者指數(Konstantin 等,2009)[9]、零售業銷售(Choi 和Varian,2009)[10]、房地產行業銷售(Wu 和Erik,2014)[11]、股票價格波動(Zhi 和Joseph,2009)[12]等相關。國內學者近年來也對網絡搜索數據應用進行了探討:在金融領域,研究了網絡搜索數據與金融市場的量化交易行為之間的相關性,從不同角度驗證了基于網絡搜索來預測股票市場是可行的(劉穎等,2011[13];俞慶進和張兵,2012[14];趙龍凱等,2013[15];楊欣等,2013[16];張誼浩等,2014[17]);在經濟領域,從宏觀層面研究了網絡搜索數據與國內CPI(張崇等,2012)[18]、失業率(彭賡等,2013)[19]、通貨膨脹(孫毅等,2014)[20]之間的關系;在行業層面,探討了網絡搜索數據在汽車銷售量預測(袁慶玉等,2011)[21]、房地產價格預測(董倩等,2014)[22]、旅游客流量預測(任樂和崔東佳,2014)[23]和消費者信心指數構建(孫毅等,2014)[24]的應用。各項實證研究均顯示引入網絡搜索數據的預測模型具有較強的實效性和良好的預測效果。

綜上國內外文獻可知,網絡搜索數據研究已逐步成為指標預測領域的一個新的重要的研究方向。但現有國內的相關研究大部分是針對宏觀層面或者行業層面的指標預測,鮮見針對區域經濟預測的成果。李方一等(2016)[25]基于百度搜索指數與經濟指標之間的相關關系,運用多元回歸方法構建了安徽省區域經濟預測模型,但該文獻并未充分考慮網絡搜索數據的特點去構建多種模型進行比較選擇。本文借鑒文獻[26]的研究思路,采用不同的方法構建廣西區域經濟預測模型。文章選取工業總產值和居民消費價格指數作為預測的基準指標,若干個百度搜索關鍵詞和與經濟波動相關的政府統計指標作為分析的備選指標,利用從備選指標中選出的先行指標分別構建自回歸差分移動平均(Autoregressive Integrated Moving Average,ARIMA)和自回歸分布滯后(Autoregressive Distributed Lag Model,ARDL)兩個系列的多個模型進行實證分析。研究將即時的網絡搜索數據納入區域經濟的預測系統,擬通過構建和對比多種模型去探究網絡搜索數據能否優化僅使用政府統計指標的區域經濟預測模型。

二、數據選取和理論模型

(一)數據選取與處理

1.指標選取

(1)預測的基準指標。本研究選取能反映區域經濟狀況的5 類指標表征區域經濟發展變化,包括經濟發展指標(工業總產值)、價格指標(居民消費價格指數)、外貿指標(出口總額)、金融指標(金融機構各項貸款總額)和人力資本指標(失業率)。后3項指標后續擬另文探討,本文只將工業總產值和居民消費價格指數作為基準指標納入預測機制,從生產和消費兩個不同的角度預測廣西區域經濟的增長。工業總產值是工業企業在一定時期內生產的以貨幣形式表現的工業最終產品和提供工業性勞務活動的總價值量①該定義取自國家統計局官網http://data.stats.gov.cn/.,可反映一定時期內工業生產的總規模和總水平;居民消費價格指數是反映一定時期內居民所消費商品及服務項目的價格水平變動趨勢和變動程度的指標②該定義取自國家統計局官網http://data.stats.gov.cn/.,是衡量通貨膨脹或者通貨緊縮最重要的價格指數。

(2)分析的備選指標。研究中考慮到網絡搜索數據具有高維性、結構復雜性和較大噪音的特點,而政府統計數據則相對嚴謹和噪音小,故建模過程中我們區別使用兩類數據,將分析的備選指標分為政府統計數據和網絡搜索數據兩類考慮:①根據全面性、可靠性、穩定性、時效性、不可替代性的指標選取原則,結合廣西經濟發展綜合情況,并參考相關文獻(晏露蓉和吳偉,2005[27];高鐵梅等,2006[28];陳可嘉和劉思峰,2010[29]),本文選取投資、消費、工業、財政、生產指數、貨幣、物流、外貿、工業企業和金融十大類47 個經濟指標作為分析的備選指標,其中廣西區域經濟指標35 個,國家經濟指標12 個;②借助百度指數推薦功能以及關鍵詞搜索網站站長工具,并借鑒相關文獻(董倩等,2014[22];樊國虎,2014[30];吳英明,2018[31]),篩選了涉及經濟、就業、生活、物價、購房、投資、旅游等方面的75 個高頻率搜索詞匯也作為備選指標。備選指標共計122 個。

2.樣本選取和數據來源

選取廣西2012 年1 月—2017 年12 月相關指標的月度數據為研究樣本,其中2012 年1 月—2017年9 月的數據作為訓練集用于構建模型,2017 年10月—2017 年12 月的數據作為測試集用于檢驗預測效果。目前百度搜索是國內最主要的搜索引擎工具,本文使用百度搜索指數代表網絡搜索數據。各數據來源于國家統計局、廣西壯族自治區統計局、中國經濟與社會發展統計數據庫和百度搜索引擎③百度公司沒有提供可以直接下載的百度指數數據,作者利用軟件手工整理完成了相關指標百度指數原始數據的收集。,其中百度搜索指數為廣西的PC 搜索指數。

(二)模型構建

1.理論模型。本文的被解釋變量為2 個區域經濟指標:工業總產值和居民消費價格指數。為方便起見,我們使用yt表示被解釋變量,t=1,2,…,T 表示時期,yt-i表示被解釋變量滯后i 期的值;解釋變量為從各分析備選指標中選出來的符合條件的先行指標,分為政府統計指標和網絡搜索指標兩類,分別用Xmt和Znt表示,其中Xmt=(x1t,x2t,…,xmt)是m×1 的向量,每一個分量xkt代表一個政府統計指標,共有m 個指標;Znt=(z1t,z2t,…,znt)是n×1 的向量,每一個分量zjt代表一個網絡搜索指標,共有n個指標。研究中為了減少波動性和異方差對計量結果的影響,我們對上述變量取自然對數后再依次構建ARMA 和ARDL 兩個系列的5 個不同的模型。

首先,我們考慮利用被解釋變量t 期之前的信息去預測t 期的值,構建yi的自回歸差分移動平均模型ARIMA(p,d,q),如式(1)。當差分階數d=0,即時間序列為平穩序列時,ARIMA(p,d,q)變為ARMA(p,q)模型,如式(2)。

其次,我們將lnxkt、lnzjt和它們的不同組合納入解釋變量,構建ARDL 系列模型,其中模型(3)包含yi自身的信息和政府統計指標Xmt,記為ARDL+X;模型(4)包含yi自身信息和網絡搜索指標Znt,記為ARDL+Z;模型(5)包含yi自身信息、政府統計指標Xmt和網絡搜索數據Znt,記為ARDL+X+Z。

式(1)~式(5)中,yt、xkt、zjt、t、d 的含義如上所述,p 為解釋變量的自回歸階數,q1、q2為解釋變量的滯后階數,εit為被解釋變量在t 時期的誤差項,ui為常數項,αi、βi、γi是各解釋變量的估計系數,Δ 表示差分方程,即Δlnyit=lnyt-lnyt-1。

2.模型參數的挑選。上文我們構建了5 個包含被解釋變量自身信息、政府統計數據、網絡搜索數據或它們的不同組合做解釋變量的模型,期望從中選出最佳預測模型。在遴選最優模型的過程中,如果解釋變量中包含指標太多,容易導致過度參數化,而包含指標太少則會遺漏掉重要信息導致預測出現偏差。如何從眾多的解釋變量中挑選出少數重要變量是研究中一個關鍵步驟。我們的做法是先通過時差相關分析法選出符合一定標準的先行指標,然后通過單位根檢驗和格蘭杰因果檢驗等方法篩選符合建模條件的指標作為解釋變量,采用AIC、BC 準則等方法確定各解釋變量的滯后階數,并運用一些統計檢驗方法(如t 檢驗檢驗模型系數的顯著性,DW檢驗自相關等)逐步剔除變量,最終將與被解釋變量相關性較強且通過顯著性檢驗的先行指標納入模型,經過多次運行不同變量的組合確定最優模型。

三、實證過程及結果分析

(一)研究方法及實證結果

1.數據預處理

本文建模前先對原始數據進行如下預處理:(1)文中所有指標均采用月度數據,所獲取的關鍵詞百度指數數據頻度為日度,我們已將百度指數日度數據合成為月度數據。(2)因國家統計部門從2012年起不再對一月份的統計數據單獨調查,故本文部分經濟指標的數據存在缺失值,我們采用SPSS 軟件相應功能替換和補全數據缺失值。(3)為了消除數據季節性、周期性、趨勢性的影響,我們運用乘法模型對除居民消費價格指數、商品零售價格指數以外的經濟指標和搜索指數關鍵詞進行季節調整。

2.篩選先行指標

我們將預處理后的基準指標與備選指標進行時差相關分析,篩選出各個指標在相關系數絕對值最大時的超前或滯后階數,并通過每個指標的超前或滯后階數去判斷各個基準指標與備選指標在時間上的對應關系是先行、一致或者滯后。由于研究的主要目的是進行經濟預測,所以我們在三類指標中僅選取先行指標建模。通過對各先行指標與廣西工業總產值和居民消費價格指數進行相關性檢驗,剔除相關性較弱的指標(本文選定弱相關的臨界值為0.325)①指標選取臨界值為0.325 的理由:本研究建模樣本數n 為67,根據兩變量之間線性關系的r 檢驗法[32]查相關系數檢驗臨界值表可知,在1%的顯著水平下,只要兩個變量的相關系數的觀察值|r|大于臨界值ra(n-2)=0.325,就認為兩個變量之間有顯著的線性關系。。以基準指標“工業總產值”與備選指標“金融危機-廣西百度指數”為例,我們先計算了備選指標從-12 階到+12 階與基準指標的相關系數,然后取相關系數絕對值最大時對應的階數作為備選指標的最終時差,各相關系數的計算結果如表1 所示,從表1 可確定備選指標“金融危機-廣西百度指數”的滯后階數為-6。

表1 “工業總產值”與“金融危機-廣西百度指數”的時差相關分析結果

運用上述方法,我們對其余121 個備選指標與基準指標“工業總產值”和“居民消費價格指數”分別進行了時差相關分析,其中相關系數絕對值大于0.325 的指標分別為110 個和108 個。考慮到模型中解釋變量不宜太多且本研究僅需要先行指標進行預測,我們在其中選取了與基準指標最密切關聯(按照相關系數絕對值的大小選取)且時差或延遲數L<-3 的先行指標作為建模的備選指標,每個基準指標包含10 個政府統計指標和10 個百度搜索指標。擬選用先行指標的時差相關分析結果如表2 所示。

表2 時差相關分析篩選出的先行指標

根據上述選取的先行指標對應的最佳滯后階數對數據進行月度平移調整得到新的數據集,對新數據集進行自變量和因變量的相關性分析,結果顯示調整后的指標通過相關性檢驗,可以用來建立預測模型。

3.預測模型構建

(1)單位根檢驗。本文以工業總產值(y1)和居民消費價格指數(y2)為被解釋變量,以上文篩選出來的表2 中的先行指標按照其最佳滯后階數變換后的數值為解釋變量建模。為了減少波動性和異方差對計量結果的影響,我們先對各序列取對數再進行ADF 單位根檢驗。ARDL 模型要求建模數據序列必須為0 階單整(即I(0))或1 階單整(I(1)),但不要求同時同階穩定。工業總產值(y1)及相關序列的檢驗結果為:lny1為I(1),lna1、lna2、lna3、lna4、lna6、lna8、lna9、lna11、lna12、lna13、lna14、lna16、lna17、lna18 共14 個序列為I(1),符合ARDL 建模標準,lna5、lna7、lna10、lna15、lna19、lna20 共6 個序列為I(2),不符合ARDL 建模標準。居民消費價格指數(y2)及相關序列的檢驗結果:lny2為I(0),lna23、lna24、lna27、lna28、lna30、lna32、lna38、lna39、lna40 共9 個序列為I(0),lna26、lna29、lna31、lna33、lna36、lna37 共7 個序列為I(1),這16 個序列符合ARDL 建模標準;lna21、lna22、lna25、lna34 共4 個序列為I(2),不符合ARDL建模標準。我們對符合建模標準的變量進行了格蘭杰因果檢驗,共8 個變量是工業總產值的格蘭杰原因,7 個變量是居民消費價格指數的格蘭杰原因,結果如表3、表4 所示。根據單位根檢驗和格蘭杰因果檢驗的結果并通過經濟分析,我們最后在工業總產值(y1)預測模型中選擇了lna1(固定資產投資當期值)、lna4(對東盟地區出口總額當期值)、lna6(發電量當月值)、lna11(GDP-廣西百度指數)、lna12(貨幣政策-廣西百度指數)和lna18(房貸-廣西百度指數)作為自變量;在居民消費價格指數(y2)模型中選擇了lna26(郵電業務總量)、lna29(地方財政預算收入)、lna30(汽油產量當期值)、lna36(房產稅-廣西百度指數)、lna38(金融-廣西百度指數)、lna39(食品安全-廣西百度指數)作為自變量。

(2)模型的計量結果及分析。我們將篩選出來的自變量納入模型進行估計,工業總產值模型中用x1、x2、x3 和z1、z2、z3 分別表示a1t-4、a4t-4、a6t-4和a11t-4、a12t-4、a18t-5,居民消費價格指數模型中用x4、x5、x6 和z4、z5、z6 分別表示a26t-6、a29t-4、a30t-5和a36t-4、a38t-5、a39t-5①變量的滯后階數如表2 所示。。根據方程(1)~(5)構建ARIMA和ARDL 系列模型,其計量結果如表5、表6 所示。

表3 工業總產值的格蘭杰因果檢驗結果

表4 居民消費價格指數的格蘭杰因果檢驗結果

從表5、表6 可知:(1)確定各個估計模型的具體形式。由于工業總產值序列為1 階單整,故采用ARIMA(p,d,q)和ARDL 系列模型;居民消費價格指數為0 階單整,故采用ARMA(p,q)和ARDL 系列模型。各模型中,ARIMA(p,d,q)、ARMA(p,q)和ARDL+X 不包含百度搜索指數,ARDL+Z 和ARDL+X+Z 包含百度搜索指數。ARIMA 的p、d、q 參數采用BIC 準則確定,ARDL 模型的p、q 參數采用SC 準則確定,最終工業總產值的估計模型分別為ARIMA(6,1,1)、ARDL+X(4,3,0,0)、ARDL+Z(4,4,1,0)、ARDL+X+Z(3,2,0,0,2,0,4),居民消費價格指數的估計模型分別為ARMA(3,2)、ARDL+X(1,0,0,1)、ARDL+Z(1,0,0,0)、ARDL+X+Z(4,2,1,2,0,0,1)。(2)比較各模型的擬合程度。在工業總產值的4 個估計模型中,擬合參數R2分別為0.890 4、0.969 9、0.999 6、0.999 8,各模型均具有很好的擬合效果,其中ARDL+X+Z 模型的擬合程度最高,該模型F 統計量顯著,DW 大于2;在居民消費價格指數的4 個估計模型中,R2分別為0.644 9、0.676 6、0.669 8、0.872 9,ARDL+X+Z 的擬合程度最高,該模型F 統計量顯著,DW 大于2。(3)推斷各變量間的關系。計量結果顯示:ARDL 系列模型的被解釋變量y1、y2均受到其前期數值的影響,但影響程度存在差異;不同模型包含不同的解釋變量,反映著變量間不同的內在關系。通過模型的擬合系數,可以推斷變量間的關系,如:在工業總產值的ARDL+X+Z 模型中,lny1與lnx1、lnx3、lnz1、lnz2、lnz3(或其滯后項)均在10%的顯著性水平上存在相關關系,與lnx2 的系數在統計意義不顯著;在居民消費價格指數的ARDL+X+Z 模型中,lny2除了與lnz4 統計意義不顯著之外,與lnx4、lnx5、lnx6、lnz5、lnz6(或其滯后項)均在10%的顯著性水平上存在相關關系。模型的計量結果表明區域經濟預測指標與網絡搜索數據和政府統計指標之間存在比較穩定的關系。

表5 各估計模型的計量結果(工業總產值)

(3)邊界檢驗和穩定性檢驗。由于ARDL 模型的估計必須在因果變量存在協整關系的前提下才能進行,因此必須檢驗自變量之間是否存在協整關系。我們利用Pesaran 邊界檢驗進行判斷,表5、表6中工業總產值和居民消費價格指數的ARDL 系列模型的邊界檢驗結果如表7 所示。各模型邊界檢驗的F 統計量結果表明,各模型均在5%顯著性水平下存在協整關系,說明我們構建的模型的系數估計在統計意義上成立。

表6 各估計模型的計量結果(居民消費價格指數)

表7 F 邊界檢驗結果

進一步,我們通過遞歸殘差積累和(CUSUM)與遞歸殘差平方積累和(CUSUMSQ)檢驗所構建的ARDL 模型的穩定性。檢驗結果顯示各模型的CUSUM、CUSUMSQ 檢驗的殘差值均在5%的誤差內,表明構建的模型穩定,可以用于實際數的預測分析。圖1 和圖2 分別顯示了工業總產值ARDL+X+Z 模型和居民消費價格指數ARDL+X+Z 模型的穩健性檢驗結果,圖中粗線為5%誤差范圍,細線為殘差值。

(二)模型預測效果評估和檢驗

首先,我們使用不同模型對樣本數據進行預測,并采用平均絕對百分比誤差(MAPE)、平均絕對誤差(MAE)、希爾不等系數(Theil IC)和均方根誤差(RMSE)4 個指標作為預測精度的衡量標準。各模型的預測結果如表8 所示。由表8 可見,以工業總產值為基準指標的預測結果中,ARDL+X+Z 模型在MAPE、MAE、Theil IC 和RMSE 方面均表現最好,其次是ARDL+Z 和ARDL+X 模型,ARIMA 模型預測精度最低;以居民消費價格指數為基準指標的各預測結果中,ARDL+X+Z 模型的各項預測誤差值最小,隨后依次為ARDL+Z、ARDL+X、ARMA。兩個基準指標的各項預測結果顯示,ARDL 系列模型比ARIMA 系列模型預測效果更好,包含網絡搜索數據的模型(ARDL+Z 和ARDL+X+Z)比僅使用政府統計指標的傳統模型(ARMA、ARIMA、ARDL+X)預測精度更高。綜合表5、表6、表8 的結果,本文采用ARDL+X+Z 模型為工業總產值和居民消費價格指數的預測模型。

圖1 ARDL+X+Z 模型的穩健性檢驗結果(工業總產值)

圖2 ARDL+X+Z 模型的穩健性檢驗結果(居民消費價格指數)

表8 預測模型對比結果

其次,運用ARDL+X+Z 模型計算出建模期間(2012 年1 月—2017 年9 月)廣西工業總產值和居民消費價格指數的擬合值,將其與實際值對比來評估模型擬合度,對比結果如圖3 所示。從圖3 可知,我們構建的廣西工業總產值模型在樣本期間的擬合值與實際觀測值擬合結果理想;構建的居民消費價格指數多元回歸模型的擬合值雖與實際值在波峰與波谷處出現一些偏差,但也能比較準確地反映其大致的波動和趨勢。

最后,運用ARDL+X+Z 模型計算檢驗期間(2017年10 月—2017 年12 月)的廣西工業總產值和居民消費價格指數的擬合值,將其與實際值對比來檢測模型的預測效果,對比結果如表9 所示。從表9 可知,工業總產值的預測誤差率和居民消費價格指數預測模型的誤差率均小于0.2%,說明所構建模型的預測效果很好。

圖3 模型擬合值與實際值的對比結果

表9 ARDL+X+Z 模型預測結果及誤差率

綜上分析可見,本文構建的包含政府統計指標和百度搜索指標的兩個ARDL+X+Z 模型有效地減小了預測誤差,能夠很好地對區域經濟指標進行預測。由于工業總產值模型中的自變量滯后4~5 期,居民消費價格指數模型的自變量滯后4~6 期,所以我們構建的模型能利用這些數據比官方統計數據公布前給出預測結果。

四、結論與展望

本文將網絡搜索數據納入區域經濟指標的實時預測體系,將網絡搜索指標與政府統計指標相結合,從生產和消費兩個不同的角度預測廣西經濟增長。首先,選取工業總產值和居民消費價格指數作為預測的基準指標,若干個百度搜索關鍵詞和與經濟波動相關的政府統計指標作為分析的備選指標,基于廣西2012 年1 月—2017 年12 月間的相關數據運用時差相關分析法從備選指標中篩選出擬作為解釋變量的先行指標;其次,在對各指標時間序列進行平穩性檢驗、協整檢驗的基礎上,根據網絡搜索數據的計量特性和指標間的內在關聯性,采用ARMA 和ARDL 兩個系列的5 個不同模型分別構建廣西工業總產值預測模型和廣西居民消費價格指數預測模型,其中,ARMA 系列和ARDL+X 為不包含網絡搜索數據的模型,ARDL+Z 和ARDL+X+Z 為包含網絡搜索數據的模型;最后,對所構建的模型進行實證擬合檢驗和對比分析得出最優預測模型,并利用最優模型評估預測效果。研究結果表明:(1)網絡搜索行為與區域經濟波動存在一定相關性,反映時滯的差異使得網絡搜索指標與經濟指標之間存在先行-滯后關系,采用科學的方法可以從眾多網絡搜索指標中識別出能優化區域經濟預測模型的關鍵性先行指標。(2)本文構建的廣西工業總產值和居民消費價格指數的ARDL+X+Z 模型,充分考慮了網絡搜索數據和政府統計指標之間的內在關聯性、網絡搜索數據的計量特性,有效地進行了區域經濟指標的預測,表明搜索數據與區域經濟指標存在穩定的關系,合適關鍵詞的百度搜索指數是區域經濟預測的有效度量指標。(3)引入網絡搜索數據的模型比僅使用政府統計指標的傳統模型能夠更及時更精確地進行區域經濟預測預警分析。

借鑒國內外學者的研究,我們為網絡搜索指標在區域經濟預測預警領域的研究和應用在以下方面做了有益探索:(1)綜合使用了時差相關分析、單位根檢驗和格蘭杰因果檢驗相結合的方法從眾多網絡搜索指標中識別出能優化區域經濟預測模型的關鍵性先行指標;(2)考慮指標間的內在關聯和不同特性,將網絡搜索指標與政府統計指標相結合構建多個不同的預測模型。由于使用網絡搜索指標進行區域經濟預測具有數據獲取及時方便、預測精度高、樣本統計意義明顯等優勢,本文的研究思路和方法可拓展到其他官方統計的月度公布數據的預測,也可為其他省份乃至全國的經濟預測提供參考。但本文也存在一些局限性:(1)僅從百度搜索指數來考慮網絡搜索行為與經濟的關聯,忽略了搜狗、360 等其他搜索引擎和微博、論壇等社交媒體的指標的影響;(2)在百度推薦功能和參考相關文獻的基礎上選擇初始關鍵詞樣本庫,未運用該研究領域的前沿方法。后續研究其他指標的預測時,我們將探討LASSO、隨機森林、支持向量基等機器學習方法來篩選初始關鍵詞,并將網絡搜索數據和互聯網其他指標結合(如論壇評論、網絡瀏覽等),進行數據的深入挖掘和整合,更準確地把握網絡大數據與經濟預測的關聯。

猜你喜歡
百度模型
一半模型
重要模型『一線三等角』
Robust adaptive UKF based on SVR for inertial based integrated navigation
重尾非線性自回歸模型自加權M-估計的漸近分布
百度年度熱搜榜
青年與社會(2018年2期)2018-01-25 15:37:06
3D打印中的模型分割與打包
做一個“百度”不知道的老師
學周刊(2016年26期)2016-09-08 09:02:52
百度遭投行下調評級
IT時代周刊(2015年8期)2015-11-11 05:50:22
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
百度醫生
主站蜘蛛池模板: 丁香六月综合网| 国产精品高清国产三级囯产AV| 另类欧美日韩| 午夜日b视频| 亚洲福利视频网址| 77777亚洲午夜久久多人| 怡红院美国分院一区二区| 国产精品自在在线午夜区app| 最新亚洲av女人的天堂| 国产av一码二码三码无码| 国产福利大秀91| 国产又爽又黄无遮挡免费观看| 日韩a在线观看免费观看| 国内精品手机在线观看视频| 尤物特级无码毛片免费| 亚洲天堂视频在线观看免费| 香蕉国产精品视频| 激情影院内射美女| 亚洲大尺码专区影院| 亚洲成a人片| 精品久久久久久久久久久| 四虎免费视频网站| 亚洲国产精品一区二区第一页免| 极品国产一区二区三区| 性色一区| 熟女日韩精品2区| 一区二区偷拍美女撒尿视频| 狼友视频国产精品首页| 日韩毛片基地| 一本一道波多野结衣av黑人在线| 中文字幕天无码久久精品视频免费 | 国产成年无码AⅤ片在线| 亚洲一级毛片免费观看| 久久国产精品国产自线拍| 麻豆精品在线| 欧美成人精品一级在线观看| 久久精品视频亚洲| 国产欧美亚洲精品第3页在线| 国产在线无码一区二区三区| 一区二区三区四区在线| 91网址在线播放| 亚洲第一香蕉视频| 久久久噜噜噜| 真实国产精品vr专区| 国产亚洲欧美日韩在线一区二区三区 | 999精品视频在线| 最新加勒比隔壁人妻| 国产一二视频| 亚洲成人网在线播放| 香蕉视频在线观看www| 亚洲视频无码| 狠狠v日韩v欧美v| 亚洲视频二| 亚洲高清免费在线观看| 国产综合另类小说色区色噜噜| 人妻出轨无码中文一区二区| 国产91精品最新在线播放| 国产精品九九视频| 国产精品永久免费嫩草研究院| 欧美精品在线看| 性激烈欧美三级在线播放| 国产丰满大乳无码免费播放| 欧美区一区| 亚洲天堂网站在线| 青青青伊人色综合久久| 久久精品国产亚洲AV忘忧草18| 国产精女同一区二区三区久| 99青青青精品视频在线| 国产成年女人特黄特色大片免费| 久久99国产乱子伦精品免| 亚洲精品在线观看91| 9丨情侣偷在线精品国产| 国产精品理论片| 日本黄色不卡视频| 色婷婷综合在线| 色综合成人| 久草网视频在线| 日韩欧美综合在线制服| 亚洲av中文无码乱人伦在线r| 国产欧美精品一区aⅴ影院| 日本久久免费| 国产中文一区二区苍井空|