陳科秀,劉 娟
(廣東財經大學統計與數學學院,廣東 廣州 510320)
為了保護我們共同生存的家園和人類生存的長遠發展,新能源和可再生能源的利用和開發成為當下世界的各國能源發展的必然趨勢。近年來從環保、技術和能源安全等角度出發,全球汽車技術呈現出“低碳化、信息化、智能化”的發展趨勢,全球范圍內掀起了新能源汽車研發制造的浪潮。新能源汽車的發展能夠有效緩解能源和環境壓力,推動汽車產業轉型升級,從而成為新的經濟增長點。美國、日本等發達國家均將新能源汽車作為經濟發展的戰略制高點,并通過稅收減免、財政補貼、政府采購等多種方式積極推動其發展[1]。
我國的《“十四五”工業綠色發展規劃》指出,到2025 年,國內綠色環保產業產值計劃達到11 萬億元,新能源、新材料、新能源汽車等產業將獲重點扶持。最新數據顯示我國新能源汽車成交量連續5 年位居全球第一,累計推廣量超過了480 萬輛,約占汽車總保有量的1.7%,這一汽車銷售數量占全世界的新能源汽車銷售數量的一半以上。不論是國家還是各級地方政府,都出臺政策積極支撐我國新能源汽車行業的發展。目前,我國新能源汽車市場正處于成長期的早期階段,根據中國汽車工業協會的數據調查,在過去的五年中,我國新能源汽車保有量年均增加180 萬輛,市場新能源汽車銷量在2020 年達到了136.7 萬輛,表現出加快增長的趨勢。歐拉黑貓作為一款新能源汽車,是長城汽車旗下作為一款專為年輕車主打造的品牌系列,整輛車采用極簡可愛的設計元素,傳達出干凈利落的歐拉設計準則,致力于打造新能源汽車界的文藝小清新,受到廣泛年輕消費者的青睞。2020 年12 月,歐拉黑貓新能源汽車銷量達到10 010 輛,同比增長了334.7%,單月銷量突破1 萬輛,成為歐拉品牌銷量貢獻最大的單一產品。突出的銷售業績也使得歐拉黑貓再次奪得7~8 萬元純電力細分市場銷售冠軍,位居新能源行業第一陣營,彰顯了“新力領軍品牌”的先鋒實力。研究產品的銷售數據,能為管理和經營決策提供重要支撐,針對歐拉黑貓新能源汽車銷量進行預測,能夠反映該品牌發展的趨勢,幫助汽車廠商和經銷商快速、高效進行決策,有利于企業把握行業發展態勢,從而制定合理的生產計劃緩解潛在的未知風險[2]。
時間序列是研究隨時間變化的一列數據,在經典的時間序列模型中,數據通常是相關的,時間序列分析的目的之一就是利用這種序列相關性去幫助我們建立更好的模型。為了將非平穩時間序列轉化為平穩時間序列,通過模型設定,模型識別和模型的檢查及診斷來完成數據建模。常見的時間序列概率模型有以下這四種:自回歸(AR)模型、移動平均(MA)模型、自回歸移動平均(ARMA)模型以及差分自回歸移動平均(ARIMA)。
1.2.1 考查觀測值序列的特征
對于搜集到的時間序列數據,第一步驟是要驗證序列的平穩性。如果序列為平穩性序列,通過了白噪聲檢驗,那么需要進一步考察序列是否為純隨機序列。否則,需要對序列進行k 階差分序列運算后再進行平穩性檢驗。
1.2.2 針對模型擬合識別
根據之前提到的4 種模型來確定擬合ARMA模型的具體階數,在判斷擬合模型具體形式的同時,需要模型數據序列的自相關系數和偏相關系數的取值特點來相應選擇。
1.2.3 對建立模型進行白噪聲檢驗
對于擬合模型所得到的殘差序列,需要對其進行白噪聲檢驗,以確定函數關系的正確性。如果結果顯示殘差序列為白噪聲,則認為擬合后得到模型結果是合適的;如果不是,則可能是因為序列數據的信息量提取不足,導致序列無法呈現為正態分布,需要重新進行測試。
1.2.4 檢驗誤差及模型預測
根據序列的觀測數據確定模型,通過平均絕對百分誤差來檢驗擬合模型的精確值,以及通過擬合模型對序列將來的發展進行預測[3]。
本文基于在車主之家、搜狐汽車及汽車排名網等網站中,通過Python 軟件爬取歐拉黑貓新能源汽車月度銷量數據,共搜集了2019 年1 月至2021 年2 月連續26 個月的銷量數據,并通過Excel 對數據進行預處理。將2019—2020 年共24 個月的數據作為樣本建立ARIMA 模型,對2021 年1~2 月份的銷量數據進行模型預測驗證。
圖1 為2019—2020 年歐拉黑貓新能源汽車月度銷量數據折線圖,表1 為選用數據對數序列的基本描述性統計。由圖1 可知,歐拉黑貓新能源汽車月度銷量時間序列曲線直觀上有持續上升的趨勢,存在時間趨勢性,簡單判斷樣本序列是非平穩的;將樣本序列記為{xi},為避免潛在的異方差影響,對原始數據做對數變換,得到對數序列{yi}。從表1 數據可以看到,對數序列{yi}的均值和中位數大致相當,說明數據分布基本呈對稱分布,沒有左偏或者右偏的現象;極差為3.908,最大值和最小值相差比較大,對數序列標準差為0.837,總體波動比較穩定。為了更具有說服力,對序列{yi}進行單位根檢驗,由結果得到未經處理的序列沒有通過ADF 單位根檢驗,因此驗證了該序列的不平穩性。

圖1 歐拉黑貓2019—2020 年月度銷量折線圖

表1 變量統計分析
為了通過計算時間序列的一階差分序列和二階差分序列分別來進行ADF 平穩性檢驗,再觀察差分序列圖,如果二階差分序列圖圍繞0 值上下波動,ADF 檢驗后通過。記二階差分序列為{zi},來找到時間序列的對數序列的平穩階數。
下面利用EViews 軟件繪制二階差分序列{zi}的ACF 和PACF 函數圖,模型的滯后階數為12 階,P檢驗值都在0.5 以內,那么大概率就認為序列為非噪聲序列。
當模型的自相關系數在1 階時落在虛線以外,而其他階數的自相關系數落在虛線以內,通過上面圖2 中的二階差分序列{zi}的自相關函數圖。而自相關系數在1 階后劇烈減少,因此判斷自相關系數在1 階截尾。

圖2 自相關和偏相關函數圖
類似的通過上面圖2 中的數據展示模型的二階差分序列{zi}的偏自相關函數圖,偏自相關系數在1階和5 階時落在虛線以外,而自相關系數在7 階后突然衰減為小值,因此我們可以判斷出這一模型的截尾的偏相關系數是7 階。綜上,確定擬合模型為ARIMA(7,2,1)。
最后,綜合上述的建模分析流程來進行最小二乘法的擬合,各參數P 值小于0.05,得到以下模型擬合程度為0.624,表明模型能較好地擬合數據。

當P 檢驗值不小于0.05,繪制擬合模型殘差自相關檢驗和偏相關檢驗圖,序列數據都在兩倍方差以內即虛線以內,那么在顯著水平0.05 以下可以接受原假設,認為該殘差序列為白噪聲序列。
使用得到的逐步回歸模型,對序列值進行擬合。基于平均絕對百分誤差來衡量預測性能。
通過得到的逐步回歸模型預測2021 年1 月份和2 月份的歐拉黑貓新能源汽車銷量,計算與實際銷量的平均絕對百分誤差,取對數結果進行比較,結果如表2。

表2 ARIMA 模型預測及誤差
本文通過搜集2019 年1 月份至2021 年2 月份共26 個月的歐拉黑貓新能源汽車銷量數據來建立ARIMA 模型。通過平穩性檢驗、自相關和偏自相關等檢驗確定模型為ARIMA(7,2,1)。通過模型預測2021 年1~2 月份的銷量數據,與實際值進行比較,計算平均絕對百分誤差為2.23%。因此,證明了本文建立的銷量預測模型是有效果的,在短期內預測歐拉黑貓新能源汽車月度銷量,能為相關部門的決策提供數據理論支持[4]。
隨著綠色發展理念的不斷深入,新能源汽車已經成為汽車行業發展的重要方向,新能源汽車也被越來越被更多的人關注,歐拉黑貓新能源汽車作為一款專為年輕人打造的品牌系列,在市場上有著亮眼的銷售成績。本文通過搜集最新的歐拉黑貓新能源汽車銷量數據來建立ARIMA 模型,利用EViews軟件建立模型預測未來的銷售。在面對競爭激烈的市場,汽車生產商和管理者需要通過借助大數據的優勢,通過定量的分析相應數據,可為自己經營決策提供更多的數據理論支持[5]。
新能源汽車是我國戰略性新興產業,當前政府對新能源產業支持政策的逐漸完善,投入更多經費用于基礎充電配套裝置的建設,利用公眾號、短視頻、直播平臺等各類的新媒體,加大對新能源汽車的營銷宣傳,將會有更多的消費者更加愿意購買新能源品牌的汽車。最后我們要打造自己的新能源車品牌,掌握自己的核心技術,提高國有品牌的市場占有率,在“碳達峰、碳中和”的背景下,消費者將會越來越認同新能源汽車,在我們生活中也會日益普及,未來我國新能源汽車市場的發展潛力巨大。