李小宇
(對外經濟貿易大學 統計學院,北京 100085)
投入產出比(ROI)對店鋪廣告投放來說非常重要,其可以反饋一個單品在市場的未來表現情況。文章運用線性回歸分析的方法對某店鋪的“推廣產出”建立預測模型,然后運用建立的模型對未來一段時間的某店鋪的ROI指數進行預測,從而對一家電商公司未來一年的經營情況進行預判。
文章基于某店鋪2020年6—12月的投入產出數據,結合所學知識,先介紹了研究該問題的背景、目的及意義,然后介紹了建立該模型時需要用到的概念以及方法,對該序列建立合適的模型,在檢驗該模型的有效性之后運用該模型對未來一段時間的某店鋪投入產出比(ROI)進行短期預測,檢驗該模型是否合理有效。
投入產出比(ROI)是一個判斷店鋪廣告投放的重要指標。通過對行業數據的對比,結合店鋪毛利、在店鋪廣告費用一定的情況下,投入產出比(ROI)大于12時,店鋪廣告投放處于良性狀態,投放的越多,店鋪收益越多。當店鋪投入產出比低于12時,店鋪廣告投放處于非良性狀態,如果擴大投放力度,店鋪將處于虧損狀態。
一元線性回歸分析,是根據自變量和因變量的相關關系,建立與的線性回歸方程進行預測的方法。由于市場現象一般是受多種因素的影響,而并不是僅僅受一個因素的影響,所以應用一元線性回歸分析預測法,必須對影響市場現象的多種因素做全面分析。只有當諸多的影響因素中,確實存在一個對因變量影響作用明顯高于其他因素的變量,才能將其作為自變量,應用一元線性回歸分析市場預測法進行預測。
一元線性回歸分析法的預測模型為:
=+
式中,代表期自變量的值;代表期因變量的值;、代表一元線性回歸方程的參數。
、參數由下列公式求得(用代表):


與表示的含義:每平均增加一個單位,平均增加個單位。
兩個或兩個以上自變量的回歸稱為多元線性回歸。由于各個自變量的單位可能不一樣,比如說一個消費水平的關系式中,工資水平、受教育程度、職業、地區、家庭負擔等因素都會影響到消費水平,因此自變量前系數的大小并不能說明該因素的重要程度。將所有變量包括因變量都先轉化為標準分,再進行線性回歸,此時得到的回歸系數就能反映對應自變量的重要程度。這時的回歸方程稱為標準回歸方程,回歸系數稱為標準回歸系數,表示如下:
=·1+·2+…+·
以下定量分析是以某店鋪2020年6—12月的投入產出數據為分析對象,運用線性回歸分析的方法對某店鋪的投入產出比(ROI)指數進行分析,并且建立預測模型進行短期預測。

表1 某店鋪2020年6—12月數據
假設,不存在異常數據(忽略淡季、旺季)情況下,根據上述數據,分析“推廣費”數據后可以知道:
中位數:30000
眾數:10000,30000
平均數:26428.57
分析“推廣產出”數據后可以知道:
中位數:360000
眾數:360000
平均數:333571.43
毛利率和店鋪費率:穩定在18%,9%
推廣毛利額=店鋪費用+剩余毛利
人工費用不計的情況下,店鋪狀態:
剩余毛利無限趨近且大于推廣費時,店鋪是不虧損的。
剩余毛利小于推廣費,店鋪是虧損的。
根據投入產出比>12仍可推廣的關系,得出9月、11月為可追加推廣月份。
根據上述數據分析,發現在毛利率和店鋪費率不變的情況下:
投入產出比與推廣產出、推廣費有關系:
投入產出比ROI()=推廣產出推廣費
推廣產出=×推廣費+浮動系數
可以看出,推廣產出只與推廣費有關系,因此,選擇一元線性回歸分析模型。
推廣產出=×推廣費+浮動系數
=+
使用一元線性回歸要解決的問題——參數估計:投入產出比ROI()、浮動系數的估計;平方差的估計。
(1)投入產出比ROI()、浮動系數的估計(采用最小二乘法):

求估計,,使(,)最小。
,的最小二乘估計:


得到系數=155491,=-7736991855。
(2)方差的估計:

對于上述,所得回歸方程及方差估計分別是:
回歸方程:= 155491-7736991855
方差估計:=1994046243
參數檢驗及模型應用:線性假設的顯著性檢驗。根據上方數據分析得出推廣產出散點圖:

圖1 推廣產出
由圖1可知,線性假設是顯著的。
在此例中:
①散點圖上幾個點,幾乎處在一條直線上,呈明顯的線性關系;②在參數估計中,得出的一元線性回歸方程(= 155491-7736991855)也表明:店鋪數據呈線性相關關系;方程意義為:如果推廣費平均每增加1元,推廣產出平均增加15.5491元。
根據上面得到的模型對某店鋪 2021年1—5月的投入、產出、ROI進行短期預測,如表2所示。

表2
從表2可以看出:①在“投入產出系數”不變的情況下,“實際預測投入產出比”都在一定程度上無限接近12,整體預測是可信的,且對于店鋪生產有指導意義。②從該模型的預測結果來看,1、2、4、5月的實際預測投入產出比均大于12,所以這幾個月份是可以酌情繼續追加推廣費的;而3月11.68∝12,說明3月投放已經達到極限,不可追加推廣,追加則虧損。
①在數據預測中,ROI在一定限度上無限接近12,整體預測是可信的;②商家可以根據ROI預測值酌情增加、減少推廣費(ROI>12,增加推廣費;ROI<12,減少推廣費,使ROI無限趨近12后停止減少);③從該模型的預測結果來看,模型的擬合效果較好,具有指導價值;④ROI指數在電商店鋪中的應用是顯著的,可以看出一段時間內的數據波動對未來時間的預測起到顯著作用。所以線性回歸分析在數據預測上具有應用價值,且易用性更高。
文章運用回歸分析的方法對某店鋪建立了一元線性回歸模型,模型的預測效果相對較好,但是這個模型本身還有不足之處:①數據選擇缺乏針對性:對于銷售旺季、淡季等數據提煉,還需人為調整;忽略了大部分影響因素才促成了一元線性回歸模型。②短期內數據預測模型較好,長期預測模型誤差較大:數據序列的不斷拉長,人工、毛利、店鋪費用在實際應用中的作用開始顯現,導致誤差增大。③適用于短期內體量較大數據的分析,對于決策者和實施者都具有很好的指導意義,可以根據不同月份、不同情況調整投入金額,適當擴大市場。④由于世界環境變化,經濟體系和市場分布變化,會導致供求關系轉變,所以及時調整迅速梳理才是關鍵。