鄭忠魁 郭萃宸 朱濤

摘 要:隨著生活水平的提高,人們對休閑娛樂的要求越來越高,大型游樂場成為了人們休閑娛樂的一個重要場所。為使游客達到最大滿意度、提高運營經濟效益,對典型的大型游樂場游樂設施和游樂線路的布局、規劃、管理及相互協調進行了分析和擇優。
關鍵詞:MATLAB仿真分析;大型游樂場的經營和優化;AR自回歸模型
一、AR譜估計的方法進行數學建模
譜估計的參數建模包括選擇一個合適的模型、估計模型的參數以及將這些估計值代入理論PSD公式三部分。這里分析的模型是時間序列模型。
自回歸模型(Autoregressive Model)是用自身做回歸變量的過程,即利用前期若干時刻的隨機變量的線性組合來描述以后某時刻隨機變量的線性回歸模型,它是時間序列中的一種常見形式。在該模型中,噪聲干擾驅動信號可以忽略不計,直接按照時間序列歷程信號進行AR自回歸模型建模,計算各階次擬合系數進行評估分析,進而預測。
時間序列模型:所謂的時間序列就是將所要研究的對象按照觀測時間的先后順序所形成的一種有序數列。時間序列分析是數學概率統計學科中應用較廣泛的一個分支,在金融經濟、地理氣象、通訊分析、醫學診斷、機械振動等眾多領域有著非常廣泛的應用。時間序列預測模型主要的特點就是認為觀測值之間的依賴關系和相關性是存在的,觀測數據之間內部和外部形成一定的規律和特征,它是一種能夠應用于動態預測中的動態預測模型。
時間序列預測模型就是通過對觀測數據的分類和分析,根據時間序列所反映出來的數據內部和外部之間的規律和相關性,進而通過數據關系描述出研究現象的發展過程和未來變化趨勢,然后再進行類推或延伸,以此來預測以后若干時間段內可能的數據變化。其內容包括:采集與分類所研究社會現象的歷史、數據;然后對這些歷史數據進行分析并做檢查鑒別,按規律排序成特定數列然后對數列進行分析,從中尋找出數列的規律和數據相關性,進而得出合適的預測模型參數和階數,并用此模型去預測未來趨勢。
二、數據預處理
2.1離群值的檢測和去離群值
數據中的離群值可能使數據處理結果和其他計算量嚴重失真。例如,如果我們嘗試用移動平均值方法對包含離群值的數據進行平滑處理,則可能得到誤導性的波峰或波谷。
那么如何檢測某個特征數據是否存在極端值呢?
1)對樣本數據進行可視化
2.2歸一化
歸一化概念:
1)把數據變成(0,1)或者(1,1)之間的小數。主要是為了數據處理方便提出來的,把數據映射到0~1范圍之內處理,更加便捷快速
2)把有量綱表達式變成無量綱表達式,便于不同單位或量級的指標能夠進行比較和加權。歸一化是一種簡化計算的方式,即將有量綱的表達式,經過變換,化為無量綱的表達式,成為純量
一般,我們常用的歸一化方法有兩種:min-max歸一化和z-score歸一化。
min-max歸一化:將數值范圍縮放到(0,1),但沒有改變數據分布;z-score歸一化:將數值范圍縮放到0附近, 但沒有改變數據分布;
在本題中,我們通過對數據規模的分析和處理,最終我們在MATLAB中使用normalize函數來對數據進行歸一化。
三、模型求解
對于AR譜估計通常有三種方案:Yule-Walker法,Wiener濾波法,最大熵(MEM)方法。
(1)Yule-Walker法:(尤爾-沃克方程為AR模型的系數和AR過程的歸一化相關系數建立起了唯一的對應關系。)
對于滿足漸近平穩的AR過程:
在式子兩邊同乘以且求期望:
故有,其中
最大熵法是對信號的功率譜密度估計的一種方法。其原理是取一組時間序列,使其自相關函數與一組已知數據的自相關函數相同,同時使已知自相關函數以外的部分的隨機性最強,以所取時間序列的譜作為已知數據的譜估值。它等效于根據使隨機過程的熵為最大的原則,利用N個已知的自相關函數值來外推其他未知的自相關函數值所得到的功率譜。最大熵法功率譜估值是一種可獲得高分辨率的非線性估計方法, 特別適用于數據長度較短的情況。
四、結果分析(或模型檢驗)
問題(1):請預測該游樂場2019年7月和8月每一天的游客的人數,預測2019年下半年游客人數最多出現在那一天。
利用AR模型進行同比預測,利用2019年度的前半年和2018年度的前半年運營數據,經過去離群值、增量歸一化等預處理后,計算出增長百分比,預測2019年后半年人數,2019年下半年游客人數最多出現在10月1日,對應的峰值點對應的日,聯系實際情況分析,由于是節假日,預測的人數最多也是合理情況。
問題(2):預測2019年8月5日A4,B5,B12,B25四個項目當天的游玩人數,以及8月5日每一個項目的平均排隊人數和平均等待時間。
預測的AR模型同(1),給出了A4,B5,B12,B25四個項目的游客人數趨勢,通過AR模型預測2019年8月5日A4,B5,B12,B25四個項目當天的游玩人數14516、14468、689、12634,同比增長0.52、0.62、1.12、0.46。平均排隊人數和平均等待時間,取能容納的人數最大值,除以總時間,就是平均等待時間。通過模型預測分析可知,而且2019年8月5號會場場爆滿,8月5日當天每一個項目的平均排隊人數和平均等待時間均比較長,與同期人流進行比對,8月5日是旺季,加上人流增長,不調整游玩策略一定會場場爆滿,不利于游人的玩耍。
問題(3):某游客計劃在2019年8月5日到該游樂場購買通票游玩,您認為按照怎樣順序游玩最合適?
用平均等待時間排序,從小到大,從需要排隊時間少的開始玩,能保證一直在玩項目而不是在排隊,排隊順序為如下圖8所示,
問題(4):對經營者來說您認為通票價格定在225元是否合理?10元的門票費用是否可以取消?
利用AR模型評估每個項目游玩所需要的平均時間,如下圖9所示。用等待時間+玩耍每個項目的時間,求出每個項目共需要多少時間,然后求平均,得到平均每個項目耗費24分鐘,按照一天營業12小時算,大約能玩24或25個項目,作為消費者,一般只玩15個項目,每個項目的平均價格是20塊,共需要300塊,加上門票,一共310塊,大于225。因此消費者買通票更劃算,可以取消門票。
五、模型的不足
本題在設計模型求解過程中,使用的是自回歸(AR)模型。AR模型適用于具有尖峰但沒有深谷的譜分析,對時間歷程曲線有一定的要求,本文著重研究AR模型的建模及求解,并做了多個假設,且忽略了不同時間歷程中存在的擾動,難免會有模型缺陷,值得后續繼續改善模型進行研究。
六、模型改進(或進一步討論)
AR模型適用于具有尖峰但沒有深谷的譜分,于此對應的經典的時間歷程預測建模與評估分析模型還用MA模型、ARMA模型,MA模型適用于具有深谷但沒有尖峰的譜,通用的ARMA模型對于兩種極端情況均適用。
參考文獻
[1]李志飛.主題公園開發[M].科學出版社,2000,08:90-100.
[2]熊瑛.大型主題公園策劃與規劃研究[D].北京工業大學,2001,07:32-50.