葛曉玲 陳婭梅 汪偉杰 藺彤 錢祎瑋
【摘?要】近年來,二手車市場規范化的進程加快,交易也越來越興旺,但價格商品交易中的公平性卻難以體現,為此,我們進行了二手車估價模型的建立。
我們依據網上所獲得的二手車各個方面的信息,對二手車的價格做出模型估計,由于變量眾多,我們依據散點圖篩選出了主要因素,針對數據利用了多元回歸的方法,擬合出了價格預測模型。
【關鍵詞】多元回歸;多元目標規劃;MATLAB
1.1問題的描述及分析
此問題要求我們利用網上獲得的信息,考慮地區,品牌,新車價格,汽車維修價值,車況等,對二手車的價格進行件建模預測。根據從網上得到的數據信息,顧及到用戶滿意度和大眾購買傾向性,我們選定數據中的車輛狀況為正常,無出現重大事故。針對汽車維修價值這一因素,根據解釋,指的是汽車是否還有必要進行維修,進行公示定義,我們假設所有的車都處于同一種故障狀態,即泡水狀態,根據網上信息,我們得到泡水維修的平均價格為20000,我們認為為汽車維修價值。
針對品牌因素,我們考慮的品牌所屬車系對于保值率的影響,經過網上所了解到的信息得出各種車系的保值率排名為日系車,德系車,美系車,韓系車。而對于車輛產地我們考慮地區的經濟發展因素,根據網上整理的人均GDP,將地區進行分檔處理。
由于是要對二手價格進行預測,可采用多元回歸模型,對價格進行預測。由于變量眾多,我們首先需要對因素進行篩選,簡化模型。
1.2模型的建立
多元線性回歸模型[1]是對數據進行進行擬合的常用模型,用來解決一個因變量受多種變量影響的情況,從而對因變量的發展起到解釋和預測的作用。例如,一個地區的經濟發展,大學生的就業薪酬等。我們運用最小二乘法對模型進行參數估計,得到擬合值。為了模型的準確性,常進行殘差的分析檢驗,適當剔除異常數據,從而得到更為優化的改進模型。
模型的求解步驟分為三步:
第一步:對模型中的參數進行最小二乘法估計,即應選取估計值,使得當時,誤差平方和達到最小。令。
第二步:整理求導之后的方程,化為矩陣形式,可得出解為,帶回原模型得到的估計值,將變量的觀測值帶入,即可得到數據的擬合值。則為殘差。
觀察殘差圖,結合置信區間,得出最終結果。
1.3模型的求解
由于二手車價格的眾多,無法更好評估整個的價格走向,我們轉換為舊車與新車的百分比作為因變量進行建模。首先我們進行因素的篩選,為了更加直觀看出差將各個自變量與因變量進行散點圖的描述。
首先進行地區和百分比的散點圖的描述,如圖
由圖可知,圖上的點基本處于均勻分散狀態,經濟程度對折舊百分比沒有太大影響。
對于品牌保值率對折舊率的影響,我們做出如下散點圖
由圖可知,品牌產地對于折舊率的影響不是太大,但是根據保值率,應當是有一些聯系,經查閱,由于每種車具體情況不同,車輛又分為低中高三個檔次,也便弱化了保值率的整體影響。
而對于維修價值和里程,在整個數據整理過程中便可發現其中有聯系。我們假設x1為里程變量,x2為維修價值。設式子,其中y表示折舊百分比。
利用MATLAB線性回歸程序,我們得出系數為:
相應的置信區間如圖所示:
置信區間不包括零點,擬合良好。
R2檢驗趨向于1,由此可得到折舊率方程為
由此可得二手車價格的方程為Z=新車價格×折舊率
1.4模型的誤差分析
在本模型中,由于條件限制,將各個車輛的保值率算出較為艱難,未能將各類檔次的汽車進行細化分類,導致保值率在對二手車影響的中被淡化。
并且將新車價格作為一個單獨變量列出,事實上,人們在考慮二手車購買價格時存在心理因素的影響,車輛的原有價格會對二手價格造成一定的判斷影響作用。
3.4模型誤差分析
由于每輛車的品牌不同,車輛配置也不相同,因此新車價格會相差很大,所以我們采用了分檔的方法將車輛分成了三個檔次來進行計算,由此也忽略了車輛檔次中的數量概率問題,對結果會造成一定的誤差。
并且,在對事故率進行指數曲線擬合時,我們采用的數據是車輛在一段路程上設置的故障修理點個數,然后將他轉化為了里程上的概率值,這在實際操作中由于不可控的因素等問題,概率轉化上會造成誤差。
參考文獻:
[1]司守奎.孫兆亮.數學建模算法與應用.國防工業出版社.2015.4.P1-6
[2]百度知道.https://baijiahao.baidu.com
[3]司守奎.孫兆亮.數學建模算法與應用.國防工業出版社.2015.4.P436
[4]駱穎哲.汽車故障事故風險評價方法研究.東北林業大學學位論文
(作者單位:1南京理工大學;2南京審計大學;3南京審計大學;4南京審計大學;5南京審計大學)