李樂吟+戴靖宇+王姮冰
摘要:合理的任務定價是任務完成的關鍵,為了設計新的任務定價方案,文章建立以新的項目任務定價之和最小、任務的完成率最高為目標,多元線性回歸方程各個參數的取值范圍為約束條件的多目標規劃模型。通過遍歷定價規律中各參數的值,求解不同參數下的定價金額,并利用支持向量機求解不同定價方案下的任務完成率,得到最優定價方案的任務完成率為80%。
關鍵詞:多元線性回歸;多目標規劃;支持向量機
一、研究背景
“拍照賺錢”在當下互聯網時代越來越流行。這種基于移動互聯網的自助式平臺,為企業進行各種商業檢查和信息搜集提供了便利。為了對任務進行合理的定價,使得任務完成率提高,本文首先確定任務定價的多元線性回歸方程,建立多目標規劃模型,然后運用遍歷算法和支持向量機求解多元回歸方程各參數值和任務完成率。
二、模型的建立與求解
(一)多元線性回歸方程的確定
通過數據分析,觀測出任務定價分布有兩個地理聚集中心,并利用MATLAB得到兩個聚集中心的具體位置為:A(22.1°N,115.8°E)、B(23.4°N,112.5°E)。同時對會員信息數據分析,得到任務點周圍的會員數量(會員密集度)、會員信譽值、任務密集度、會員預定時間對任務定價均有影響。定義會員密集度為以任務點為中心、以3km為半徑的圓周內的會員數量。會員信譽值為以任務點為中心、以3km為半徑的圓周內的會員信譽度的均值。會員預定時間以任務點為中心、以3km為半徑的圓周內的會員預定時間的均值。
綜上得到,影響任務定價到的主要因素有:離中心點A的距離x1、離中心點B的距離x2、會員密集度x3、會員信譽值x4、任務密集度x5和會員預定時間x6。為分析這6個因素與定價之間的規律,建立以定價為因變量,以這6個因素為自變量的多元線性回歸模型。通過給定的定價以及各個參數的值求得多元線性回歸方程。
y=a x +a x +a x +a x +a x +a +εε~N(0,σ )
式中,a1,a2…,a7,σ2都是與x1,x2…,x6無關的未知參數,其中a1,a2…,a7稱為回歸系數。
(二)多目標規劃模型的建立
企業只有對未完成的任務點提升任務標價才能使得任務完成率增加,考慮到企業資金的限制,盡可能使新的方案中對所有任務定價金額總和最少。定義任務點任務完成的數量占所有任務點的數量比例為p。于是建立以新的任務定價總和最小、任務的完成率最高為目標函數,以回歸方程各個參數的取值范圍作為約束條件建立多目標規劃模型。
選取執行完成的任務點的相關因素的值與其對應的任務標價做多元線性回歸,得到a1、a2、a3、a4、a5、a6、a7的合理取值范圍,若某個參數超過該范圍,則必然會導致執行任務完成的點將不能完成任務,建立多目標規劃模型如下:
min yi
s.t.0.058≤a ≤0.1320.064≤a ≤0.138-0.111≤a ≤-0.078-0.0006≤a ≤-0.003-0.245≤a ≤-0.164-0.400≤a ≤-0.16022.404≤a ≤50.383
每個任務點對應的有一個新的定價,通過修改任務定價方案,使得任務完成率最大。在各因素參數取值范圍內通過遍歷算法求取使得滿足新的任務定價總和最小以及任務完成率最大的新的任務定價方案。
(三)任務完成率的確定
為了分析不同的定價方案對任務完成率的影響,運用支持向量機來求解不同定價方案下的任務完成率。其主要思想是找到一個超平面,使得它能夠盡可能多地將兩類數據點正確分開,同時使分開的兩類數據點的距離分類面最遠。根據分類函數,帶入相關因素的參數值對未知屬性的樣本進行分類,從而求得任務完成率。
求取835組已完成項目各個因素的取值,其中x1為任務點距離A中心點的距離,x2為任務點距離B中心點的距離,x3為會員密度,x4為會員信譽值,x5為任務密度,x6為會員預定時間。如果完成了執行任務,則類型為1,如果未完成執行任務,則類型為0。如表1所示。
用i=1,…,835分別表示835個任務點,第i個任務點的第j個指標的取值為aij。yi=1表示第1類,yi=-1表示第0類。計算835個樣本點的均值向量:
μ=[μ1,…,μ6]=[119.45,253.43,
13.38,259.74,7.40,7.28]
835個樣本點的標準差向量為:
σ=[σ1,…,σ6]=[41.98,42.41,12.16,
814.22,5.00,1.48]
對所有樣本點數據進行標準化處理:
對應稱 j= ,j=1,2,…,6為標準化指標變量, =[ 1,…, 6]T。記標準化后的835個已分類樣本點數據行向量為bi=[ i1,…, i6],i=1,…,835。求得支持向量共為658個,記支持向量為bi,得分類函數為:
c( )= βiK(bi, )+b
式中βi=αiyi, =[ 1,…, 6],K(bi· )當已知各因素參數值時,可以利用分類函數求解該任務點在執行時是否可以完成,即當c( )≥0, 屬于第1類,當c( )<0, 屬于0類。從而根據屬于1類的任務數目占總任務的比例確定任務完成率。
(四)模型的求解
在給定各因素參數取值范圍的情況下,對各因素的參數值進行遍歷,分別求得其對應的定價金額和利用支持向量機求得任務完成率。通過對數據的分析,發現任務完成率與加價金額(新的任務定價與原定價之差)呈一定的曲線關系,故分析不同加價金額與該金額下的任務完成率的關系,如圖1所示。

分析圖1發現,隨著加價金額的增加,任務完成率逐漸增加,但增長速率越來越小。在企業不給于任何加價時,任務的完成度只能達到63%,即只有522個任務點可以完成任務。在加價總金額在0~132元之間時,任務完成率的增長較快,并能在加價132元時達到80%的任務完成率,即共有668個任務點可以完成任務。在加價132~955元時,任務完成率增長減慢,即任務完成率只增加了2%。在加價16204元時,任務完成率達到了94%,共有780個任務點完成任務。但是企業所需要給予的加價金額達到16204元。
綜合考慮到為使項目標價金額總和越小越好,任務完成率越高越好,選取在加價132元時作為新的任務定價方案。求得新的任務定價規律為:
y=0.09486x1+0.1012x2-0.0944x3-0.00046x4-0.2045x5-0.28x6+36.393
三、結語
通過對求得的數據分析可知,新的項目定價越高,任務完成率越高,但企業需要支付的金額越多,不利于企業的發展。在增加項目定價總和132元時達到80%的任務完成率,即共有668個任務點可以完成任務,任務完成率較高。文中運用支持向量機快速高效求解不同任務定價方案下的任務完成率,更方便、準確率高。最后求得新的定價規律得到的定價值與原任務點完成的標價值誤差,發現誤差較小,從而驗證了模型的正確性。
參考文獻:
[1]卓金武,李必文,魏永生,秦健.MATLAB在數學建模中的應用[M].北京航空航天大學出版社,2010.
[2]張志涌,楊祖櫻.MATLAB教程[M].北京航空航天大學出版社,2015.
[3]司守奎,孫璽.數學建模算法與分析[M].國防工業出版社,2011.
[4]姜雪.應用支持向量機評價土壤環境質量[J].中國環境科學,2014(05).
*本文系2017高教社杯全國大學生數學建模競賽決賽B題解題方案(具體題目詳見公開資料)。
(作者單位:南京郵電大學)endprint