孫曉玲,朱家明,賀曉劍,殷德香
(1.安徽財經大學 統計與應用數學學院;2.安徽財經大學 工商管理學院,安徽 蚌埠 233030)
隨著互聯網越來越發達,經濟全球化日趨迅速,眾包作為一種新型商業模式逐漸在市場嶄露頭角[1],將這種高效方法應用于任務定價是大勢所趨,本文將在K-MEANS算法應用的基礎上對眾包任務定價方式進行計量分析.
數據來源于2017年“高教社杯”全國大學生數學建模競賽B題.為便于解決問題,對本文提出以下假設:⑴本文所使用的數據均真實有效,具有統計分析價值;⑵任務定價主要受會員與任務距離影響,忽略其他因素對定價的影響;⑶會員的配送能力能夠滿足該區域內所有的配送需求.
通過查閱資料與相關文獻,選取恰當的方法探索任務定價模型.首先,用數學軟件挖掘數據信息通過任務與會員的位置對任務與會員聚類,將任務與會員打包[2];然后,根據已完成任務的價格進行加權合計得到任務定價函數;最后對新任務與會員分類預測新任務的定價.
根據研究思路,對數據做如下處理挖掘數據信息,求解會員中心到任務中心的距離.
⑴運用K-MEANS聚類算法根據任務位置信息將已結束項目聚成m類[3],得到各類的中心的位置為(Wi,Ei),其中,i=1,2,…,m;根據會員位置信息將會員聚成n類,得到各類的中心的位置為(Wj,Ej),其中,j=1,2,…,n.
⑵計算各任務聚類中心與會員聚類中心的距離dij.結合地理知識與數學知識,根據地球表面任意兩點距離的求解方法計算各任務聚類中心到各會員聚類中心的距離,如圖1所示,計算步驟如下:

圖1 經緯度求解距離示意圖
已知,A、B 兩點的經緯度分別為 Aj、Aw、Bj、Bw,c 為弧長對應的圓心角,地球的半徑為R.
第一步,利用球面余弦公式,

其中,角C等于角A-OC-B,即面AOC與面BOC的二面角,即Bj-Aj.于是,公式等價于:

第二步,用反余弦函數求圓心角:

第三步,將角度化為弧度求距離:

⑶根據距離遠近關系將任務與會員分為N個區域,N=min(m,n).
對原始數據進行數據挖掘,運用SPSS軟件根據位置信息分別對已完成任務與會員聚類,得到聚類結果[4].根據聚類結果將任務最終聚成20類,最終聚類中心的位置和每一類包含的任務個數如表1所示.

表1 任務聚類結果
根據聚類結果將會員最終聚成4類,最終聚類中心的位置和每一類包含的會員個數如表2所示.

表2 會員聚類結果
運用MATLAB軟件計算會員聚類中心到任務聚類中心的最小距離[5],為模型的簡便不考慮只有一個任務的類5,類13,類17.于是任務分為17類會員分為20類,最終形成17個區域,即分成17個包.區域組合及區域內的任務密度、加權價格如表3所示.
運用MATLAB軟件分析加權價格與密度的關系并擬合加權價格和密度的函數關系[6],擬合結果為:

受滴滴打車的啟發,考慮打包定價的方法.利用K-MEANS聚類算法對離散的任務聚類,聚類后將任務聯合在一起打包發布.根據聚類結果對原始定價模型進行修正,建立模糊加權平均定價模型.
根據任務點分布圖(圖2)可以看出,任務點的分布具有離散性的特點.“拍照賺錢”任務在時效性方面有要求,在配送區域劃分的時候考慮將距離作為主要的劃分標準.采用K-MEANS聚類算法對任務點區域進行劃分,通過利用K-MEANS算法聚類[7],聚成6類,各個任務點聚類后的結果如圖2所示.

圖2 任務點聚類分布圖
根據聚類分析結果,得到各類別下的任務定價,如表4所示.

表3 區域組合信息表

表4 各類別任務價格分布
⑴權重的確定
權重是指某一因素在集合中的重要程度[8],即在其他因素不變的情況下,該因素的變化對定價結果的影響程度,計算公式為:

Pij表示某個定價出現的次數,例P11表示第一類別的任務有7次定價為65元.
系數kij(i=1,2,…,n)稱權,他說明這系數后面的數據,在整個統計數據中占的比重,也說明這個數據對統計結果的影響程度,其中
⑵加權平均定價[9]模型
加權平均定價模型是指將產品或服務的所有可能的定價與其各自權重乘積的和,得出綜合各種情況的定價W,其數學表達式為:

xi(i=1,2,…,n)表示拍照任務所有可能的定價65≤xi≤85;
系數kij(i=1,2,…,n)稱權,他說明這系數后面的數據,在整個統計數據中占的比重,也說明這個數據對統計結果的影響程度,其中
⑶任務定價
由(1)式可求出各種價格在不同類別任務下的權重,帶入(2)式可求出各類別任務在打包發布時的定價(見表5).

表5 各類別任務在打包發布時定價
在計算出各類別任務在打包發布時定價后,根據附件一求出每價格下已結束任務的任務完成度(見表6),據此擬合出任務完成度與價格的關系,如圖3所示,可知任務完成度為[10]:


表6 各定價下任務完成度

圖3 定價與任務完成度的關系

圖4 是否打包發布完成度對比
根據所求(2)式所求價格與完成度的關系,計算出在將任務點劃分成6類時打包發布的任務完成度,并與之前分散發布的任務度對比可知,修改之前的定價模型后,各地區的任務完成度處于大致持平狀態,緩解了偏遠任務點無人問津的狀況,有利于提高整體任務完成度,任務完成度前后對比如圖4所示.
本文利用K-MEANS聚類分析方法和球面距離處理數據,得到“眾包”任務定價,合理考慮了地理位置與任務密度對任務定價的影響.為提高任務完成度,合理考慮不同價格在不同分類中的權重,提出模糊加權平均定價模型,使任務定價更加合理.如此定價方式,相比傳統的市場調查方式確定任務定價,可以縮短調查周期,節約調查成本,實現企業與會員雙方利益共嬴.
參考文獻:
〔1〕孫坳,何明珂.基于結構方程模型的眾包物流風險識別與分 析 [J/OL].管 理 現 代 化 ,2017,(06):105-109(2017-11-22).http://kns.cnki.net/kcms/detail/11.1403.C.20171122.1207.028.html.
〔2〕朱建平.應用多元統計分析[M].北京:科學出版社,2016.
〔3〕李磊,王俊熙,賀易,詹鵬,劉方方,湯弋.基于 K-means聚類粒子群算法的多點PV-DG日前分配計劃[J].高電壓技術,2017,43(04):1263-1270.
〔4〕朱家明,任曉翮.基于AHP-熵值法的精明增長計量分析[J].安徽大學學報(自然科學版),2017,41(6):61-67.
〔5〕姜啟源,等.數學模型(第三版)[M].北京:高等教育出版社,2003.8.
〔6〕孫信昕,趙興龍.基于K-means遺傳算法的眾包配送網絡優化研究[D].北京交通大學,2016.
〔7〕趙文杰,朱家明,吳曉蔓,等.基于C均值聚類下出租車資源配置的優化[J].佳木斯大學學報(自然科學版),2016,34(02):267-271.
〔8〕李震,洪添勝,曾祥業,等.基于 K-means聚類的柑橘紅蜘蛛圖像目標識別[J].農業工程學報,2012,28(23):147-153+299.
〔9〕何玲,朱家明,蔡經緯,等.基于馬爾可夫預測法郵輪定價策略的研究[J].商丘師范學院學報,2016,32(09):1-5.
〔10〕楊桂元.數學建模[M].上海:上海財經大學,2015.