王徐瑤 鄒國昊 朱紅鑫



摘 要:隨著互聯網普及率的逐漸提高以及Web2.0時代網絡虛擬產品交易的興起,眾包已經成為一種新型的電子商務模式,任務定價是眾包平臺服務的關鍵要素,優良的定價可以大大減少調查成本。本文針對眾包平臺任務定價問題,通過分析相關數據,建立多元線性回歸方程,確定任務定價規律;采用SPSS軟件對數據進行聚類,并利用MATLAB計算與擬合變量間的關系,建立邏輯回歸方程預測修改方案的任務完成情況,進而定義任務完成度與平臺效益值探究任務定價的合理性。
關鍵詞:多元線性回歸;Logistic增長函數;SPSS聚類;眾包平臺
一、引言
互聯網行業的快速發展帶動了Web2.0時代網絡虛擬產品交易的興起,“眾包”也已然成為了一種新型的電子商務模式,并占據著越來越重要的市場地位,任務定價是眾包平臺服務的關鍵要素,優良的定價可以大大減少調查成本,有效的保證調查數據的真實性且縮短調查周期,但如果定價不合理,有的任務就會無人問津,而導致商品檢查的失敗。任務定價與多方面的因素有關,合理全面的考慮影響因素才能得到合理價格,才能促進自助式勞務眾包平臺的發展。
“拍照賺錢”APP就是一種典型的眾包模式,用戶通過自主領取APP中的拍照任務,獲取相應的報酬,與此同時,發布者也可以通過這種模式迅速高效地收集到所需數據。本文通過分析前期獲取的廣東四市八百多個任務的定價數據,深入研究定價與地理位置的相關參數的關系,得到項目任務定價規律,綜合分析多方面因素與任務完成情況的關系,設計新的任務定價規律,并與原方案比較利弊。實際情況下,多個任務可能位置比較集中,用戶爭相選擇,一種考慮是將這些任務聯合打包,一起發布,類似于滴滴打車的拼車,可以有效完成任務,且降低了調查成本。在這種考慮下,修改前面的定價模型,并分析任務完成的情況。最后,對打包發布的任務給出定價方案,并評價方案的實施效果。
二、研究模型的建立
1.數據收集
如上表顯示為收集的兩千多個新任務的數據,通過GPS經度和緯度可以詳細定位出每個任務的位置。
2.模型假設
(1)假設任務難易程度相同,所有會員可以完成;(2)假設會員在是否完成任務時僅考慮性價比因素;(3)位置因素只考慮距離遠近,不考慮地形,交通等不同情形;(4)假設任務定價完全由定價規律決定,無人為或政治等其他方面因素。
3.模型的建立與求解
(1)數據分析。①模型的準備數據的處理:基于數據量較大的基礎上,首先對經緯度進行聚類,其算法流程圖如下:
利用MATLAB軟件,分別以經緯度為變量,從總數據數據中生成4個初始聚類中心,最后迭代500次后給出最終聚類中心。
首先,分析位置與定價的關系,繪制定價關于經緯度的圖形,如圖2任務定價關于經緯關系圖:
在地圖上搜查聚類中心,可以發現聚類中心為大型商業中心或市政府所在地,且把不同聚類類別的位置在地圖上顯示,主要分布在四個城市,分別為廣州市、深圳市、東莞市、佛山市。
結果的案例數地圖所在地基本符合廣東四市地理分布,少量數據不符合規律已剔除。明顯可得不同的地區任務數量差別很大,經濟發達地區任務數量明顯高于經濟次發達地區。現對任務價格分析所處的不同地理位置的影響。用EXCEL表格根據所在地不同進行分類,計算可得深圳市的平均任務價格為68.21元、廣州市79.35元、東莞市66.64元,佛山市65.39元.根據聚類得廣州市與深圳市的任務數量與任務均價明顯高于東莞市與佛山市,這說明地區經濟發展情況與定價關系很大,且不同地區之間可能存在政府政策的影響。
②模型的建立:任務定價與多個因素有關,為探究具體變量對任務定價的影響,采用多項式擬合模型:
對多項式擬合,采用控制變量的方法,例如研究固定范圍內會員數對價格的影響,控制其他變量不變,單獨研究一個變量與浮動價格的多項式關系。
(2)模型的求解。任務受多種因素的影響,控制變量,首先分析所在地理位置與任務定價呈現的規律如圖3:
得四個聚類中心分別為四個城市的中心,且距離市中心越遠價格越高,因為市中心交通便利,會員集中,且市中心任務集中,可一次完成批量任務。所以距離市中心距離的遠近是影響任務定價的重要因素,呈從中心向周圍輻射現象。不同城市間也存在影響,相鄰城市的共同影響區任務多,任務定價偏低。
現在具體討論幾個因素對任務價格的影響。首先所在地區經濟對任務價格的基礎性作用。如地區任務基本定價圖4所示。
從圖中可得地區決定定價的基本價格,地區經濟富裕,基礎價格高于其他地區,且呈中心遞減趨勢,符合實際的價格分布情況。
從圖中可得與市中心的距離對定價有浮動價格影響,基本影響價格在5元-6元之間,且經濟發達地區的浮動價格影響更加明顯,距離市中心距離越遠價格更高,但不是簡單的線性關系,因為影響因素有交通便利度、會員數量、會員距離等多方面因素。
可得任務周圍會員數與浮動價格成負相關,任務與會員距離成正相關。為避免圖形的波動所以將任務周圍會員人數坐標方向變化,形成任務與會員相對距離一致效果。首先規定會員執行任務的距離,規定會員會預約的任務在自己一小時車程內,統一規定為50千米,相對距離為到任務與50千米的比值,最后研究會員數量與會員和任務距離的函數關系。
圖5中采取三種擬合方法,計算周圍會員數與浮動價格的影響,分別為線性擬合、多項式擬合、樣條插值擬合。樣條插值擬合符合數據點變化,但沒有具體函數表達式,多項式與線性擬合都有函數關系式。線性擬合的相關系數為0.98,擬合度良好。
由任務距周圍會員距離關系可得,近似成線性關系,用線性擬合得函數關系式:
綜合以上所有因素的影響的共同作用,探究因素非線性疊加對任務定價的影響,與原任務定價的吻合度。
由圖可知,實際價格為零刻度線,模擬價格為波動在實際價格上下的紅色圓圈。可見,殘差值在-1.5-1.5之間,殘差范圍下,所以可知本題模型解法與平臺原任務定價吻合度非常好。
①模型的修正:通過對原模型的分析發現,原方案僅考慮地理位置的相關參數,從忽略了會員的信譽值與預約時間,任務本身的時間限制等因素,說明定價策略非常不合理,所以綜合考慮這些因素,設計定價方案。在定價方案制定過程中需要促進任務完成與提高平臺收益。
劉曉鋼在研究眾包中任務發布者出價行為的影響因素中,分析相似任務出價的出價、任務難度、任務期限、相鄰會員數量,任務位置等方面綜合考慮定價問題。楊志國在申請專利多任務環境下眾包平臺定價方法提到眾包任務發布者制定任務發布策略、眾包平臺迭代更新其價格策略。陳家銀在豬八戒眾包平臺數據分析余眾包模式設計指出接包計件模式最受參與者歡迎,并且計件模式的任務價格都與參與人數有著較強的正向性關系。
綜合以上學者研究成果,我們建立多元線性回歸方程,主要考慮城市經濟基礎,距離市中心距離,任務點距會員距離,預定任務開始時間,信譽值五個主要因素與任務定價之間的關系。
②新模型的建立:建立多元線性回歸模型,所得數據提供了預定任務開始時間,信譽值這兩組數據。城市經濟基礎由城市總GDP與人均GDP決定,距離市中心與任務點距會員距離可通過計算可得。
正態性:即隨機擾動項服從正態分布
③新模型的求解:在原方案中我們已經考慮了部分因素對任務定價的影響,現增加預定任務限額、預定任務開始時間與信譽值三個因素,并修改原方案中因素對任務定價的影響關系。
信譽值主要體現在預定任務限額與預定開始時間上,故忽略信譽值的影響。分析可知任務預定時間隨浮動價格呈二次函數關系,在預定時間的中值處浮動價格最高,對于任務預定限額則是預定限額越高價格越高,因為信譽值高,服務優質、可靠。
進行兩個變量對因變量的影響分析與擬合,如圖7,任務周圍會員數量、距離市中心距離與定價的三維散點圖并進行關系擬合。以東莞市為例。
以東莞市數據為例,任務周圍會員數量、距離市中心距離對任務定價的影響,擬合結果理想,在兩個自變量下定價大致符合平面方程規律。依次思想,擬合其他因素對任務定價的影響,最終可以得出五個因素關于定價的關系如下所示:
該方程關系式可得,驗證方程的可行性,首先對所有位置點重新計算價格。
新的任務定價與原方案比較,個別數據具有偶然性,所以統一考慮總體數據的修改性。對數據進行分類,分為任務執行與任務未執行。
對比可知,任務被執行的定價平均值修改后低于修改前,再保證任務執行的前提下,說明成本花費減小,新的定價方案合理。任務未被執行的平均值修改后高于修改前,提高價格吸引會員完成任務,提升任務完成率。在提高任務完成的情況下,部分任務增價,部分任務減價,總的平臺花費下降,提高了平臺效益值。
④結果及解釋:建立多元線性方程,擬合計算得到新的任務定價。對比新的任務定價與原任務定價對比。分為任務完成與任務未完成兩個種類,兩種任務下,未被完成的價格提高,完成的價格降低。修改后定價方案可以提高任務完成率,并降低任務成本,新方案合理。
3.模型的優化
在實際情況下,可能存在任務集中情況,一次執行多個距離較近的任務節省時間提高收入,所以用戶會爭相選擇,所以統一將這些任務打包發布。我們研究打包可能和多個因素有關,比如距離,任務難易程度,任務性質等其他因素,根據所給數據,主要考慮任務點間距離因素。聚類后,任務數大幅減小,但部分任務任務量增大,所以需重新定價,給出新的定價規律。因為任務的重新分配,所以還需預測任務完成情況。
(1)優化模型的建立。建立修改多元線性方程,增加任務量自變量與修改原距離自變量關系式
首先根據距離對任務重新劃分,綜合考慮打包后任務量變化,執行任務的距離變化重新計算函數關系式的系數,從而得到新的定價規律。使用元胞向量機模型分類,與直接用距離分類相互印證、輔證。
元胞自動機由元胞空間、元胞狀態、鄰居及進化規則四個基本要素組成。在數學上,可以用一個四元組表示:
式中A為元胞自動機,Zd為d維歐氏元胞空間,S是有限狀態集合,可表示為:
Si代表元胞自動機的第i個狀態;而N則是中心元胞的鄰域,表示為:
其中Xi為相鄰元胞對于中心元胞的位置;f為
(2)優化模型的求解
先在每個任務點處以固定的半徑畫圓,分析所有任務點的空間距離關系。
由圖中可得,東莞市任務距離較廣東市任務距離分布稀疏,不夠密集,但也存在許多三四個任務點聚集現象,對這些任務點分布較密的采用打包現象。
采用上述方法,對八百多個任務點進行打包。具體結果為分為314個打包任務,打包內任務數基本為1-5個,距離相距較近,利于任務執行。打包內任務數集中在1-5個,任務數不多,任務量可以個人完成。在重新定價與打包數變化的基礎上,現進行平臺效益值分析,其如下圖9所示:
打包任務數不能過多過少,這樣都會使平臺效益下降。平均定價如果太高,會員競相選擇,但平臺花費增大;定價過低,會員無人執行,平臺收益效果也不好。本文修改模型,首先合理的對距離進行分類,分類效果良好。然后在考慮任務執行情況與平臺收益的基礎上,給出定價規律,最終定價方案,促進了任務執行情況。分析結果如圖10所示:
圖中可得在平臺投入資金相同時,打包后任務完成度明顯高于打包前,打包后單個任務定價普遍低于打包前,但性價比明顯提高,多個任務可一次完成,提高收入。
(3)優化模型的結果及解釋
打包后的定價規律與原方案比較得,既提高了任務完成度也提升了平臺效益值,花費更少,完成度更高。打包后的定價規律與原修改的定價規律相比,任務完成度相差不大,但平臺效益值提升,即花費更少完成相同的任務。
參考文獻:
[1]劉曉鋼.眾包中任務發布者出價行為的影響因素研究[D].重慶大學,2012.6.
[2]陳家銀,豬八戒眾包平臺數據分析與眾包模式設計[D].大連理工大學,2012.5.3.
[3]司守奎,孫兆亮.數學建模算法與應用[M].北京:國防工業出版社,2015.
作者簡介:王徐瑤,女,江蘇興化人,江蘇師范大學;鄒國昊,男,江蘇南京人,江蘇師范大學;朱紅鑫,男,江蘇徐州人,江蘇師范大學