何丹
摘 要:近些年,在移動互聯網時代,自助式勞務眾包平臺發展非常快,它為企業提供多種多樣的信息,同時大大降低了調查成本。其基本模式是:用戶在APP上領取需要完成的任務,賺取APP對任務所標定的酬金。由于定價規則關系到任務是否能被完成,同時影響企業付出的成本,因此至關重要。本文根據不同任務的分布情況,結合任務周圍的會員情況,分別提出了單個任務定價模型和打包任務的定價模型。經檢驗、采用這兩種定價模型的任務完成率較高,且總價格較低,具有普遍推廣的價值。
關鍵詞:自助式勞務;眾包平臺;定價規則;聚類算法
中圖分類號:F23 文獻標識碼:Adoi:10.19311/j.cnki.1672-3198.2020.30.049
1 背景介紹
首先以“拍照賺錢”的形式來說明自助式勞務眾包的含義。“拍照賺錢”是近幾年來興起的一種建立在移動互聯網基礎上的自助式服務模式。其具體模式是用戶下載APP并注冊成為的會員,通過APP領取需要拍照的任務,并賺取APP對任務所標定的酬金。傳統的市場調查需要大量的人力和物力,消耗大量成本,相比之下,移動互聯網下的自助式勞務眾包平臺,可以為企業提供各種商業檢查和信息搜集方式,也可以節省不少調查成本。與此同時,適當地縮短了調查的周期,也有效地確保了調查數據的可靠性。因此,APP成為該平臺運行的核心,而APP中的任務定價又是其核心要素,這就使得定價的合理性顯得尤為重要。如果勞務眾包定價過低,就會出現沒有人接單的問題,從而導致任務無法完成。
2 單個任務的定價模型
首先采集一批成功完成的任務的經緯度坐標和價格,以及其周圍的會員的信息,包括會員的經緯度坐標、信譽值、參考其信譽值給出的任務開始預定時間和預定限額,以便從中學習合理的定價規則。
對于每個任務,需要充分利用其周圍的會員信息。因此,首先通過對不同距離范圍內會員人數和價格的相關系數分析,得出需要考慮的距離范圍。當距離范圍在某一固定值時,會員個數和任務價格的相關系數絕對值達到最大,也就可以把這個距離作為需要考慮的范圍半徑,利用MATLAB作圖,結果如圖1。
當考慮距離范圍為4.5km時相關系數絕對值達到最大值0.6。因此,以4.5km為界線,為每個任務計算在這個范圍內的會員個數、會員信譽值和、開始預訂時間和、預定限額和。對這些變量進行標準化處理,再用多元擬合的方法得到下式:
定價=-0.929*會員個數-0.618*會員信譽值和+0.665*開始預訂時間和+0.410*預訂限額和
至此得到了這四個參數和定價的關系。但無法用它們來進行預測,因為多項式擬合的自變量、因變量都進行了標準化處理,無法恢復到原始值。因此,采用神經網絡模型來學習四個參數和價格的關系,從而進行預測,神經網絡的基本單元神經元的示意圖如圖2。
該神經元是一個以x1,x2,x3及截距+1為輸入值的運算單元,其輸出為:
hW,b(x)=f(WTx)=f(z)=f(3i=1Wixi+b)
其中函數f被稱為“激活函數”,W為權重,z為x經過線性變換的結果。本模型選用sigmoid函數作為激活函數。
而神經網絡模型就是將許多個單一神經元聯結在一起。使用圓圈來表示神經網絡的輸入,標上“+1”的圓圈被稱為偏置節點。神經網絡最左邊的一層叫作輸入層,最右的一層叫作輸出層。中間所有節點組成的一層叫作隱藏層。按如下公式得到整個神經網絡的輸出:
z(2)=W(1)x+b(1)
a(2)=f(z(2))
z(3)=W(2)a(2)+b(2)
hw,b(x)=a(3)=f(z(3))
其中,上標代表層數,a為每個神經元的輸出值。在本模型中,輸入是每個任務周圍的會員數、會員信譽值和、開始預訂時間和、預定限額和,輸出是每個任務的價格。通過訓練神經元的各項參數,使得預測得到的輸出和實際價格盡可能的相近。
檢驗訓練得到的模型,結果如圖4、圖5所示。
可以看到,誤差主要集中在標準線附近,且確定系數R較接近1。因此可以認為該模型能較為準確的擬合數據。用訓練好的模型為任務重新定價,并重新用四個參數多項式擬合新定價。發現新得到的參數和原參數相近,證明單個任務模型的價格制定合理,任務完成率較高。
3 打包任務的定價模型
考慮到多個任務如果位置太過密集,會發生用戶對任務進行爭搶的現象,于是我們選擇將這些任務聯合在一起打包發布。如果定價足夠高,那么會員理所當然的會選擇完成這些打包任務。但是,從企業角度出發,需要盡可能的降低定價從而節約成本。因此,如何在這兩者之間取得平衡成了問題的關鍵。具體定價方法如下:
首先采用基于密度的DBSCAN空間聚類算法,將分布集中的任務打包成一類。DBSCAN是一個比較典型的基于密度的聚類算法。其聚類定義簡單地說是根據密度可達關系得到最大密度相連的樣本的集合,它可以將較高密度的區域劃分為簇,并可將任意形狀的稠密數據集進行聚類。事實上,DBSCAN與劃分和層次聚類方法是不同的。該算法的偽代碼如下:
輸入:包含n個對象的數據庫,半徑e,最少數目MinPts。
輸出:所有生成的簇,達到密度要求。
(1)Repeat。
(2)從數據庫中選取一個沒有處理的點。
(3)IF選取的點是核心對象THEN找出所有從該點密度可達的對象,形成一個簇。
(4)ELSE選取的點是邊緣點(非核心對象),跳出本次循環,尋找下一個點。
(5)UNTIL所有的點都被處理。
分類之后,借用重心的概念,設定每一類任務的中心。設某個打包任務里有N個任務,其中心的經緯度計算公式如下:
中心緯度=Ni=1LatitudeiN(1)
中心緯度=Ni=1LongitudeiN(2)
之后,在打包任務之外的單個任務中搜索到距離最近的N個任務J1-N,它們的價格為PJ1-N,并計算它們離重心的距離dJ1-N。而打包任務距離重心的距離為d1-N。通過查閱路費、心理學相關的資料,我們把1km行程的成本定為兩元(1.2元的汽油費和0.8元的時間成本)。打包任務的價格公式如下:
P打包=Ni=1PJi-(Ni=1dJi)(3)
該公式很容易理解,聚類范圍內的會員如果舍近求遠,則需要花費更多的路費、時間成本、機會成本等。而如果會員選擇距離他較近的打包任務,則成本就會小得多。假設這些成本之差大于打包任務和單個任務的價格之差,也就是會員舍近求遠多賺到的錢不足以抵消他來回的成本,那么會員更愿意選擇打包的任務。
帶入實驗數據,應用打包定價模型,得到圖6。
可見,打包后的任務價格下降明顯。同時,由于一個打包任務只能由一個用戶完成,而之前這些任務可能由很多用戶分別完成。那么這些沒有搶到打包任務的用戶很大可能去選擇別的任務去完成,這樣又進一步提高了任務完成率。
最后,和第二節中的方法相同,我們通過觀察多項式擬合的系數來判別任務完成度。和已完成任務的多項式參數相比,四項系數均比較相近。即:打包任務價格的制定和已完成任務的定價規則相近,完成度較高。
4 模型的評價與推廣
本文通過學習已完成任務的定價規律,提出了兩種新的定價模型,分別是來為單個任務定價,和將多個集中的任務打包發布的定價模型。通過將兩種模型預測出的定價和實際價格作比較,證明了它們具有良好的完成率,同時節約了企業的成本。另外,對于如何將任務進行打包,采用了聚類方法,檢驗結果表明該模型可以成功將分布集中的任務歸到一類。
移動互聯網經濟飛速發展的形勢下,自助式勞務眾包平臺逐漸增多,使得企業能夠方便快捷地進行各種商業檢查和信息收集,大大節省了企業的調研成本。此外,共享經濟飛速發展,拼車、拼團等商業模式也需要類似的定價方式。因此,本文中的定價模型具有廣泛的應用前景。
參考文獻
[1]劉嚴.多元線性回歸的數學模型 [J ].沈陽工程學院學報:自然科學版,2005,(Z1):128-129.
[2 ]張景陽,潘光友.多元線性回歸與BP神經網絡預測模型對比與運用研究 [J ].昆明理工大學學報(自然科學版),2013,38(6):61-67.
[3 ]周水庚,范曄,周傲英,等.基于數據取樣的DBSCAN算法 [J ].小型微型計算機系統,2010,21(12):1270-1273.