王怡+譚莉??+朱曉文+王天浪
摘 要:
本文針對2017年全國大學生數學建模競賽本科組B題的前兩個要求,建立模型,研究位置、完成情況對任務定價的影響。
關鍵詞:競爭導向;勞務眾包;回歸分析
一、問題重述
(一)問題背景
隨著互聯網產業的迅速發展,各類移動APP被迅速推廣。“拍照賺錢”APP運用了移動互聯網下的一種自助式服務模式,需要用戶下載APP,注冊成為APP的會員,然后從APP上領取需要拍照的任務,即可賺取APP對任務所標定的酬金。
這種基于移動互聯網的自助式勞務眾包平臺,為企業提供各種商業檢查和信息搜集,相比傳統的市場調查方式可以大大節省調查成本。
(二)需解決問題
題目所給附件一是已結束項目的任務數據,包含任務的位置、定價和完成情況;附件二是會員信息數據,包含會員的位置、信譽值、參考信譽值給出的任務開始預訂時間和預定限額;附件三是新項目的任務數據,僅包含任務位置信息。
根據附件一、附件二、附件三中的數據信息,對下列問題分析并解決:
1.根據附件一中給予的每個任務的位置、定價和完成情況,找出附件一中項目的任務定價規律。
2.根據問題一建立的數學模型,結合附件二中數據,對附件一的定價規律進行調整。設計新的任務定價方案,并與原方案進行比較。
(三)問題假設
3.1 假設不考慮實際地勢與城市建設的情況;
3.2附件中數據真實可靠,準確性較高;
3.3樣本容量足夠大,樣本數據真實,能夠反映具體其情況;
3.4假設數學模型沒有出現人為因素中途破環;
3.5假設附件中的每個屬性以及屬性下的數據沒有非常規的異常;
3.6假設問題二只考慮會員人數與會員分布面積,任務的完成狀態,以及附件一種的任務原標價等三個因素。
二、問題分析
2.1 問題一
對于任務定價規律,我們主要研究每個任務距城市任務中心點的距離與任務標價之間的關系。建立一元二項式回歸模型,輸入數據,求出系數。并對數據進行預測和誤差分析,用于檢驗模型一。
根據所得結論和ArcGIS軟件作圖,分析四個城市任務未完成情況的原因,在問題三模型建立中,分地區進行討論。
2.2 問題二
在競爭導向定價公式的基礎上,綜合附件一的完成情況、價格,附件二的經緯度,對定價公式進行增改。當任務參考價格系數為0.78,僅提高了價格。對模型進行修改,當任務參考價格系數為0.75,同時對任務完成情況分段討論,通過繪制價格頻率圖,最終得到效果較好的模型二。
三、模型的建立與求解
3.1 模型一的建立與求解
3.1.1 數據預處理
附件一中包含了每個任務的位置、定價和完成情況,將任務的經緯度導入 ArcGIS軟件,同時導入地圖,將每個任務的位置在地圖上進行標注。綠色點代表任務完成,紅色點代表任務未完成。結果如下圖1所示。
圖1 任務完成情況分布圖
在附件一的835個任務中,使用Excel表格中的rand函數,將任務充分打亂后,抽取210組經緯度數據作為樣本。在SPSS軟件中,通過聚類分析將其為3組。對抽樣分組后的每組數據求平均值,用以代替原樣本中每組任務的平均值,得到3個中心點的位置。對照地圖,得到以“廣州——佛山”、“東莞”和“深圳”3點為中心點的任務區。
使用ArcGIS軟件,對835組經緯度數據進行處理。計算每個數據到“廣州——佛山”、“東莞”和“深圳”3個中心點的距離,同時對距離進行無量綱化處理。上述3個距離,分別用X\-1、X\-2、X\-3表示。對于每個任務,在3個距離中選出最短距離X\-\{min\},及對應任務標及任務標價Y。
3.1.2 模型一的建立
在模型一中,我們僅考慮距離對任務標價的影響。因此,對每個任務到其最近中心點的距離X\-\{min\}作為自變量,對應的任務標價Y作為因變量,研究兩者之間的關系。
ArcGIS作圖后無法使兩變量呈現較為明顯的函數關系,因此對上述兩變量進行回歸分析。即假設模型y=f(x\-1,x\-2,x\-3)中函數f是多項式形式。
經過多次嘗試,使用一元二項式回歸對數據進行分析,公式如下。
y=a\-1x\+m+a\-2x\+\{m-1\}+…+a\-mx+a\-\{m+1\}
確定多項式系數的命令[p,s]=polyfit(x,y,m),其中x=(x\-1,x\-2,…,x\-n)、y=(y\-1,y\-2,…,y\-n)是輸入的數據,
p=(a\-1,a\-2,…,a\-\{m+1\})是系數,s是一個用以估計預測誤差的矩陣。
通過在MATLAB軟件中輸入數據,利用命令做一元二項式回歸,得到回歸模型:
y=68.8985+4.2008x-12.1004x\+2
對回歸模型進行預測和預測誤差估計使用命令C=polyconf(p,t,S),得到835個任務標價預測值,如下圖
3.1.3 定價規律的分析
因一元二項式回歸曲線效果不明顯,另用多元二項式回歸中的完全二次模型繪制圖形,如圖3。
得到上述圖形后,圖左邊給出y的預測值及其置信區間。剩余標準差為4.5037,說明此回歸模型的顯著性較好。最終,認為最短距離與任務標價之間具有相關性。
在此回歸模型的基礎上,將任務標價的數據導入SPSS軟件,對其頻率進行統計,得到直方圖。
根據直方圖可以得出任務標價的分布范圍較廣,且頻率偏差性較大。峰值在65.1,而65、70、75和85四個價格中,都有相對較高的頻率。另外可以觀察到,任務標價有類似正態分布的價格分布情況。因此,在問題二的新任務定價方案中,將針對任務標價的價格分布情況,進行建模與修改。endprint
使用ArcGIS軟件,將底圖中的商店與商場進行顯示,底色越密集的地方,商業越發達,以此來印證3個中心點位置的正確性。同時,越繁華的地段,任務標價越低,任務爭搶越激烈。
如下圖4所示,暖色系顏色標識任務為已完成任務,冷色系顏色標識任務為未完成任務,顏色越深,任務價格越高。
3.1.4 模型一的檢驗
使用3.1.2中一元二項式回歸模型,對回歸模型進行預測和預測誤差估計。利用預測值,將其帶入模型一中,對模型一進行檢驗,到驗證價格的頻率直方圖。
分析直方圖可知,任務的價格集中在69,有少量價格分布在67.5。雖然價格分布集中,能夠得到正態分布曲線,但由于價格分布本身應具有高地價的區分,因此后續模型應做改進。
3.1.5 未完成原因分析
從地圖中可以看出,任務未完成的情況集中在佛山中部、廣州西部和深圳全區。佛山除去中部偏南部分任務未完成,其余任務完成度較好;廣州集中在市中心的低價區,完成與未完成任務地點重合;東莞所有任務均完成;深圳的任務完成在主干道西部較集中。
佛山未完成任務特點:未完成任務集中在中部偏南地區,即禪城區。佛山市作為廣州市周邊的二線城市,地區經濟發展水平近幾年正飛速提升。但佛山市較有歷史底蘊,市民注重生活與飲食,生活節奏較慢。任務未完成較集中的禪城區,位于佛山市市中心,也是佛山市政府所在地,人均收入高,生活條件好,周邊的南海區人均收入在佛山市收入居于次高。因此,較低價格的“拍照賺錢”任務無法吸引禪城區和南海區人民的興趣,未完成任務較多且集中。
廣州未完成任務特點:集中在市中心的低價區,與完成任務地點重合。廣州因改革開放而迅速發展,特別是位于廣州西部的主中心分區,GDP常位于全國前列。市中心人流量較大,任務價格較低且爭搶較激烈。因此,認為廣州市的任務未完成情況是由于在市中心一人接多單,但是接單未做完導致的,也有可能是由于任務金額較低導致。余下的價高任務,是由于地處偏遠地區而未完成。
深圳未完成任務特點:任務完成在主干道西部較集中。深圳市地處沿海,靠近南部沿海區域發展的更好。通過對比,可知任務完成多集中在福田區。福田區是深圳市的市中心,深圳外來務工人員較多。與東莞不同,深圳的技術人員占據較大比例。處于市中心福田區的低價任務,由于市中心人流量大,因此完成率較高。
3.2 模型二的建立與求解
3.2.1數據預處理
將附件二中會員位置導入ArcGIS軟件中,對數據進行處理。除去地域偏遠的會員,僅對3個中心點周邊區域的會員人數進行統計。
對選中的會員集中區域,劃分為16個小區域。用ArcGIS軟件,對選定的區域進行會員
人數R與面積S進行統計可知,市中心任務價低,競爭激烈。因此將參考任務的競爭彈性系數E,對模型二進行完善。而任務的競爭彈性系數,將由會員密度代替。得下式:
Ei=[SX(]S\-i[]R\-i[SX)](i=1,2,…,16)
區域競爭彈性系數E\-i,區域會員人數R\-i,部分區域面積S\-i。
對完整數據分別求出16個E\-i,通過MATLAB軟件,求出調和平均數E,作為任務的競爭彈性系數。最終,求得競爭彈性系數為2.7。
3.2.2 模型二的建立
根據競爭導向定價公式[1],對服務產品的價格彈性進行設定。定價公式為:
y=[SX(]1[]2[SX)](3-[SX(]1[]│E\-d│[SX)])y\-0
其中,服務產品需求價格彈性Ed,調價前任務價格y\-0。
用競爭彈性系數E代替需求價格彈性Ed,同時根據附件二的經緯度,附件一的完成情況和價格,對上述定價公式進行增改。
為增強模型的針對性,模型二加入了附件一中提供的同類位置任務的價格,將其作為任務參考系數α。
α=0.78時,建立模型二,對附件一中任務價格數據進行處理,繪制第一次價格模型直方圖,對比前面繪制的直方圖中的標準差,可知4.6484大于原數據的標準差。由于建模效果不理想,因此對模型二進行修改。
α=0.75時,加入對應的任務完成情況,作為任務完成度β,同類任務的參考價格P\-c。
y=[JB({](1/2)×(3-(1/│E│))×y\-c×α
(1/2)×(3-(1/│E│))×y\-c×α+
[KF(](1/2)×(3-(1/│E│))×y\-c×0.09[KF)][JB)]
當β\-i=1時,選擇第一個公式;
當β\-i=0時,選擇第二個公式。
由此,在MATLAB軟件中,對第二次建立的模型二進行數據處理,得到新的任務價格,并用SPSS軟件繪制價格模型直方圖
圖6 模型二第二次價格直方圖
3.2.3 模型的比較
由上圖可知,標準偏差的關系為
4.3968<4.513<4.6484
模型二第二次建模效果,比較原模型,能夠明顯看出任務價格的正態分布情況。得知任務價格峰值為67,價格在63~69較為集中,73也存在較高頻率。價格集中在偏低范圍的同時,較高價格仍有存在(例如:84)。由于任務價格本身存在一定差異性,所以模型二的第二次建模較為成功。
四、模型綜合評價
4.1 模型的優點
1.模型簡單,易于實現。
2.引入競爭彈性系數與獎勵金機制,具有創新性。
4.2 模型的缺點
1.模型一中涉及的無量綱距離容易經緯度的影響
2.模型整體考慮的變量因素不夠全面,與實際的復雜規律有一定偏差。
[參考文獻]
[1]劉曉鋼.眾包中任務發布者出價行為的影響因素研究[D]重慶:重慶大學,2012.
[2]吳瑞杰,孫鵬,孫昱.分布式任務計劃動態調整模型及算法[J].系統工程與電子技術,2017, 39(2):322-328.
[3]宋天舒,童詠昕,王立斌,等.空間眾包環境下的3類對象在線任務分配[J]. 軟件學報,2017,28(03):611-630.
[4]孫信昕.眾包環境下的任務分配技術研究[D].揚州大學,2016.
[5]林素芬.眾包商業模式特殊性的理論詮釋[J].長春大學學報,2013, 23(5):544-546.
(作者單位:武漢商學院,湖北 武漢 430056)endprint