任思源 王鐸 閆佳鶴 趙懷志
摘 要 近年來隨著移動互聯網的發展,移動互聯網的自助式勞務眾包平臺掀起熱潮,APP成為此類平臺運行的核心,通過研究如何根據收集的位置數據信息對影響因素進行合理性分析并定價,為解決其此類APP定價問題,提供了一條思路。
【關鍵詞】數據處理 K-means聚類 回歸分析 打包分配
由于會員是從APP上領取需要拍照的任務,賺取APP對任務所標定的酬金。因此,若APP所給定價不合理,有些任務就會無人問津,從而導致商品滯留。從消費者心理導向考慮定價,若任務量供大于求,為避免因搶單而出現系統崩潰或者最后無人接單的情況,可以適當降低任務項目定價;而若供小于求,可以適當提升定價以吸引會員接單,提高任務完成率。
1 定價策略分析
初始狀態,能供給用于定價研究的數據種類極少,對普通運營商而言,開始只能通過任務位置狀況而給出定價。通過進行大量市場調研結合定價理論,考慮規定價位區間,此限度內,任務所處位置交通越便利、人口密集程度越高,定價越低;反之,則相對越高。在此定價上運營一段時間后,對已結束項目任務數據(含任務經緯度、定價和完成情況)進行研究,將經緯度數據轉化到地圖,用Power Map Preview For Excel導出三維圖。據熱度地圖知,相同價位,處于市中心繁華街道等人流量大、交通便利的地方完成情況較偏遠些的、人口密度較小的位置更好;樣本中總體完成情況較差,已完成任務數僅占發布任務總數62.5%。
根據定價理論結合實際情況,考慮任務位置情況、會員位置、會員與任務相對位置等因素影響;交通情況和高程信息也該作為分支考慮進去,但考慮到GPS更新速度及技術實現的復雜度,故不對其單獨研究。實際情況下,多個任務可能因為位置比較集中導致用戶會爭相選擇。因此,可將這些任務聯合打包發布。綜上,可將任務位置,會員位置,會員與任務相對位置等因素綜合起來轉化為定價;之后采用打包分配策略優化定價模型。
2 數據處理
2.1 物品位置
將完成任務的項目的經緯度及所給定價提取到新建工作表,由于經緯度是兩個值,為方便計算距離,將自變量數目化一,建立極坐標系。根據三維地圖找出任務點中心為蓮花山旅游景區,確定其經緯度為(N22.97883141215, E113.50445747375)將此值插入Excel表對應任務編號下拉,根據公式對應計算各個任務位置到所取中心點的距離D,將其轉至新的工作表整理。Excel通過經緯度計兩點間的距離函數公式,以任務位置信息處理為例:D=6371004*ACOS((SIN(RADIANS(B2)*SIN(RADIANS(D2))+COS(RADIANS(B2))*COS(RADIANS(D2)*COS(RADIANS(C2-A2)))其中:B2為會員緯度,D2為中心緯度,C2為中心經度,A2為會員經度
2.2 會員位置和相對位置距離
根據所選中心(N22.97883141215, E113.50445747375),應用經緯度計兩點間距離函數公式求解會員到所選中心點距離值,結合2.1,用兩點對應相減的絕對值即可求解會員與任務項的相對位置距離。
3 基于回歸分析的定價
回歸分析在一組數據的基礎上研究的問題如下:
(1)建立因變量y與自變量x1,x2,…,xm之間回歸模型(經驗公式);
(2)檢驗回歸模型可信度;
(3)判斷每個自變量xi(i= 1,2,.,.m)對 的影響顯著性;
(4)判斷回歸模型是否適合該組數據;
(5)利用回歸模型對y進行預報或控制。
現設y對應X1,X2,X3先分別作出y對X1,y對X2,y對X3的散點圖簡單判斷其關系,同時從全局作出y對X1,X2,X3整體散點圖。根據散點圖情況設Y=β0+β1X1+β2X2+β3X3,其中:Y=定價類型,X1=任務與中心距離,X2=會員與中心距離,X3=任務與會員相對距離。根據散點圖特征選取多元回歸分析法,用SPSS求解,發現“會員代表與中心點的距離”的Sig.=0.940遠大于0.05,表明Y與X2(會員與中心距離)相關性不大,原因可能是會員離任務較近,接近步行距離,無需考慮其所處地段路況等。故剔除X2再次進行回歸分析,可知顯著性檢驗結果與檢驗統計量比對良好:β0=66.0239,β1=1.449,β3=-0.065 ,據此得到基本回歸方程Y=66.0239+1.449X1-0.065X3。
4 基于打包分配策略的定價模型優化
用K-means聚類算法對打包任務位置范圍劃分。將打包項目物品區域進行劃分,標準為各個任務位置點間距離最小和各個聚類的總需求量大致相等。完成打包項目物品區域劃分后,對單個聚類進行分析確定打包任務項編號。而為防止多人哄搶打包任務而致單個任務滯留,打包后的任務總定價應在原定價基礎下降ε%(此值可以通過BP神經網絡算法訓練得),算法條件舉例說明:若某地附近20個任務,其中10個打包,要保證該處會員單個下10單獲利少于打包10個。建模步驟:
(1)找出研究范圍中各需求點地理位置坐標;
(2)巧繪研究范圍中各需求點地理位置坐標圖并對各需求點編號;
(3)捜索出各需求點間最短距離;
(4)收集各需求點歷史需量數據,得到平均一天需求量;
(5)根據K-Means++算法對其求解。
配送區域劃分的核心思想是把n個任務項目點劃分成K個聚類,由于打包分配對時間要求很高,為保證時間窗,聚類的判別準測是使每個聚類中的任務點到該聚類中心的距離最小進行劃分處理,輸出優化的聚類結果
5 檢驗成果
用GPS定位新的任務和下單會員的位置經緯度,將之前的數據處理方式編程,加工后帶入公式:
Y=66.0239+1.449X1-0.065X3-ξ,其中,
ξ=(66.0239+1.449X1-0.065X3)×ε%
給出新定價,再根據APP數據調查,取同原來等數量樣本,規定“完成度=完成的任務項數目/總任務項數目”與原方案對比,發現完成度顯著提高
6 結論
基于位置數據處理的 “拍照賺錢”的任務定價,可考慮將物品位置,會員位置,會員與任務相對位置等因素綜合起來,將位置經緯度數據轉化為相對中心位置距離,通過回歸分析來轉化為定價;之后采用打包分配策略來優化定價模型。
參考文獻
[1]孫振宇.多元回歸分析與Logistic回歸分析的應用研究[D].南京信息工程大學,2008.
[2]周世兵,徐振源,唐旭清等.K-means算法最佳聚類數確定方法[J].計算機應用,2010,30:1995-1W8.
[3]趙興龍.基于K-means-遺傳算法的眾包配送網絡優化研究[D].北京交通大學,2016.
作者單位
1.華北理工大學理學院 河北省唐山市 063200
2.華北理工大學數學建模實驗室 河北省唐山市 063200
3.華北理工大學機械工程學院 河北省唐山市 063200
4.華北理工大學冶金與能源學院 河北省唐山市 063200