羅偉平+楊建梅



摘要:對于大眾生產的人類行為動力學的研究還不多。本文基于Barabasi的任務優先權排隊模型,研究Android開源社區的大眾生產與溝通行為,發現加入后位優先權增加的機制或者中斷機制的Barabasi優先權排隊模型,更能解釋該社區人類行為模式的生成機制。
關鍵詞:開源社區;生產行為;溝通行為;人類行為動力學;任務優先權排隊模型
中圖分類號:文獻標志碼:A文章編號:1009-055X(2016)06-0047-05
doi:10.19366/j.cnki.1009-055X.2016.06.008
一、引言
人類行為是復雜的。對人類行為研究涵蓋了心理學、社會學、人類學及統計學等諸多學科。[1]以往認為人的相鄰兩個行為的間隔時間服從指數分布。[3]因特網協議、路由器規則等都是以泊松過程為基礎設計的。[4]然而近期的人類行為的數據顯示,人的相鄰兩個行為的間隔時間并不服從泊松分布,而是服從長尾的冪律分布。2005年Barabasi提出了人類行為的冪律分布以及生成機制的任務優先權排隊模型[5]開創了人類行為動力學研究的先河。隨后Vazquez[6]等提出人類行為冪指數有1和1.5兩個普適類。名人通信[7-8]、在線游戲[9]、電影點播[10]、打電話與發短信等人類行為的間隔時間的分布均顯示出冪率現象。當然人類行為的時間間隔特性也存在其他分布的情況。[11-15]
學術界還進一步研究了人類行為冪率分布的生成機制。除了Barabasi的優先權排隊模型外,還有自適應調節模型[16]、習慣模型[17]、記憶模型[20]、興趣衰減模型[19-20]、截止時間模型[21,22]以及互動[23]模型等。
目前人類行為動力學的研究還較少涉及大眾生產領域。[24]本文基于Barabasi的任務優先權排隊模型,分析Android開源社區的大眾生產與溝通行為,發現加入后位優先權增加或中斷機制后的Barabasi模型更能解釋該社區生產與溝通行為的生成機制。
二、Android社區大眾生產與溝通行為的分析
(一)數據來源及處理
利用火車頭(LocoyPlatform)數據采集平臺,在googlecodehost的Android開源社區采集了16萬多條生產行為的時間數據和28萬多條溝通行為的時間數據。這里的生產行為定義為代碼的修改和提交行為,溝通行為定義為發帖或評論帖子行為。
(二)生產行為的間隔時間分布
按照生產次數的多少篩選出排名前十位的生產者,分別對其生產的間隔時間分析如表1和圖2所示。發現這些生產者的生產間隔時間服從冪律分布,冪指數在1.21與1.73之間,接近于Vazquez等提出的普適類指數1.5。
(三)溝通行為的間隔時間分布
同樣取溝通次數最多的前十名溝通者進行溝通的間隔時間分析,如表2和圖2所示,發現溝通的間隔時間同樣服從冪律分布,冪指數在1.33與1.57之間,更接近Vazquez等提出的普適指數1.5。
綜上,Android開源社區的生產和溝通行為的間隔時間均服從冪律分布,冪指數接近Vazquez等提出的普適類指數1.5。
三、生成機制研究
Barabasi的任務優先權排隊模型假設優先權始終不變,而現實中有些后位任務的優先權會隨著時間的推移而增加(這里稱之為后位優先權增加機制)。此外,現實中往往也會出現緊急的任務打斷優先權最高任務的處理(這里稱為中斷機制)。
下面在Barabasi優先權排隊模型的基礎上,分別加入后位優先權增加機制和中斷機制來探討Android開源社區的生產和溝通行為。
(一)加入后位優先權增加機制的仿真模型
加入后位優先權增加機制模型的具體做法是,在保持任務隊列優先權基本模型各個參數不變的前提下,在每一個更新時點,給任務隊列中比例為m(0 在m=1%、b為0.001,0.002,0.005,0.01的四種情形下,仿真出的生產與溝通行為的間隔時間均服從冪律分布,擬合優度均在0.92以上;四種情況對應的冪指數分別為1.7,1.5,1.4和1.2,與上文的實際間隔時間分布非常接近。值得注意的是,隨著b的增加,冪指數不斷減小;且b增加到一定程度后,時間間隔就不符合冪律分布了。如圖3所示。 (二)加入中斷機制的仿真模型 隊列優先權基本模型中,在每一步任務執行方式中,Barabasi討論了三種任務執行選擇機制:先進先出,隨機選擇和優先權選擇,他認為按照優先權選擇最重要,因此在模型設定時,增加了參數p來描述每一步任務執行時按照優先權選擇的概率,當p→1時,即表示完全按照優先權最高的方式來執行,當p→0時,即表示按照隨機選擇的方式來執行任務。考慮任務的執行方式選擇中,基本模型或者按照一定概率的優先權來執行,或者按照隨機的方式執行,圍繞的原則僅有優先權和隨機兩種選擇方式,最終的基本模型是以p→1時,即完全按照優先權最高的方式來執行,模型中并未考慮任務生成的時間先后順序這一情形。 按照時間管理的概念,人的活動任務均會按照“輕重緩急”的程度分為四類,一般的做法是按照最重要的事情先處理,然后處理次重要的事情。但與現實中的情形更為接近的是,經常會出現一些突發的緊急事件,需要我們拋開當前認為最重要的事情,轉而去處理該類緊急事情,也即最新發生的事情。從另一方面來說,生活中,并不是每個人都能很好地執行輕重緩急的時間管理概念。更多的情形是,人們會被當前剛發生的事情所打斷,轉而去處理最新發生的需要處理的事情,這一特點,更符合現實中的普通大眾行為。因此為了讓模型更加貼近現實情況,本文在基本模型的基礎上,加入中斷機制,以描述在優先權的任務執行方式中,偶爾會被最新出現的事情所打斷,轉而處理最新生成的任務。
仿真步驟如下:①設定優先任務被中斷的概率Q。②按照均勻分布生成隨機數作為概率q,當q>Q時,執行任務隊列中的優先任務,當q 在Q=20%的情形下,仿真結果顯示,加入中斷機制的間隔時間符合冪指數為1.5的冪律分布,擬合優度達到0.97。如圖4所示。同樣也與上節的實證結果較一致。 四、結束語 本文分析了Android社區中的人類行為動力學模式,發現生產和溝通行為的間隔時間服從冪律分布,其冪指數接近于Vazquez等提出的普適類。同時也探討了該社區人類行為的動力學機制,發現加入后位優先權增加機制或中斷機制能較好地解釋這些行為的生成機制。 參考文獻: [1]樊超,郭進利,韓筱璞,等.人類行為動力學研究綜述[J].復雜系統與復雜性科學,2011(2):1-2. [2]FELLERW.Anintroductiontoprobabilitytheoryanditsapplications[M].2rd,ed.NewYork:Wiley,1971. [3]HAIGHTAK.Handbookofthepoissondistribution[M].NewYork:Wiley,1967. [4]ANDERSONHR.Fixedbroadbandwirelesssystemdesign[M].NewYork:Wiley,2003. [5]BARABASIAL.Theoriginofburstandheavytailsinhumandynamics[J].Nature,2005,435:207-211. [6]VAZQUEZA,OLIVEIRAJG,DEZSOZ,etal.Modelingburstsandheavytailsinheavytailsinhumandynamics[J].PhysicalReviewE,2006,73(3):036127. [7]OLIVEIRAJG,BARABASIAL.Humandynamics:darwinandeinsteincorrespondencepatterns[J].Nature,2005,437:1251-1253. [8]LINannan,ZHOUTao.Empiricalanalysisontemporalstatisticsofhumancorrespondencepatterns[J].PhysicaA,2008,387:6391-6394. [9]HENDERSONT,NHATTIS.Modelinguserbehaviorinnetworkedgames[C].Proc9thACMInternationalConferenceonMultimedia.NewYork:ACMPress,2001:212. [10]ZHOUTao,KIETHAT,KIMB.J,etal.Roleofactivityinhumandynamics[J].Europhysicsletters,2008,82(2):28002. [11]胡海波,王林.冪律分布研究簡史[J].物理,2005(12):889-896. [12]RABERTOM,SCALASE,MAINARDIF.Waiting-timesandreturnsinhighfrequencyfinancialdata:anempiricalstudy[J].PhysicaA,2002,314:749-755. [13]QINW,JIN-LiG.Humandynamicsscalingcharacteristicsforaerialinboundlogisticsoperation[J].PhysicaA,2010,389:2127-2133. [14]YEW,CHANGSZ,Jing-HuaXiao,etal.Evidenceforabimodaldistributioninhumancommunication[J].PNSA,2010,107(44):18803-18808. [15]MAINARDIF,RABERTOM,GORENFLOR,etal.FractionalcalculusandcontinuoustimefinanceⅡ:thewaitingtimedistribution[J].PhysicaA,2000,287:4680481. [16]韓筱璞,周濤,汪秉宏.基于自適應調節的人類動力學模型[J].復雜系統與復雜性科學,2007(4):1-5 [17]焦玉,劉衍珩,王健,等.基于習慣的人類動力學建模[J].科學通報,2010,(11):1070-1076 [18]VAZQUEZ.A.Impactofmemoryonhumandynamics[J].PhysicaA,2007,373:747-752. [19]JINLG,CHAOF.Weblogpatternsandhumandynamicswithdecreasinginterest[J].TheEuropeanPhysicalJournalB,2010,1008:0042v3. [20]郭進利.博客評論的人類行為動力學實證研究和建模[J].計算機應用研究,2011(4):1422-1433. [21]鄧竹君,張寧,李季明.截止時間對人類動力學模型的影響[M]∥郭進利,周濤,張寧,等.人類行為動力學模型.香港:上海系統科學出版社,2008:29-34. [22]ALFIV,GABRIELLIA,PietroneroL.Howpeoplereacttoadeadlinetimedistributionofconferenceregistrationsandfeepayments[J].CentralEuropeanJournalofPhysics,2009,7(3):483-489. [23]OLIVEIRAJG,VAZQUEZA.Impactofinteractionsonhumandynamics[J].PhysicaA,2009,(388):187-192. [24]謝偉聰,楊建梅.維基百科貢獻者中的人類動力學模式[J].科學學研究,2010,28(10):1054-1058. Abstract:Toourbestofknowledge,therearefewresearchesfocusedonhumandynamicsofpeerproduction.BasedontheBarabasipriorityqueuemodel,thisessaydiscussesproductionandcommunicationbehaviorsinAndroidopensourcecommunity,findingthattheBarabasipriorityqueuemodelexpandedwithtailacceleratingorqueueinterruptionbetterexplainsthegenerativemechanismofhumanbehaviorsinthiscommunity. Keywords:opensourcecommunity;productionbehaviors;communicationbehaviors;humandynamics;priorityqueuemodel (責任編輯:潘江曼鄧澤輝)