999精品在线视频,手机成人午夜在线视频,久久不卡国产精品无码,中日无码在线观看,成人av手机在线观看,日韩精品亚洲一区中文字幕,亚洲av无码人妻,四虎国产在线观看 ?

基于零模型的開源社區大眾生產合作網絡結構研究

2013-09-01 02:11:26曾進群楊建梅李欣榮
關鍵詞:生產模型

曾進群,楊建梅,陳 泉,李欣榮

(華南理工大學工商管理學院,廣東 廣州 510641)

一、引言

與以往的知識生產理論以企業組織作為研究對象不同,開源社區大眾生產是一種全新的生產模式,在這種模式中,大量的人彼此協作(通常是通過網絡手段)完成有價值的項目,且它具有兩個非常顯著的特征,一是在沒有物質激勵的條件下,大量程序設計人員廣泛參與;二是在沒有層級控制的條件下,參與者自發創造出質量卓越、高度復雜的項目。從這些特征來看,開源社區是一個典型的由人類活動構成的復雜系統[1],這就決定其不能采取簡單還原論的研究方法,而必須在了解個體行為及其相互作用機制的基礎上,從整體的視角,利用系統論的研究方法進行探討。近年來備受關注的復雜系統研究表明,大量復雜系統個體關系需要用網絡結構來描述,這些網絡結構存在著許多特殊的性質,如小世界、冪率度分布、不同的匹配關系及社團結構等,且這些相互作用結構對系統宏觀行為具有重要影響。2009年,《Science》雜志以復雜系統與網絡(complex systems and networks)為主題,發表一集專刊[2],其中,Barabasi教授在文章中指出,由于底層結構對于系統行為有著重大的影響,除非探討網絡結構,否則沒有辦法去理解復雜系統。因此,理解復雜系統行為應該從理解系統相互作用的網絡結構開始,對開源社區大眾生產而言,較好表征合作者網絡結構是理解開源社區大眾生產行為的重要基礎。

目前已經有不少的刻畫復雜網絡的拓撲結構各個側面特征的指標如結點度、度分布、平均距離、聚類系數、鄰結點平均度、同配系數等等。很多實際網絡的拓撲結構特征得到了研究。很多網絡,比如Internet網絡、萬維網、生物代謝網、食物網等的度分布呈現冪律分布而非隨機網絡的Poisson分布;一些實際網絡的平均距離比較小,聚類系數比較大;技術網絡和生物網絡更趨向于同配,而社會網絡趨向于異配。近年來,有些學者也將復雜網絡理論引入開源社區大眾生產合作網絡結構研究,文獻[3]等利用復雜網絡方法和自組織臨界理論對開源社區的自組織演化問題進行了研究[3],從這些研究來看,復雜網絡工具為開源社區大眾生產研究提供了新的視角,對我們理解開源社區大眾生產這種群體行為起到很大的幫助,但這些研究都僅僅是對建立了大眾生產合作網絡的復雜網絡模型,而沒有建立其相應的零模型。

所有這些從實際網絡得到的拓撲特征哪些是隨機的,哪些是受到某種約束機制形成的呢?現實網絡的拓撲結構是真的如此獨特還是它只是一個偶然性的樣本?其實這樣的問題在科學研究中普遍存在,我們觀察到的現象是否真的受到某種變量影響、受到某種機制影響還是它只是一種偶然性的集結。零模型的作用就在于此。零模型是在比較對象難以直接獲取的情況下,根據統計學理論利用數值算法或數理手段構建的,用于參照推斷的數據分布。復雜網絡零模型對于揭示并正確判斷其拓撲結構有著極其重要的作用,文獻[4][5]用隨機化實際網絡構造零模型的方法研究了基因調節網、捕食網、神經網、電路網和萬維網,發現了統計上顯著(P=0.01)的多個 3 結點和 4 結點模體[4][5];[6]應用零模型研究了生物細胞內部的分子網絡,確認了其異配性質。并解釋了細胞內部分子網絡穩健而不脆弱的原因正是這種異配性的存在[6];[7][8]基于零模型研究社團結構的劃分,找出了實際網絡中具有統計意義的社團結構[7][8]。

綜上,零模型已經成為探索復雜網絡結構特征的重要手段,本文結合零模型方法與復雜網絡模型,以Google Code開源社區為例,對開源社區大眾生產合作網絡進行研究,文章主要分為以下幾部分:首先介紹開源社區大眾生產合作網絡的構建,其次介紹零模型的構建方法,然后基于零模型確定大眾生產合作網絡結構的特征參數并挖掘其結構與行為的關系,最后給出結論。

二、復雜網絡模型的構建

(一)Google Code開源社區簡介

Google Code開源社區于2005年的3月第一次公開亮相,當時僅有8個API(應用層)的連接,經過幾年的發展,谷歌開源已經成為一個開放的項目托管平臺,能夠提供版本控制、問題跟蹤、下載托管等工具。目前該開源社區提供的API接口數字已經超過了60個。另外,還有超過6萬個開源項目在該社區扎根,每天有超過17000個代碼確認。谷歌自己也有超過800個項目列于其中,包括 Android,Chrome,Chrome OS和 GWT這四個超過100萬行代碼的巨型項目。

(二)開源社區合作網絡的度分布

從Googel Code開源社區抽取的全部58762個有效項目作為研究對象[9]。

網絡模型構建的原則如下。頂點:每一個項目開發者(以ID表示)為一個頂點。邊:如果兩個項目開發者參與了同一個項目,則在這兩個開發者之間連一條邊。這樣得到的大眾生產合作網絡共有67732個頂點,253640條邊。

在所有頂點中共有31205個節點的度值為0,也就是說這些點為孤立點。除掉這些孤立點,共有36527個頂點,其度分布如圖1所示。冪指數在[2,3],這說明該網絡中存在較少的HUB節點和大量度值很小的節點,其同時具有魯棒性和脆弱性。

圖1 累計度分布曲線

三、零模型的構建

(一)零模型中隨機化網絡的生成算法

文獻[10]為了模擬實際網絡,從度相關的角度系統整理了復雜網絡拓撲特性,引入了dK級數(dK-series)的概念。d=0、1、2、3時分別表示節點數和邊數相同、度序列相同、聯合度分布相同(同配系數相同)和三結點連接方式相同(聚類系數相同)的隨機圖。提出了生成dK階隨機圖分布的數值算法,為生成高階隨機圖提供了選擇。

在實際應用中,要構造出具有d階所有隨機化網絡幾乎是不可能的。一種解決辦法是構造出具有d階的典型網絡,它是完全隨機地從所有具有d階的隨機化網絡中選取的,一種常用的辦法是針對給定網絡G采用隨機重連算法來構造出與網絡G具有相同d階特性的隨機網絡集。

對于0階零模型,采用E-R隨機圖作為參照系,即保證隨機網絡與實際網絡的節點數、邊數及平均度不變,生成隨機網絡集。

對于1階零模型(即保持網絡的1階特性,網絡節點的度序列不變),采用隨機重連算法進行構造,如圖2所示,隨機選定一對邊,分別連著k1和k2,k3和k4,若k1和k4,k2和k3無連邊,則交換連接;如果有連邊,則重新隨機挑選一對邊,這樣四個節點的度均保持不變,故網絡的節點度分布也保持不變。

圖2 1階零模型的隨機重連過程

(二)基于零模型的復雜網絡拓撲模式推斷

有了用數值方法生成的隨機圖總體樣本,可推斷實際網絡的拓撲特征。

一般地,假設我們關心實際網絡的j拓撲結構指標為N(j),相應的零模型總體該指標的平均數為。零假設可以設定為:

計算出零模型j指標的標準差σr(j),構造差異性統計量Z分數:

假設Nr(j)服從正態分布,那么Zj服從student分布,可以得到差異性統計量出現的概率p,如果p小于設定的顯著性水平比如0.01,我們可以在統計上推斷實際網絡j指標的性質。

另外,有時也用另外一種方式進行統計分析,即統計零模型總體中每一個隨機網絡的j指標值Nr,i(j)大于N(j)的次數m,假設生成的網絡數為n,再根據兩者的比值與選定的顯著性水平進行比較來推斷實際網絡j指標的性質。

四、基于0階零模型的大眾生產合作網絡結構分析

保持網絡節點數、邊數及平均度不變,按照零模型的構建算法本文共構建了1000個隨機化網絡集,按照上文的方法計算這個隨機化網絡集的集聚系數和平均最短路徑長度的平均值,各參數計算結果如表1所示。

表1 靜態參數對比表

從計算結果及式(1)來看,實際網絡的集聚系數比生成的隨機化網絡的平均集聚系數大了約30000倍,拒絕原假設,可以認為實際網絡的集聚系數指標不是來自隨機網絡,而平均最短路徑大小差不多,可以接受原假設,也就是說平均最短路徑并不是實際網絡特有性質,在隨機網絡中平均最短路徑也可以很小。此外,實際網絡度分布形式為典型的冪率分布,拒絕原假設,由此0階零模型從統計意義上證明了開源社區大眾生產合作網絡具有小世界與無標度特性。

Uzzi和Spiro[11]在其研究中定義了小世界商數來描述小世界性的顯著程度,小世界商數Q=CC ratio/PL ratio(實際網絡的PL/隨機網絡的PL,記為PL ratio,實際網絡的CC/隨機網絡的CC,記為CC ratio,其中PL為最短路徑長度、CC為平均集聚系數),并指出小世界商數越大,小世界性越顯著,且小世界性對績效有著顯著性的影響,本文的開源社區大眾生產合作網絡小世界性商數為30326,說明該合作網絡小世界性非常顯著。在小世界網絡中,由于較高的聚簇程度,會促成節點間相互的信任和更緊密的合作,從而提高信息交流的效率和準確度,又由于較小的平均路徑長度,使得節點可以方便的從遠距離的節點處獲取新鮮的,非冗余的信息,從而激發出靈感。具有這種結構的社會合作網絡被廣泛認為是可以提高信息交流傳遞效率和質量,能更好的激發節點的創造力,進一步說明開源社區大眾生產能以驚人的速度創造出質量卓越、高度復雜的項目可能與該合作網絡顯著的小世界性有著極大關系。

五、基于1階零模型的合作網絡結構分析

(一)配對性

網絡的凝聚性是高一階的性質,它與度分布以及網絡鄰節點的連接方式(度相關性)緊密相關。文獻[12]將度高的節點傾向與度高的節點相互連接或度低的節點傾向與度低的節點相互連接的現象稱為同配,度高的節點傾向與度低的相互連接稱為異配,并定義了相關函數。文獻[6]重新定義了基于零模型的兩個參數:

很少學者對大眾生產合作網絡的配對性進行研究,保持度序列不變,按照零模型的構建算法本文共構建了1000個隨機化網絡集,對大眾生產合作網絡的配對性進行研究,從圖3、4可以看出,比值較大的區域主要集中在對角線附近,也就是說大眾生產合作網絡是典型的同配網絡,這也說明大眾生產者合作次數多的傾向于與合作次數多的合作。

圖3 R(K1,K2)分布圖

圖4 Z(K1,K2)分布圖

(二)模體探測

網絡模體是滿足下列條件的子圖[5]:①該子圖在實際網絡中出現的次數Nreal不小于某個下限U,如U=4。②該子圖在實際網絡中出現的次數Nreal明顯高于它在隨機網絡中出現的次數Nrand,一般要求(Nreal-Nrand)>0.1Nrand。③統計該子圖在隨機網絡中出現的次數與它在實際網絡中出現次數,按式(2)、(3)進行統計分析。當前研究表明,網絡模體有助于人們從局部結構上理解復雜網絡生長和演化機制。

本文按照零模型的構建算法共構建了1000個隨機化網絡集,依據上文的模體的定義,對開源社區大眾生產合作網絡模體進行計算,計算結果如表2所示。

表2 模體探測結果

從計算結果來看,開源社區大眾生產合作網絡模體為有3、7、8、9號模體,那么為什么這些子圖在實際網絡中出現的頻率比隨機化網絡高得多呢?本文認為可以從網絡同步性及開源社區大規模協作現象得到部分解釋。

同步是一種自然現象。它通常指至少兩個振動系統相位間的協調一致現象。關于同步現象最早的研究可以追溯到1673年惠更斯關于耦合單擺的同步現象的觀察。實際上,若干個耦合單元之間通過相互作用達到同步的現象在許多領域中屢見不鮮,在社會學領域中,同步現象也被用作解釋形成社會集體行為的機理。文獻[13]對模體同步性進行研究,結果如表3所示,比較表2、3發現,實際網絡中的探測出顯著性模體是所有三節點、四節點模體中同步能力最強的四個,開源社區合作涌現可能與這些模體有著重要的聯系。

表3 不同模體結構的耦合強度值(文獻[13])

(三)社團結構探測

網絡中的社團結構是指在社團內部,節點之間的聯系非常緊密,而社團之間的聯系相對而言比較稀疏。尋找社團結構并對其進行分析是了解現實生活中各種網絡組織結構的一種很重要的方法,并在生物學、計算機科學以及社會學等領域都有著廣泛的應用。如社會網絡中的社團結構使得人們能夠清晰地了解他們區別于其他社團的一些特質或者信仰等;在生物分子反應網絡中,聚合到一起形成功能性模塊的節點往往擔當特定的角色或具有特定的功能[14]。但是如果我們找到的社團結構在同等條件下隨機網中也存在,那么這些社團就應該歸屬偽社團,而不是我們統計意義上的社團結構,這些社團結構對我們研究復雜網絡的屬性沒有實際意義,本文采用零模型方法[7]對開源社區合作網絡的社團結構進行計算,從計算結果來看,整個網絡存在層次性,即存在“社團中的社團”,第一個層次可劃分社團4922個,但是與隨機網比較僅僅只有363個具有顯著性水平,也就是說大部分社團在隨機網中也存在,第二層次共有子社團5571個,且每個社團都具有顯著性水平,平均每個社團含6.4個節點,獨立節點(未分入社團)占0.0426,也就是說Googel Code社區大眾生產合作網絡中合作者社團一般為6-7人。

六、結論

生產者之間關系是影響生產者行為的主要的因素,從大眾生產合作網絡中可以研究出生產者的行為變化規律和網絡的演化規律等。生產者之間的良性相互協作推動了產品的創建、優化與完善,對開源社區來說生產者之間的合作關系直接決定了項目的成敗。

本文以Googel Code社區所有項目為研究對象,依據項目合作關系建立了開源社區大眾生產合作網絡,并建立了相應的0階、1階零模型。利用0階零模型從統計意義上證明了大眾生產合作網絡具有小世界、無標度特性。利用1階零模型證明了該網絡的同配性特性,即度值大合作者的傾向于與度值大的連接,這可能跟軟件行業的技術有關,不同背景生產者互相配合更能合理的完成任務。

此外,本文還利用1階零模型探測大眾生產合作網絡的三節點和四節點模體及社團結構,從探測的模體來看,這些模體都是同步能力較強的子圖,開源社區大眾生產合作涌現性跟這些模體有著緊密的聯系。從社團結構來看,合作者網絡存在“社團中社團”現象,且具有顯著水平的社團大小一般為6-7人,下一步可以進一步對這些模體與開源社區大規模協作的關系及社團所體現的意義進行進一步的研究。

[1]楊建梅.人類活動系統的復雜性與管理[J].華南理工大學學報社科版,2011,13(4):1.

[2]JASNY B R,ZAH N L M,MARSH ALL E.Special issue on complex systems and networks[J].Science,2009,325(5939):405-432.

[3]潘向東,楊建梅.開源社區穩定性研究[D].華南理工大學工商管理學院,2009.7.

[4]R.Milo et al.,Superfamilies of evolved and designed networks,[J].Science,2004,303:1538-1542.

[5]R.Milo et al.,Network motifs:simple building blocks of complex networks,[J].Science,2002,298:824-827.

[6]S.Maslov and K.Sneppen,Detection of topological patterns in complex networks:correlation profile of the internet,[J].Physica A,2004,333:529-540.

[7]A.Lancichinetti,F.Radicchi,and J.J Ramasco,Finding statistically significant communities in networks[J].PloS one,2011,6:e18961.

[8]A.Lancichinetti,F.Radicchi,and J.J Ramasco,Statistical significance of communities in networks[J].Physical Review E,2010,81(4):046110.

[9]李欣榮,楊建梅.百度百科與Google開源社區生產合作網絡比較研究[D].華南理工大學工商管理學院,2011.7.

[10]Mahadevan P,Krioukov D,Fall K,et al.Systematic topology analysis and generation using degree correlations[J].ACM SIGCOMM Computer Communication Review,2006,36(4):135-146.

[11]Brian Uzzi,Jarrett Spiro,Collaboration and Creativity:The Small World Problem[J],American Journal of Sociology,2005,02,447~504.

[12]M.E.J.Newman,Assortative mixing in networks,[J].Physical Review Letters,2002,89(20):208701.

[13]Moreno Y,Vazquez Prada M,Pacheco A F.Fitness for synchronization of network motif.Physical A,2004,343:279 ~287.

[14]汪小帆、李翔、陳關榮編著,復雜網絡理論及其應用[M],清華大學出版社,2006.

[15]狄增如,系統科學視角下的復雜網絡研究[J],上海理工大學學報,2011,02:111~116.

[16]廖開際,趙興廬,楊建梅,基于耗散結構理論的知識大眾生產系統演化機制研究[J],科學學與科學技術管理,2009,07:106~110.

[17]Rossi M.A.Decoding the Free/Open Source Software Puzzle:A Survey of Theoretical and Empirical Contributions[J].The Economics of Open Source Software Development,2006:15-55.

[18]Siobhán O’Mahony.Guarding the commons:how community managed software projects protect their work[J].Research Policy,2003(32):1179-1198.

[19]Lerner J.& Tirole J.Some Simple Economics of Open Source[J].Journal of Industrial Economy,2002,50(2):1-55.

[20]Riedinger J.M.,Lizard S.,Coudert B.,& Barillot I.Intérêt clinique du calcul des pentes de variation du CA 125 pour la surveillance biologique des tumeurs épithéliales ovariennes[J].Immuno-analyses & Biologie Spécialisée,1999,14(4):244-250.

[21]Waring T.,& Maddocks P.Open Source Software implementation in the UK public sector:Evidence from the field and implications for the future[J].International Journal of Information Management,2005,25(5):411-428.

[22]Jing Wang,The Role of Social Networks in the Success of Open-source Software Systems:A Theoretical Framework and an Empirical Investigation[D],Kent State University,2007.5.

猜你喜歡
生產模型
一半模型
重要模型『一線三等角』
用舊的生產新的!
重尾非線性自回歸模型自加權M-估計的漸近分布
“三夏”生產 如火如荼
S-76D在華首架機實現生產交付
中國軍轉民(2017年6期)2018-01-31 02:22:28
3D打印中的模型分割與打包
FLUKA幾何模型到CAD幾何模型轉換方法初步研究
安全生產重于泰山
Сварочное Проμзвоσсmво(《焊接生產》)2012年第5期要目
主站蜘蛛池模板: 亚洲二区视频| 极品尤物av美乳在线观看| 日本少妇又色又爽又高潮| 人人妻人人澡人人爽欧美一区| 内射人妻无套中出无码| 手机在线免费不卡一区二| 精久久久久无码区中文字幕| 九九热精品视频在线| 国产精品女在线观看| 亚洲大尺度在线| 成人噜噜噜视频在线观看| 无码有码中文字幕| 亚洲人妖在线| 久久黄色毛片| 欧美日韩亚洲国产主播第一区| 亚洲欧美日韩天堂| 制服丝袜一区| 中文字幕永久视频| 性视频久久| 都市激情亚洲综合久久| 99视频免费观看| 一级毛片在线直接观看| 国产一区成人| 国产成人精品一区二区免费看京| 国产高清又黄又嫩的免费视频网站| 国产日韩欧美视频| 亚洲bt欧美bt精品| 亚洲第一黄色网| a色毛片免费视频| 丝袜国产一区| 国产在线观看99| 欧美激情一区二区三区成人| 国产极品嫩模在线观看91| 一级毛片a女人刺激视频免费| 亚洲日韩日本中文在线| 亚洲天堂免费观看| 色成人亚洲| 米奇精品一区二区三区| 老司机精品99在线播放| 成人夜夜嗨| 久久国产精品娇妻素人| 欧美人人干| 伊人久综合| 8090午夜无码专区| 国产乱视频网站| 国产精品99在线观看| 99re经典视频在线| 亚洲人妖在线| 午夜老司机永久免费看片| 毛片网站在线播放| 日韩不卡高清视频| 青青青视频免费一区二区| 东京热高清无码精品| 国产成人精品一区二区三在线观看| 亚州AV秘 一区二区三区| 国产成人做受免费视频| 欧美区国产区| 日本爱爱精品一区二区| 一级毛片高清| 国产不卡在线看| 麻豆国产精品一二三在线观看| 在线国产欧美| 天天爽免费视频| 在线观看免费AV网| 伊人激情久久综合中文字幕| 九色视频最新网址| 国产拍在线| 日韩大乳视频中文字幕 | 亚洲一区国色天香| 国产成人综合久久精品尤物| 欧美在线精品怡红院| 久久无码av一区二区三区| 免费一级无码在线网站| 日韩精品高清自在线| 小说区 亚洲 自拍 另类| 亚洲国产AV无码综合原创| 国内嫩模私拍精品视频| 国产成a人片在线播放| 欧美另类第一页| 高潮毛片免费观看| 国产情侣一区二区三区| 色综合成人|