齊小英



摘要:隨著信息社會的到來,信息逐漸成為個體/組織的重要資產,而個體/組織所擁有信息的數量也是影響貧富分化的因素之一。因此,將經濟學中的基尼系數引入信息分布規律研究可以有效地刻畫信息不對稱現象。該文基于仿真方法和基尼系數指標研究信息分布的規律以及不同實驗參數對基尼系數的影響。研究結果表明,信息主體與信息量的關系基本上符合二八準則,并且呈現冪律分布特征;當信息主體數量越多,基尼系數則越小,即信息不對稱現象會逐漸減弱。
關鍵詞:NetLogo;信息分布;信息不對稱;計算機仿真
中圖分類號:TP391.9 ? ? ? ?文獻標識碼:A
文章編號:1009-3044(2020)17-0202-03
1問題的提出
在信息社會,個體/組織所擁有的財富量受很多因素影響,其中最重要的因素就是信息不對稱,一般個體獲得的信息越多,就越容易擁有財富。有學者曾提出,信息的分布規律體現著信息本身的二重性——它既是個人認知的基本材料,也是經濟發展的戰略資源。個人認知層面產生的交互效應復雜且難以量化,而且經濟社會發展影響個人認知,個人認知也反過來限制其信息的獲取和利用[1-2]。人類社會雖然是一個復雜的系統,但學者們往往都采用不同的定性和定量方法研究相關問題。經濟學領域為了測量財富分配的不平等,通常使用“基尼系數”指標。在本文中,此指標用來衡量信息不對稱。為了更加深刻地研究信息分布以及為減輕信息不對稱現象提供理論和實踐指導,筆者將通過仿真揭示信息分布的規律及對信息不對稱現象的影響。
2相關研究
筆者通過文獻調研,發現當前研究信息分布方面的文獻數量很多。研究學科大多分布在圖情、新聞、醫學等領域;研究主題主要包括計量分析、引文分析、冪律分布等;研究領域包括學術、社交媒體、企業等。在學術和決策方面,李?。?004)改進了傳統文獻計量學的研究方法和計量指標,并分析了網絡結構單元中學術信息的分布[3]。袁毅(2006)也研究了網絡結構單元中學術信息分布規律[4]。汪姝辰(2015)從高校圖書館出發,研究讀者借閱信息分布規律[5]。王宏鑫和劉洋(2018)探討了h-指數與信息計量分布規律關系[6]。上述研究結果表明,網絡環境中學術信息的分布呈現“集中—分散”規律。黃鑫(2011)研究了信息分布(團隊討論前所獲取的共享信息與未獲取的共享信息的比例)對團隊決策的影響[7]。在社交媒體方面,王曉光(2011)認為微博信息傳播規律分布符合“二八法則[8]。宋恩梅和朱夢嫻(2015)分析了"豆瓣電影"和"新浪微博"兩個平臺的電影評論信息的分布特征和規律,即社會化媒體的信息分布符合冪律分布[9]。方愛華和陸朦朦等(2017)以數字音樂為研究對象,分析信息分布規律,發現音樂市場整體呈現"分眾+長尾"趨勢[10]。田純(2019)基于洛特卡定律與布拉德福定律研究了用戶社會化標簽信息分布規律[11]。
宏觀理論方面,馬費成和裴雷(2003)總結并分析了網絡信息資源的集中分散規律、生產規律和時間分布規律等[12]。Oluseyi(2010)分析信息在三個不同時期(傳統社會、Web1.0和 Web2.0 )的分布都符合指數分布[13]。李鋆(2018)認為“信息冪律分布”研究分為三個層面:定性、定量和動力機制研究,其研究歷史總體經歷了 “由現象到本質,由宏觀到微觀,由定性到定量,由空間到時間,由結構到過程”的不斷深化過程[14]。物理學家Victor M.Yakovenko(2000)提出了一個最簡單的人工經濟模型:財富分布模型[15]。
總體而言,在研究內容方面,大多數文獻僅僅只是研究了信息分布的規律,并未深入研究信息分布和信息不對稱之間的關系。在研究方法方面,學者們通過定性或者定量的研究方法來研究信息分布的規律,很少使用仿真方法。同時,計量分析引用的大多都應用布拉德福定律、洛特卡定律等,未曾有學者引入基尼系數。因此,本文在前人研究基礎上,基于仿真并將基尼系數引入信息分布的研究是一個創新性的設計,可以彌補理論研究的局限性。
3模型的建立
在仿真模型中,每個信息主體都擁有特有的屬性以及一定的行為方式。隨著時間的不斷演進,主體之間交互作用,個體的屬性也隨之不斷變化,通過觀測復雜系統所表現出的宏觀現象,分析歸納其具有的規律。因此,通過仿真可以探究微觀個體行為與宏觀規律之間的聯系。
3.1社會信息交易的規則
假設在信息社會這個系統中,信息主體和信息總量保持不變。開始時,每個信息主體都有相同的信息量,每當兩個主體相遇,則隨機分布信息。有兩個交易主體M和N,交易之前所擁有的信息量為M1和N1, 各自的信息保留率為S1和S2。那么各自用來交易的信息為M1=(1-S1)* M1,N1=(1-S2)* N1。那么交易信息總共為M1+ N1,隨機分布之后的信息為M2=(1-δ)(M1+ N1),N2=δ*(M1+ N1)。意大利統計與社會學家Corrado于1922年提出了一個衡量收入分配不平等的指標——基尼指數(Gini)。信息不對稱(asymmetric information)指交易中的個體擁有不同的信息,始終處于一種不對稱的狀態[16]。信息不對稱之所以產生是因為不同個體獲取信息能力有所差異,而個體獲取信息的能力又與社會經濟因素有關[17]。因此,本文采用基尼系數來衡量信息不對稱。
3.2仿真流程
通過Netlogo 仿真模擬信息分布的過程,規定個體屬性與行為方式的基礎上,通過調整相關參數,進一步得到并分析仿真輸出。在仿真過程中,對現實世界的模擬是基于一定的假設基礎之上,現實世界中主體之間的行為與關系是錯綜復雜并且不斷變化的。因此,根據研究目的設置相應的情境,對現實世界進行邏輯的簡化,在文獻實證研究的基礎上盡量使得仿真模擬與現實的擬合度較強。
在初始化階段,設置信息主體、信息量,信息保留率,并使信息量平均分配到每個主體。在實施階段,主體之間進行交易信息,在獲得交易之后的信息量及基尼系數地可視化展示之后,分析信息分布的規律。最后,通過行為空間獲取不同參數實驗數據來分析信息分布和信息不平等的關系。如果此過程未成功,則繼續循環,返回去重新實施,直到得到計算結果,如圖1所示。
3.3實驗參數設置
本模型比較簡單,通過對參數的調節來模擬不同的仿真情景,具體的參數包括信息主體、信息量、信息保留率等。其中,信息主體范圍設定在0-1000,信息總量范圍設定在0-1000000,信息保留率是一個[0-1]的隨機數。具體設定如表1。
4仿真實驗和結果分析
4.1 仿真實驗
本模型對信息主體之間交易信息進行仿真,從而描繪出信息分布曲線、洛倫茲曲線以及計算出基尼系數。本模型具有以下特征:運行次數是可控的,并且按照時間步更新。通過運行得到信息分布(圖2)、洛倫茲曲線(圖3)以及基尼系數(圖4)等可視化圖。進一步為了探索具體的參數組合對信息分布的影響,通過行為空間(Behavior Space)工具收集數據。首先設置了不同的組合,信息量的組合[“total_information”[10000 10000 100000]]表示,初始值為10000,間隔10000,結束值為100000,信息主體同理,即[“num_agents” [100 100 1000]],并且每組運行重復2次,求基尼系數的平均值以減少誤差。
4.2 ?結果分析
隨機調整參數發現,當信息主體數量是229,信息量為121387時,洛倫茲曲線信息主體值為80.1%,信息主體值為20%,基本上符合二八準則,即80%的信息掌握在20%的信息主體手中,如圖3所示?;嵯禂祫t一開始快速增長至0.6以后,然后緩慢增長,隨后在0.659趨于穩定。在經濟學中,當基尼系數大于0.5時,則表示收入有很大差距。在本文中,基尼系數為0.659則表示信息社會中,信息確實是不對稱的。
隨后筆者通過Matlab軟件對數據進行了擬合,擬合效果大致符合冪律分布。雖然仿真周期不同,每次運行的結果也有所差異,但是經過筆者多次運行,發現誤差范圍都不大。為了高效的分析實驗結果,本文分析了實驗數據中1000,10000,100000信息量分別在對應的200,400,600,800,1000信息主體下的基尼系數變化。
圖5顯示,三條曲線的基尼系數一直呈先上升后下降的變化規律,大體上符合集中—分散規律。當信息主體數量時200時,信息量越小,基尼系數越大;當信息主體數量時400時,信息量越大,基尼系數越大;當信息主體數量時600、800、1000時,信息量越小,基尼系數越大。當信息量為1000和10000時,隨著信息主體數量增加,基尼系數也是先上升后下降,曲線有兩個峰值;當信息量為100000時,基尼系數也是先上升后下降,但曲線只有一個峰值。整體來看,當信息量越小時,隨著信息主體數量增加,基尼系數越大;當信息量越大,隨著信息主體數量增加,基尼系數越小。
結合理論和上述分析結果可知,隨著信息社會的發展,信息量必然是增多的,當信息主體增加時,信息不對稱現象會逐漸減輕。之前社會的信息不對稱需要企業等組織去對接,但如今信息技術替代了企業成為中介,社會主體由物質架構開始轉向知識架構。因此,各種新獨立個體經濟出現,如宣傳中國文化的李子柒、直播帶貨的李佳琦等,這導致了信息人才將成為未來社會的第一生產力,也就是信息主體。換句話說,筆者大膽猜測信息主體數量和信息不對稱現象有可能成反比,或許本實驗還不足以說明,但未來筆者將做更多實證研究進行驗證。
5結論和研究局限
本研究在借鑒前人研究的基礎上,基于仿真方法研究信息分布規律,并引入基尼系數分進一步分析二者之間的關系,進行了創新性的探索。本研究結論如下。
(1)信息分布基本上符合二八準則,并且呈現冪律分布特征。
(2)當信息量越大,隨著信息主體數量增加,基尼系數越小,信息不對稱現象會逐漸減輕,即信息主體數量和信息不對稱現象有可能成反比。
本研究的局限主要體現在。
(1)概念模型構建方面:本文雖然將基尼系數引入了模型,但是未考慮其他影響因素。因此,研究結果可能會有一些偏差,使實驗結果不能精確的反映現實情況。
(2)仿真實驗方面:雖然通過行為空間得到了實驗參數數據,但由于筆者理論知識不足,僅對其進行了簡單的統計分析,并未展開深入分析。
信息分布規律還是有很大研究空間的,尤其是引入了仿真研究方法后,可以為如何減輕信息不對稱現象提供借鑒。在未來的相關仿真研究中,可以融入更多的因素,考慮更多的可能情況,這樣可以使得研究具有更大的理論和實踐意義。
參考文獻:
[1] 于良芝.“個人信息世界”——一個信息不平等概念的發現及闡釋[J].中國圖書館學報,2013,39(1):4-12.
[2] 于良芝,周文杰.信息窮人與信息富人:個人層次的信息不平等測度述評[J].圖書與情報,2015(1):53-60+76.
[3] 李健.網絡結構單元中學術信息分布的計量研究[J].圖書情報工作,2004(1):44-47.
[4] 袁毅.網絡結構單元中學術信息分布規律研究[J].現代情報,2006(2):45-48.
[5] 汪姝辰.高校圖書館讀者借閱信息分布規律研究——以湖南師范大學圖書館為例[J].科技情報開發與經濟,2015,25(08):15-18.
[6] 王宏鑫,劉洋,黃麗珺,等.h-指數與信息計量分布規律關系探討[J].情報探索,2018(7):7-11.
[7] 黃鑫.情緒、信息分布對團隊決策的影響研究[D].湖南師范大學,2011.
[8] 王曉光.微博社區交流結構及其特征研究[D].上海:華東師范大學,2011:20.
[9] 宋恩梅,朱夢嫻.社會化媒體信息分布規律研究:以電影評論為例[J].信息資源管理學報,2015,5(3):25-36.
[10] 方愛華,陸朦朦,朱靜雯.用戶評論視域下數字音樂信息分布規律探析——以網易云音樂熱歌榜為例[J].出版廣角,2017(3):72-76.
[11] 田純.基于洛特卡定律與布拉德福定律的用戶社會化標簽信息分布規律研究[J].甘肅科技,2019,35(17):85-91.
[12] 馬費成,裴雷.網絡信息資源的分布規律[J].情報科學,2003(11):1121-1124+1169.
[13] Oluseyi M V, Gallop J D. Self-service and social media: communication hierarchy and message diffusion in participatory media[C]//2010 IEEE International Professional Comunication Conference. IEEE, 2010: 243-254.
[14] 李鋆.“信息冪律分布”研究的歷史邏輯及其現實意義[J].現代傳播(中國傳媒大學學報),2017,39(04):140-147.
[15] Dragulescu A, Yakovenko V M. Statistical mechanics of money[J]. The European Physical Journal B-Condensed Matter and Complex Systems, 2000, 17(4): 723-729.
[16] 趙麗娟,王大龍.基于信息不對稱理論的情報失察研究[J].情報探索,2012(10):1-4.
[17] 付云,孫振領.論競爭情報中的信息不對稱[J].黑龍江史志,2008(23):84-85.
【通聯編輯:朱寶貴】