文湖南省地質中學1303班尹耀辰
有趣的概率和“智豬博弈”現象
文湖南省地質中學1303班尹耀辰

日常生活或游戲中,人們有時會選擇拋硬幣或“石頭剪刀布”的方式來做出決定。這種方式究竟有沒有科學道理?通過概率試驗和研究“智豬博弈”模型,筆者探討了生活中的博弈現象。
生活中經常遇到一些無法預測結果的事,它們被稱為隨機事件。概率是描述隨機事件發生可能性大小的度量。瑞士數學家雅各布·貝努利被公認為是概率理論的先驅,他給出了著名的大數定律,闡述了隨著試驗次數的增加,頻率會穩定在概率附近的規律。
通過拋擲一枚一元硬幣,觀察它落地時哪一面朝上,對概率進行感知試驗。以100次為一組,分別拋3個100次,記錄硬幣正反面出現的頻數,然后計算得出概率。
試驗結果表明,投擲硬幣時,正反面出現的概率接近0.5,所以比賽或游戲中用拋硬幣的方式是公平的。當然,由于設計的原因,如果硬幣正反面的花紋不一樣,可能導致重心與中心的微小偏差。
《現代漢語詞典》將博弈論定義為“研究具有不同利益的決策者在利益相互制約情況下如何決策以及決策的總體效果的理論。”學者們認為,博弈論就是研究互動決策的理論,又稱為對策論。
“智豬博弈”模型由約翰·納什于1950年提出。假設豬圈里有一頭大豬和一頭小豬,豬圈一邊有飼料的出口和食槽,另一邊有一個踏板。每踩一下踏板,在遠離踏板的另一邊就有10個單位的豬食進槽。如果大豬先到槽邊,大小豬吃到食物的收益比是9∶1;如果大豬和小豬同時到達槽邊,大小豬的收益比是7∶3;如果小豬先到槽邊,大小豬的收益比是6∶4。但是,踩完踏板之后跑到食槽所需要付出的“勞動”,要消耗相當于2個單位的食物。
表1是大、小豬的“純收益”矩陣,可以看出豬的選擇。

表1“智豬博弈”模型
從矩陣中可以看出,當大豬選擇行動時,如果小豬也行動,小豬收益是1,而小豬等待的話,收益是4;當大豬選擇等待時,如果小豬行動,小豬收益是-1,而小豬等待的話,收益是0。綜合來看,無論大豬選擇行動還是等待,小豬的最好選擇都是等待,即等待是小豬的占優策略。反觀大豬,明知小豬不會去踩踏板,但由于踩踏板比不踩強,所以只好親力親為了。
“智豬博弈”模型給了競爭中的弱者——小豬以等待為最佳策略的啟發。在現實生活中,有許多“智豬博弈”的例子,它反映的是一種參與人地位不對等的博弈結構,這種不對等可以是參與人擁有的信息和支付函數,也可以是參與人所采取的策略和行動。
在股份公司中,大股東類似大豬,他們收集信息、監督經理,擁有決定經理任免的投票權;而小股東類似小豬,他們不直接花精力去監督經理,投票權重也往往無足輕重,但他們卻可以從大股東的監督中受益。
在技術創新市場上,大企業類似大豬,它們投入大量資金進行技術創新、開發新產品;而中小企業類似小豬,它們可能一時無法進行大規模的技術創新,但可以采取“跟隨策略”,等待大企業的新產品形成新的市場后,仿制大企業的新產品展開銷售。
在企業經營中,學會如何“搭便車”是一個精明的職業經理人最基本的素質。高明的管理者善于利用各種有利條件為自己服務。比如,小酒店開在大酒店旁邊,農家樂開在靠近風景區的地方等。
在教育系統內,教師同樣可以利用博弈論更好地指導學生開展協作學習。教師需要幫助學生樹立正確的協作態度和實行合理的評價制度,調整學生在合作中“搭便車”和“小團體主義”思想,解決學生個人與集體的矛盾以及個人與個人的矛盾。
諾貝爾經濟學獎獲得者保羅·薩繆爾遜說:“要想在現代社會做個有價值的人,你就必須對博弈論有大致的了解。”由于提供了在競爭環境下戰勝對手或合作共贏的嚴謹論證方法,博弈論在當代社會具有廣闊的應用空間。
