方弦
硬幣除了可以買東西,也可以用來解決各種爭端。據說,遇到不可調解的分歧的時候,為了作出決定,人們的首選是猜拳,其次是拋硬幣。足球場上開球方的決定,習慣上也是用硬幣決定的。除此之外,硬幣作為垂手可得的小道具,也能玩出各種花樣的小游戲。對于這些小游戲,你又知道多少呢?
硬幣正反不一樣
如果硬幣兩面是完全一樣的,顯然擲出正面或者反面的可能性是均等的。我們常說,正反面出現的概率都是0.5。那么,這里的“概率”是什么意思呢?
如果我們不停地投擲硬幣,并記錄下每次的結果,我們會發現正面出現的數量大約是全部的一半。投擲的次數越多,“出現正面”所占的比例就越接近0.5。這就是概率的含義:如果在許多次獨立的試驗中,某個特定的事件發生的比例會逐漸趨近一個特定的數值,那么這個數值就被稱為這個特定事件的概率。
我們可能覺得擲硬幣時,正反面出現的概率是一樣的,其實不然。由于設計的原因,硬幣正反面的花紋是不一樣的,從而也導致了重心與中心的微小偏差。以人民幣一元硬幣來說,正面是代表面額的1字,反面是菊花,重心稍微偏向反面;歐元就更麻煩了,不同的鑄幣廠會鑄出不同的背面花紋,重心偏向也因這些花紋而異。由于重心有偏向,所以擲硬幣時,正反面出現的概率也會有些偏差。幸好花紋導致的概率偏差非常非常小,在日常生活中往往可以忽略不計。
■
【歐元硬幣圖案一覽】
盡管可以忽略不計,但有沒有辦法修正這個偏差呢?換句話說,能不能找到一個方法,讓有偏差的硬幣產生無偏差的結果呢?
假設某枚硬幣擲出正面的概率是p,我們用以下的方法產生拋硬幣的結果:擲兩次硬幣,如果兩次的結果相反的話,取后擲出的為結果;否則重新擲兩次。更具體地說,如果結果是“反正”的話,那就當作擲出了正面,如果是“正反”的話,那就當作反面,如果是“正正”或者“反反”的話,那就重新再來。這樣的話,在一次嘗試中,結果為正面和反面的概率都是p(1-p),結果是完全公平的。
正反抵消不容易
擲100次硬幣,正面和反面相差多少次呢?1000次呢?10000次呢?現實中的硬幣,擲出正反面的概率略有偏差,但差別之小可以看作相同。你可能會覺得,擲出正面和反面的數目有很大概率是相等的。但事實如何?
雖然根據概率論中的大數定律,正反面出現次數的比應該很接近1,但這不代表正反面數目剛好抵消的概率很大。打個不太恰當的比方,地鐵相對來說是很準時的,但是要它一天提前或者延誤的時間剛好抵消的話,還是相當困難的。盡管得到正面和反面的概率相同,但是要它們恰好相互抵消,這也需要一點運氣。稍稍用點數學知識可以知道,拋2n次硬幣,恰好有n次正面n次反面的概率大概是1/nπ——√。當n越來越大,這個概率越來越趨近0。也就是說,雖然正反面出現的概率相同,但是它們恰好相等的概率會隨著拋硬幣的總次數變低,最后越來越接近0。
所以說,在表達數學問題時,一定要用精確的語言。意思上一點點微小的變動,也會產生截然不同的結果。我們說投擲硬幣時出現正面的概率是0.5,說的是在許許多多次投擲后,結果中正面所占的比例會非常接近0.5,投擲次數越多,比例越接近0.5。但這并不是說比例會非常湊巧地穩穩停在0.5。實際上,在很多情況下,這個比例會不停地在0.5周圍浮動,但浮動的幅度會越來越小,也會越來越靠近0.5。某幾次投擲之后正面恰好占一半,這種情況發生的機會反而很小。
誰先誰后輕松選
如果你跟你的小伙伴一起玩游戲要決定誰先誰后的話,拋個硬幣是個很好的解決方案。但是如果小伙伴不止一位的話,單靠硬幣可能就不太容易解決問題了。如果要從四個人里公平地挑出一個,擲兩次硬幣,將四種不同的結果(正正、正反、反正、反反)分別指派給每個人,擲出哪種結果就選哪個人,這種方法還是挺方便的。但如果只有三個人呢?
三個人的時候,有一種比較顯而易見的解決方法:同樣擲兩次硬幣,將正正、正反、反正三種結果指派給三個人,如果擲出的結果是指定的結果之一,那么就選出對應的人;否則,如果運氣不好擲出“反反”的話就重新開始另一輪硬幣的投擲。顯然這種方法保證了公平性,因為在每輪擲硬幣中,每種結果出現的概率是相同的。但會不會運氣不好,一連好幾輪都擲出“反反”,需要重新開始?
我們可以算一算。每一輪擲出“反反”重新開始的概率恰好是1/4,而n輪都出現如此情況的概率是1/4的n次方,當n越來越大的時候,這個概率很快地會變得越來越小。直觀看來,一輪不能決出結果的概率也不高,所以大概不需要拖上很長時間。更嚴格的計算表明,用這種方案從三個人中選出一個,平均只需要投擲8/3次硬幣就能完成,算上來大約比兩次多一點點,說明這種方法還是很有效的。
實際上,這種方法可以推廣到任意人數,而且也能證明,平均需要投擲硬幣的次數一定不會太多,隨著人數增長,平均投擲次數也會增長,但是要緩慢得多。
尼姆游戲有乾坤
硬幣除了能解決分歧,還能用來玩玩游戲。其中一種游戲非常有名,叫“尼姆游戲”。這個游戲的玩法很簡單,先將硬幣分成幾堆,然后兩個人輪流取硬幣,每次取硬幣只能從同一堆中取出,枚數不限,但至少要取一枚,取走最后一枚硬幣的就是贏家。
■
【尼姆游戲很流行的一個版本】
比如說,甲乙二人玩這個游戲,開局有三堆硬幣,分別有3、5、7枚。甲先取走第二堆中的4枚,每堆剩下3、1、7枚,接下來乙取走第三堆的所有硬幣,剩下的就分別是3、1、0枚。接下來甲只要取走第一堆中的2枚,留給乙的就是各自有一枚硬幣的兩堆。這時,乙只能取走其中一堆,而甲只需要拿走剩下的一堆就能獲勝。
從這個例子能看出來,尼姆游戲中沒有運氣的成分,每位玩家都能看清整個局勢,而玩家能采取的行動也是一樣的,區別只是在于一位先攻而另一位后守。在博弈論這一研究游戲取勝策略的數學分支中,這樣的游戲被稱為無偏博弈。也正是博弈論中的一個定理,賦予了尼姆游戲一個非常特殊的地位:任意給定一個無偏博弈,它都對應一個推廣了的尼姆游戲的特例。可以說,尼姆游戲中包含了所有的無偏博弈,比如象棋、圍棋等,盡管這些更為復雜的游戲,它們對應的尼姆游戲特例中可能有很多堆硬幣,每堆硬幣可能會很多,甚至有無窮枚,需要用更為抽象的“序數”來描述。
讓我們回到普通的尼姆游戲中。在之前的例子中,如果甲乙雙方都依照最好的策略來玩尼姆游戲,哪一方將會勝出,而勝者需要采取怎么樣的策略?這個問題就留給小讀者們思考了。給個提示:最優策略與二進制有關,如果只有兩堆硬幣的話,獲勝者與策略都比較明顯,如果有三堆甚至更多的硬幣的話,從簡單的情況開始,試驗一下,再觀察一下,將每堆的數量用二進制寫出來,到底滿足什么樣的條件,先走者會勝利呢?
硬幣陣列需策略
另一種與尼姆游戲很相似的硬幣游戲叫“大嘴巴”,英語里叫“Chomp”。尼姆游戲的戰場是一堆硬幣,而“大嘴巴”的戰場則是排成長方形陣列的硬幣。規則與尼姆游戲非常類似:一開始桌面上擺放著m×n的長方形硬幣陣列(比如說5×7),兩人輪流取硬幣,每次指定桌面上剩下的硬幣之一,然后將這枚硬幣以及它右下方的所有硬幣都取走(包括正右方與正下方),陣列左上方的硬幣是特殊硬幣,誰拿到手誰就輸掉整場游戲。
■
【3×5的大嘴巴游戲過程舉例】
雖然“大嘴巴”與尼姆游戲非常相似,但它們的性質相當不同。對于尼姆游戲而言,在不同的開局中,能取勝的玩家也不同,有的是先手必勝,有的是后手必勝,而且策略很容易算出來。但對于“大嘴巴”而言,除了一開始只放一枚硬幣的開局,對于所有開局來說,都是先手必勝。雖然證明并不復雜,但并沒有給出具體的獲勝策略。要知道具體的獲勝策略,目前還只能借助計算機的力量。所以,比起尼姆游戲,“大嘴巴”更有趣更復雜,更適合跟朋友一起玩。
叫上你的小伙伴,拿上一把硬幣,立刻探索一下簡單游戲的樸素樂趣吧!
(依據果殼網整合)