張希靚 秦琴 屠子美 姜金華 曹建清

摘? 要:該文首先陳述并分析了博弈論中的兩個非常經典的博弈模型(鷹鴿博弈和囚徒困境)。其次以上海第二工業大學測控技術與儀器專業CDIO班本科生為例,通過分析,闡述了教學過程中的師生博弈關系。最后對師生博弈關系進行反思,并給出了一種可能的解決方案。
關鍵詞:師生博弈? 博弈模型? 教學反思
中圖分類號:G633 ? ?文獻標識碼:A 文章編號:1672-3791(2019)12(a)-0129-02
Abstract: This paper states and analyses two classical adversarial models (The Hawk-Dove Game and Prisoners Dilemma) of game theory firstly. Then, taking the undergraduate students of Measurement & Control Technology and Instrumentation CDIO class of Shanghai Polytechnic University (SSPU) as an example, the adversarial relationship in the process of teaching between teachers and students is expounded by the analysis. Finally, we reflect on the adversarial relationship between teachers and students and give a possible solution.
Key Words: Teacher-Student Game; Models of Game Theory; Teaching Reflection
1? 常見的博弈模型
1.1 鷹鴿博弈
鷹鴿博弈(The Game of Chicken/The Hawk-Dove Game/Snowdrift Game)[1]源于博弈論(Game Theory),并且是一個經典的非合作、對稱博弈模型。該博弈模型的原則是存在互相對立的兩方,如果一方屈服,則另一方會收獲所有雙方的收益。例如,存在一場勇敢者的博弈游戲,博弈雙方分別為甲和乙。游戲規則是甲乙雙方開車相向運動(互相對立的雙方),哪方先轉彎(屈服)被認為是輸掉這場游戲,而另一方則會收獲雙方的博弈獎金(贏得雙方收益)。因此這個游戲也叫懦夫(Chicken)游戲。
通常分析博弈模型需要建立一個收益矩陣,那么鷹鴿博弈的收益矩陣如表1所示。
從表1可以看出,當甲乙雙方均不屈服的時候,結果是慘烈的,即相撞;當有一方屈服時,結果為另一方獲勝;而當雙方都屈服時,結果最理想是平手。然而,根據兩人博弈的思想,當一方不知道另一方會做何種選擇的時候,他/她會選擇在對方做出任何選擇的情況下,對他都是最優的選擇;而另一方也會遵循這個準則。因此他/她們雙方的博弈過程類似所謂的帕累托最優/帕累托效率(Pareto optimality/Pareto Efficiency)[2]。最終博弈的結果必然會導致雙方相撞,悲劇產生。根據博弈論的觀點這里的悲劇結果相當于穩定的平衡點即納什均衡(Nash Equilibrium)[3]。因此鷹鴿博弈與囚徒困境(Prisoners Dilemma)[4]有著本質的區別,盡管最后都會達到納什均衡。
1.2 囚徒困境
囚徒困境也是一個經典的非合作、對稱博弈模型。其基本模型描述如下。
有兩個獨立且理智的罪犯(甲、乙)被抓捕了,警察將他們單獨關押并單獨審問。警察給出的條件是:如果兩個罪犯互相供認對方,則雙方被判關押5年;若一方招供,而另一方拒不招供,例如,甲招供,乙不招供,則甲被釋放,而乙被關10年;如果雙方拒不招供,則均被釋放。所以收益矩陣如表2所示。
根據博弈論相關知識,最終甲乙雙方博弈的結果是均招供,即僅存在一個納什均衡點就是雙方均招供。
2? 教學中的師生博弈
以我們多年的教學經驗和上海第二工業大學測控技術與儀器專業CDIO班本科生的上課表現及期末考試成績為參考,筆者認為在本科教學中也存在著博弈,而且是種復雜的博弈關系。
首先大學本科教育的目的是為了讓學生更快速地適應社會,具有很強的自學習能力。然而由于高中教師的不正確引導(諸如上大學后就可以玩了之類的話語),導致部分大學生在大學之初并未認真刻苦地努力學習,而是得過且過地混日子。而大學的一二年級大部分課程均為基礎課,所以基礎打不牢,直接導致后邊的專業課程很難開展。其原因是有部分學生想學習,但是完全學不會(基礎沒有打牢);還有部分學生完全不學習;以及少數學生一直在努力學習。
教學過程的師生博弈原理闡述如下:教師被要求要保證及格率,所以在不知道學生是否屈服(課上和課下努力學習)的情況下,只能通過屈服(放水)來達到納什均衡(確保及格率),此時相當于囚徒困境;學生之間相當于存在一個帕累托最優,即如果大部分學生由于之前的經驗(不努力也可以得到很高的績點),會導致一部分學生向著不努力學習的方向演化,從而迫使教師屈服(放水),進而得到收益(高績點)。因此最終的博弈結果是大部分教師選擇屈服(放水),讓學生不努力也可以拿到高的績點。然而,師生博弈還存在另一種情況,即:一旦有少數教師為了學生的未來而選擇不屈服(不放水),就會導致極高的不及格率,面臨學校和學生(存在部分極端學生的威脅等)雙方的壓力,此時就形成了典型的鷹鴿博弈。
綜上所述,大部分情況下的師生博弈是屬于鷹鴿博弈的教師屈服的情況(即教師為鴿方,而學生為鷹方),或者說是達到了囚徒困境的納什均衡點;但是也存在少數情況,即鷹鴿博弈的納什均衡點(教師和學生互不相讓,均為鷹方),其結果是學生大部分不及格,而教師受到學校和學生雙方的壓力。我們將以上兩種可能歸納為師生博弈,其收益矩陣如表3所示。
3? 教學行為的反思
通過上述教學行為的師生博弈分析,我們反思一下我們的教育教學過程及行為。教學的目的是為了保證及格率還是為了學生真正可以學到有用的知識?教師屈服是否是正確的選擇?不努力的學生也可以拿到高的績點,是否是對其他學生的教育公平?其他學生看到這些不努力的學生的狀態進而受其影響轉化為不努力的學生,這樣的情況是否應該被鼓勵?
我們通過對上述反思的討論發現:盡管教學中存在師生博弈,且該博弈過程近似于鷹鴿博弈,只要能善于利用鷹鴿雙方關系,將教師轉變為鷹方而將學生變為鴿方,我們依然可以完成預定的教學目標。如果從大一開始讓學生們認識到他們是鴿方,那么學習風氣必然會變好,他們也必然會打下堅實的基礎。
4? 結語
綜上所述,只有教師成為教學中的鷹方,才能保證教學的質量和意義。學校更應該成為教師的堅強后盾而不是因為少數校鬧而讓教師變成鴿方。
參考文獻
[1] Hamlin A,Sugden R.The Economics of Rights,Co-operation and Welfare[M].The economics of rights,co-operation and welfare,2004.
[2] Barr,Nicholas.Economics of the welfare state[M].Oxford university press,2012.
[3] De Fraja G,Oliveira T,Zanchi L.Must Try Harder: Evaluating the Role of Effort in Educational Attainment[J].Review of Economics and Statistics,2010,92(3):577-597.
[4] Hilbe C,Nowak M A, Sigmund K.The Evolution of extortion in Iterated Prisone's Dilemma games[J].Proceedings of the National Academy of Sciences,2013,110(17):6913-6918.