陳健利
(貴州財經大學商務學院 貴州 黔南 550600)
教育部關于高校輔導員24號文件[1]指出:“高校輔導員是開展大學生思想政治教育的骨干力量,是高等學校學生日常思想政治教育和管理工作的組織者、實施者、指導者;是學生成長成才的人生導師和健康生活的知心朋友。”由此看出,如果高校輔導員與學生都想取得一定的成績,得到應有的成就,兩者之間不單單是社會上的委托代理或利益關系,更多的應該互相合作的關系。本文將利用有關的博弈知識分析高校輔導員與學生之間的可能存在的合作關系。
在高校,學生在校期間擔任的職位、獲得的榮譽、樹立的觀念等與綜合能力、綜合素質構成對其評價的體系,輔導員在學生成長生涯中占據不可替代的位置,則學生會與輔導員教師合作,希望能夠得到輔導員更多的指導與關注。另外,許多高校輔導員為剛畢業或畢業不久的年輕人,希望能夠得到學校、同事及學生的認可;高校績效考核和職位晉升都與學生的綜合情況有關,所以,高校輔導員也希望和學生進行合作。在高等教育迅速發展的背景下,高校都需要能力強、素質高的輔導員隊伍,為了加強輔導員隊伍的建設,會對輔導員制定相關的激勵機制,鼓勵他們全心全意為學生服務、努力提高自身的本領。因此,高校輔導員和學生可以達成協議,進行合作達到雙贏。
由于高校輔導員與學生之間是雙向委托代理的關系,所以可以看作雙向博弈。輔導員和學生都有兩個決策可以選擇:合作與不合作。如下表1所示,若兩者都選擇“合作”,則雙方都能得到由合作帶來的好處,獲得的收益均為A;若兩者都選擇“不合作”,則雙方都會有所損失,獲得的收益均為B;若只有一方選擇合作,則選擇“合作”的一方將會被選擇“不合作”的一方占便宜,雙方獲得的收益分別為M、N。

表1 師生博弈
假設兩者都是理性的,都站在各自的角度考慮自身的得失。則可能的結果有:當對方合作而自己不合作時,占對方的便宜得到收益N;雙方都合作均得收益A;雙方都不合作均得收益B;自己合作而對方不合作,自己吃虧只得收益M。則有N>A>B>M,且如果兩者只考慮自身所得收益都會選擇不合作,即最后的均衡為策略(不合作,不合作)。若假定雙方合作的總收益大于只有一方合作的總收益,即A+A>M+N,則兩者之間的這種博弈就是博弈論中經典的囚徒困境。
上面給出了輔導員與學生兩者之間博弈的戰略式表述,即簡單地給出了兩者可以選擇的戰略。實際上,輔導員和學生都可以根據對方的策略來調整自己下一階段的決策,即兩者之間的博弈應該是動態博弈。
輔導員和學生均為理性人,即一方做出決策后,另一方可根據其表現和自身的收益來做出決策。下面對兩者進行動態博弈分析。
若學生可以從歷屆學生及校方了解輔導員教師的所有信息;輔導員教師也可以根據學生以前的表現、帶過這些學生的教師及學校對學生評價充分了解學生,即兩者之間的博弈是完美信息動態博弈。為了充分研究輔導員與學生之間是否合作,將考慮輔導員和學生分別先進行決策這兩種情況,博弈過程見圖1和圖2。

圖1 輔導員首先進行決策的博弈樹

圖2 學生首先進行決策的博弈樹
一般情況下,在博弈樹末端的向量中第一個數字表示“第一個”決策者的收益,第二個數字表示“第二個”決策者的收益。在圖1中輔導員先進行決策,即學生的決策行動在輔導員決策之后,學生可以根據輔導員的決策來選擇自己的策略,即學生的策略在輔導員選擇策略后被唯一確定:若輔導員選擇合作,則學生最好選擇不合作;若輔導員選擇不合作,則學生最好選擇不合作。按照同樣的分析,在圖2中學生先進行決策,即輔導員的決策行動在學生決策之后,輔導員可以根據學生的決策來選擇自己的策略,即輔導員的策略在學生選擇策略后被唯一確定:若學生選擇合作,則輔導員最好選擇不合作;若學生選擇不合作,則輔導員最好選擇不合作。
由此可知,不論是輔導員先進行決策還是學生先進行決策,雙方都會選擇不合作,這與靜態博弈下的均衡結果一致。但是,無論從實際還是理論上,即根據總體收益最大化原則及高校對輔導員的相關激勵機制,雙方都選擇合作時總效用最大,才能達到雙贏。
雖然輔導員教師及學生都對對方有一定的了解,但是學生和輔導員教師在不同的情況及時間就會有不同的行為,但是這些都是未知的,所以,雙方之間的信息是不完全的。輔導員與學生之間的不完美信息動態博弈圖3與圖4。

圖3 輔導員首先進行決策的博弈樹

圖4 學生首先進行決策的博弈樹
在不完美信息動態博弈中,由于信息不對稱,后決策者不知道先決策者的行為,其兩個決策點屬于同一個信息集(在同一個虛框內)。輔導員和學生的類型均有合作與不合作,兩種類型的概率分布已知。后決策者根據先決策者的行動,修正自己的先驗概率,做出最優的策略。
根據實際情況,只有輔導員教師和學生共同合作,一起努力才能獲得雙贏,所以下面將以相關的博弈模型進行定量分析。
學生合作是指學生配合輔導員教師工作、認真學習、參加相關活動、競賽等自主地努力提升自身的綜合能力和綜合素質。輔導員合作是指輔導員及時引導學生學習、參加相關活動,關注學生的學習、生活、思想等各方面的發展,并給予學生參加相關活動的機會,等等。
設學生合作與不合作的概率分別為α,1-α,合作時的效用為US1,合作成本為CS(CS>0);不合作時的效用為US2(0<US2<US1)。輔導員合作與不合作的概率分別為β,1-β,合作時的效用為UT1,合作成本為CT(CT>0);不合作時的效用為 UT2(0<UT2<UT1)。輔導員在合作時都希望自己的學生能夠配合,希望付出能夠有收獲,所以輔導員會對學生的行為進行監督,監督成本為C(C>0),若學生被發現存在不合作的行為的概率為ps,被發現了后會受到γ(γ>0)的處罰(比如:適當地降低綜合素質成績、減少給予的指導、減少獲得獎學金的機會等等)。如圖5是輔導員與學生之間的博弈樹。

圖5 輔導員與學生之間的博弈樹
根據博弈樹可得:
輔導員的期望收益為:

學生的期望收益為:

則輔導員與學生的期望效用最大化的一階條件分別為:
δUT/δβ=0;δUS/δα=0
解之得混合策略納什均衡為:

即輔導員與學生分別以α*、β*概率進行合作
對混合策略納什均衡中的相關因素進行分析
1.公式α*=(UT2+CT+C-UT1)/C
(1)當學生合作的概率α*越大時,輔導員進行合作的效用UT1及以防學生不合作給自己造成損失進行監督的成本C越小,不合作時的效用UT2及合作時的成本CT就會越大,則輔導員就會選擇不合作,而讓學生自主努力。即在學生對自己有所規劃、能夠主動地認證學習和鍛煉自己的能力時,輔導員很輕松地工作就可以得到很高的效用。但是,每個學校都有一定的激勵機制,在學校及相關教育制度和職業道德的束縛下,只要學生努力學習、自主地鍛煉能力,作為輔導員教師都會盡心盡力地為學生服務。
(2)當輔導員進行合時的效用UT1及以防學生不合作給自己造成損失進行監督的成本C越大,不合作時的效用UT2及合作時的成本CT就會越小,即輔導員努力引導自己的學生、鼓勵并提供學生一定的機會去鍛煉自己、提升自己時,學生合作的概率α*越小,即在大學中所有的事情都為學生計劃好,不讓他們養成自我約束、自我管理的好習慣,輔導員教師雖然很努力,但是學生對教師形成了依賴而不會努力提升自己的能力。
2.公式β*=(US1-Cs-US2)/[ps(US2-γ)]
(1)當輔導員合作的概率β*越大時,學生進行合作的效用US1及不合作時被發現以后的處罰γ越大,不合作時的效用與成本US2及合作時的成本CS就會越小,則即使不合作被發現了的概率ps較小學生也會選擇合作,這樣既配合了輔導員教師的工作,自己的能力也能大幅度地提升。
(2)當學生進行合作的效用US1及不合作時被發現以后的處罰γ越小,不合作時的效用與成本US2及合作時的成本CS就會越大,即學生就會選擇不合作時,輔導員教師進行合作的概率β*越小,即即使發現的概率ps較大學生也會選擇不合作時,輔導員教師在學生在屢教不改時將不會把所有的心力花在學生的身上。
無論是完全信息博弈還是不完全信息博弈,在決策者可以根據另一個決策者的行動做出最優的策略及高校對輔導員的激勵機制的背景下,輔導員與學生為了雙方能夠有更多的收益,雙方就會選擇互相合作,共同努力,在提高自身綜合能力的同時也可以提升高校的教育水平。