康宏偉
(西南大學(xué)計(jì)算機(jī)與信息科學(xué)學(xué)院 重慶市 400715)
教育是一個(gè)國(guó)家發(fā)展進(jìn)步的基石,高校招生錄取制度作為一種高校的人才選拔制度,事關(guān)數(shù)千萬(wàn)考生的前途命運(yùn),決定了素質(zhì)教育平穩(wěn)健康地開(kāi)展,也體現(xiàn)了教育資源分配的公平公正[1]。而高考改革是當(dāng)前教育界討論的熱點(diǎn)話(huà)題,關(guān)于高考科目、高考內(nèi)容、高考錄取模式、高校招生計(jì)劃分配等問(wèn)題是其中的重點(diǎn)議題。其中涉及了高考是否公平、高考命題和錄取模式是否合理、招生計(jì)劃分配是否合理等等許多理論及技術(shù)層面上的問(wèn)題[2]。
這些年來(lái),我國(guó)的高考制度在不斷改革完善自身的過(guò)程中前進(jìn),力求為國(guó)家與社會(huì)公平選才、科學(xué)選才,其時(shí)序性、梯度性與價(jià)值性都發(fā)生了變化,公平性也日益加強(qiáng)[3]。但同時(shí),高考錄取機(jī)制也暴露出不少問(wèn)題,比如“高分低就”和“高分落榜”等,從“平行志愿”到“志愿優(yōu)先”的高考改革在很大程度上改善了這兩種現(xiàn)象,提高了學(xué)生的選擇空間以及被錄取的機(jī)會(huì)。但是,“平行志愿”也存在明顯不足,比如唯分?jǐn)?shù)論、退檔風(fēng)險(xiǎn)、專(zhuān)業(yè)滿(mǎn)意度低、高校自主權(quán)減弱、強(qiáng)化高校之間的等級(jí)之分等[4]。基于此,不少學(xué)者對(duì)高校錄取機(jī)制進(jìn)行了研究,文獻(xiàn)[5]討論了填報(bào)志愿時(shí)間不同時(shí)高考錄取機(jī)制產(chǎn)生“高分低就”現(xiàn)象的原因,表明當(dāng)考生的偏好是考生的私人信息時(shí),知分填報(bào)時(shí)也存在均衡時(shí)發(fā)生“高分低就”的可能。之后,文獻(xiàn)[6]進(jìn)一步分析了“志愿優(yōu)先”錄取機(jī)制,提出擇校機(jī)制文獻(xiàn)中的Gale-Shapley 機(jī)制可以應(yīng)用在高考錄取中,并分析了中國(guó)高考平行志愿是一種分?jǐn)?shù)獨(dú)裁機(jī)制, 這種機(jī)制是Gale-Shapley 學(xué)生最優(yōu)機(jī)制的一種特殊形式,并給出了分?jǐn)?shù)獨(dú)裁機(jī)制的算法。也有學(xué)者分析了平行志愿錄取機(jī)制,認(rèn)為相對(duì)于傳統(tǒng)的“志愿優(yōu)先”機(jī)制,平行志愿錄取機(jī)制對(duì)于全體考生來(lái)說(shuō)不是帕累托改進(jìn),認(rèn)為增加平行志愿數(shù)目對(duì)低分考生不利[7]。劉馳結(jié)合Gale-Shapley 機(jī)制,對(duì)以往文獻(xiàn)的“一檔多投”模式的錄取算法進(jìn)行了改進(jìn),認(rèn)為這種錄取算法更能夠凸顯院校的專(zhuān)業(yè)特色,促進(jìn)院校特色專(zhuān)業(yè)的發(fā)展[8]。
高校錄取機(jī)制的實(shí)質(zhì)是雙邊匹配機(jī)制的一種,給定學(xué)生和高校各自的偏好排序,學(xué)生與高校之間的匹配是一個(gè)經(jīng)典的機(jī)制設(shè)計(jì)問(wèn)題,可以采用Gale-Shapley 機(jī)制、Boston 機(jī)制以及TTC(Top Trading Cycles)機(jī)制等來(lái)完成這一匹配。在Gale-Shapley 大學(xué)招生模型中,學(xué)生和學(xué)校都是積極的參與者,每個(gè)學(xué)生對(duì)所有大學(xué)有一個(gè)偏好排序,每個(gè)大學(xué)也對(duì)所有學(xué)生有偏好排序。對(duì)于學(xué)校和學(xué)生任意的偏好,通過(guò)Gale-Shapley 機(jī)制都能產(chǎn)生學(xué)生和大學(xué)的組合,使得錄取的結(jié)果是穩(wěn)定的且是帕累托最優(yōu)的[9]。學(xué)校錄取機(jī)制中的另一個(gè)重要問(wèn)題是其抗策略的性質(zhì),Dubins and Freedman 證明了Gale-Shapley 機(jī)制是抗策略的[10]。在此之后,Roth 的一系列論文較全面地討論了Gale-Shapley 機(jī)制的帕累托最優(yōu)和穩(wěn)定性等問(wèn)題[11,12]。Gale-Shapley 機(jī)制并不是唯一可以達(dá)到帕累托最優(yōu)的學(xué)校錄取機(jī)制,Shapley and Scarf 在其分析住房市場(chǎng)的論文中首先提出了Top trading cycles 機(jī)制的思想[13]。Abdulkadiroglu 和 S?nmez 擴(kuò)展了Top trading cycles 機(jī)制,并證明了該機(jī)制也是帕累托最優(yōu)和抗策略的,還討論了在約束條件下兩種最優(yōu)機(jī)制的運(yùn)用[14]。Chen 和S?nmez用實(shí)證的方法比較了Boston 機(jī)制、Gale-Shapley 機(jī)制和Top trading cycles 機(jī)制,得出的結(jié)論是后兩種機(jī)制要遠(yuǎn)優(yōu)于Boston 機(jī)制,但Gale-Shapley 機(jī)制在實(shí)際運(yùn)用中效果最好 。
綜上所述,國(guó)內(nèi)外相關(guān)學(xué)者對(duì)高校錄取問(wèn)題進(jìn)行了廣泛的研究和討論,但是在他們的研究中,都假設(shè)學(xué)生有著確定的、成熟的偏好,未考慮學(xué)生通常會(huì)花費(fèi)大量的時(shí)間和精力來(lái)獲取不同學(xué)校的信息以確定自己偏好這一實(shí)際情況,實(shí)際上很多學(xué)生由于不能充分獲取、利用信息,極大地浪費(fèi)了社會(huì)教育資源,降低了社會(huì)福利。本文在已有模型的基礎(chǔ)上,以Gale-Shapley 機(jī)制為例,引入了信息獲取模塊,研究學(xué)生在參與匹配前,為了提高自身的匹配收益,主動(dòng)花費(fèi)成本獲取院校、自身偏好等信息。
為全面分析信息獲取對(duì)學(xué)生匹配收益的影響,本文在已有高校錄取模型的基礎(chǔ)上,把引入信息獲取模塊的高校錄取模型定義為:
(1)所有學(xué)生的集合S={s1,s2,…,sm}。
(2)所有學(xué)校的集合C={c1,c2,…,cm}。
第一輪:考慮每個(gè)學(xué)生si的第一志愿,學(xué)校ci將第一志愿報(bào)考本校且偏好排序上最好的前個(gè)學(xué)生進(jìn)行預(yù)錄,其他學(xué)生進(jìn)行退檔。如果第一志愿的學(xué)生人數(shù)不足,則預(yù)錄所有學(xué)生;
第二輪:考慮上輪被退檔學(xué)生的第二志愿,學(xué)校ci將第二志愿報(bào)考本校的學(xué)生和上輪中己預(yù)錄的學(xué)生一起比較,將最好的個(gè)學(xué)生進(jìn)行預(yù)錄。其他學(xué)生進(jìn)行退檔,如果學(xué)生人數(shù)不足,就留下所有的學(xué)生;
第k 輪:考慮上輪被退檔學(xué)生的第k 志愿,學(xué)校ci將第k 志愿報(bào)考本校的學(xué)生和上輪中已經(jīng)預(yù)錄的學(xué)生一起比較,將最好的個(gè)學(xué)生進(jìn)行預(yù)錄。其他學(xué)生進(jìn)行退檔,如果學(xué)生人數(shù)不足,就留下所有的學(xué)生。

圖1:免費(fèi)獲取信息

圖2:獲取信息時(shí)學(xué)生的期望效用

圖3:獲取信息時(shí)學(xué)生的最優(yōu)成本
當(dāng)沒(méi)有學(xué)生被退檔,所有的學(xué)生都分配到最終位置時(shí),這個(gè)算法結(jié)束。由于學(xué)生和學(xué)校的數(shù)目有限,這個(gè)過(guò)程一定會(huì)在有限步后停止,所有預(yù)錄考生最后就被學(xué)校正式錄取。如果一個(gè)學(xué)生被所有的學(xué)校退檔,意味著這個(gè)學(xué)生落榜。
Gale-Shapley 機(jī)制中,學(xué)生填報(bào)自己的真實(shí)偏好是占優(yōu)策略,而在參與匹配前,為了確定自己的真實(shí)偏好,有動(dòng)機(jī)獲取自身偏好信息,但為了獲取信息愿意花費(fèi)多少成本是不確定的,假設(shè)學(xué)校對(duì)學(xué)生的偏好是基于學(xué)生分?jǐn)?shù)排名,當(dāng)考慮到學(xué)校的招生名額和學(xué)生自己的排名時(shí),部分學(xué)生是有動(dòng)機(jī)獲取他人偏好信息的,本文利用下面的簡(jiǎn)單例子進(jìn)行說(shuō)明。
例:假設(shè)有兩所學(xué)校A 和B,每所學(xué)校2 個(gè)招生名額,即=2;有5 名學(xué)生,按照分?jǐn)?shù)嚴(yán)格降序排序s1,s2,…,s5,學(xué)生排名、學(xué)校招生名額和學(xué)校效用分布是公共信息,但學(xué)生對(duì)學(xué)校的偏好是私人信息,如下所示:

uiA為學(xué)生si對(duì)學(xué)校A 的收益認(rèn)知,表示學(xué)生si被學(xué)校A 錄取后所獲得的收益,uiB類(lèi)似;其中ξiA、ξiB獨(dú)立同分布于N(0,1),表示學(xué)生在獲取信息后對(duì)學(xué)校效用的更新,若學(xué)生未獲取信息,則ξiA=ξiB=0。每名學(xué)生只能被一所學(xué)校所錄取,未被錄取的學(xué)生收益為0。
學(xué)生s1知道自己的排名最高,按照Gale-Shapley 機(jī)制他將被分配給自己的第一選擇,所以他只需選擇自己最喜歡的學(xué)校,提交真實(shí)偏好就是他的占優(yōu)策略,所以學(xué)生s1有動(dòng)機(jī)獲取自身偏好信息,以便確認(rèn)自己最喜歡的學(xué)校;學(xué)生s2知道自己的排名是2,且每所學(xué)校招收2 名學(xué)生,所以無(wú)論他最喜歡的學(xué)校是否錄取了學(xué)生s1,這所學(xué)校都至少仍有一個(gè)招生名額,所以提交真實(shí)偏好是他的占優(yōu)策略,他也有動(dòng)機(jī)獲取自身偏好信息;對(duì)于學(xué)生s3而言,如果學(xué)生s1和學(xué)生s2都最喜歡學(xué)校A,按照Gale-Shapley 機(jī)制學(xué)生s3只會(huì)匹配給學(xué)校B,此時(shí)他沒(méi)有意愿去獲取自身偏好信息(學(xué)生s1和學(xué)生s2都最喜歡學(xué)校B 類(lèi)似),若學(xué)生s1和s2一者喜歡A 一者喜歡B,那么學(xué)校A 和B 都至少還有一個(gè)招生名額,學(xué)生s3為了確定自己喜歡哪所學(xué)校,有動(dòng)機(jī)去獲取自身偏好信息,所以學(xué)生s3總是傾向于獲取學(xué)生s1和s2的私人偏好信息,再來(lái)決定他下一步是否獲取自身偏好信息;學(xué)生s4與學(xué)生s3類(lèi)似;而對(duì)于學(xué)生s5而言,在Gale-Shapley匹配機(jī)制下,學(xué)生s5總是落榜,他沒(méi)有動(dòng)機(jī)去獲取信息。
對(duì)于學(xué)生而言,策略的選擇是為了最大化他們的匹配收益,在免費(fèi)獲取信息的情況下,真實(shí)填報(bào)自身偏好是優(yōu)勢(shì)策略。但當(dāng)獲取信息時(shí)需要花費(fèi)成本時(shí),為了獲取自身偏好信息,學(xué)生愿意花費(fèi)多少成本呢?
假設(shè)ci為學(xué)生si為獲取學(xué)校A 與B 的信息所花費(fèi)的成本,c't為學(xué)生si為了獲取他人偏好信息所花費(fèi)的成本。
從前文的分析得知,學(xué)生s1和s2是有動(dòng)機(jī)獲取自身偏好信息的,對(duì)于學(xué)生s1,若u1A>u1B即那么他最喜歡的學(xué)校是A,其次是B,此時(shí)學(xué)生s1的真實(shí)偏好和學(xué)校初始排名相同,學(xué)生s1最優(yōu)花費(fèi)成本為c1=0;當(dāng)u1A<u1B即時(shí),學(xué)生s1最喜歡的學(xué)校是B,其次是A,在獲取信息前,他的志愿偏好是{A,B},所以會(huì)被學(xué)校A 錄取,而他的真實(shí)偏好為{B,A},若他填報(bào)真實(shí)偏好會(huì)被學(xué)校B 錄取,所以學(xué)生s1為了獲取信息所愿意付出的成本的最大值為(學(xué)生s2類(lèi)似)。對(duì)于學(xué)生s3,若他人偏好信息能夠免費(fèi)獲取,即c'3=0,當(dāng)學(xué)生s1和s2最喜歡的學(xué)校相同時(shí),學(xué)生s3沒(méi)有獲取信息的意愿,c3=0;當(dāng)學(xué)生s1和s2最喜歡的學(xué)校不同時(shí),若u3A>u3B,則 c3=0,若u3B>u3A,則當(dāng)他人偏好信息不能免費(fèi)獲取時(shí),即c'3>0,由Gale-Shapley 機(jī)制抗策略性分析可知,學(xué)生s3的優(yōu)勢(shì)策略是不獲取他人偏好信息,獲取自身偏好所花費(fèi)成本的分析與學(xué)生s1類(lèi)似(學(xué)生s4類(lèi)似);學(xué)生s5由前文分析可知沒(méi)有獲取信息的意愿,也不會(huì)花費(fèi)成本。
由上述分析可知,當(dāng)獲取自身偏好信息需要花費(fèi)成本時(shí),學(xué)生愿意花費(fèi)成本的最大值取決于獲取信息后匹配收益與獲取信息前匹配收益的差值。
為了對(duì)上述分析進(jìn)一步驗(yàn)證,本文做了以下仿真分析:
為了驗(yàn)證信息獲取對(duì)學(xué)生匹配收益的影響,本文利用matlab 語(yǔ)言建模,對(duì)學(xué)生獲取信息的行為進(jìn)行仿真,實(shí)驗(yàn)設(shè)置1300 名學(xué)生、100 所學(xué)校,每所學(xué)校招收10 名學(xué)生,學(xué)生與學(xué)校的匹配過(guò)程采用Gale-Shapley 算法,未被錄取的學(xué)生落榜。學(xué)校對(duì)學(xué)生的偏好按學(xué)生的分?jǐn)?shù)排序,學(xué)生的分?jǐn)?shù)為系統(tǒng)隨機(jī)產(chǎn)生,學(xué)生可以觀測(cè)到彼此的分?jǐn)?shù),學(xué)生對(duì)學(xué)校的初始偏好為學(xué)校初始效用的排序,學(xué)校初始效用為系統(tǒng)隨機(jī)產(chǎn)生,所有學(xué)生都可以觀測(cè)到。而學(xué)生的真實(shí)偏好及被學(xué)校錄取后的真實(shí)效用是學(xué)生的私人信息,學(xué)生彼此不知道對(duì)方的真實(shí)偏好,且學(xué)生的真實(shí)偏好需要學(xué)生花費(fèi)成本去學(xué)習(xí),學(xué)生不論是否學(xué)習(xí)到自身真實(shí)偏好信息,被學(xué)校錄取后的所獲得的效用均為學(xué)校的真實(shí)效用,未被錄取的學(xué)生數(shù)獲得的效用為0。
為了簡(jiǎn)化實(shí)驗(yàn),本文將獲取所有學(xué)校信息所花費(fèi)的成本統(tǒng)一為c,假設(shè)學(xué)生花費(fèi)成本后要么獲取到所有學(xué)校的全部信息,要么完全沒(méi)有獲取到信息。假設(shè)學(xué)生花費(fèi)成本c 后獲取到信息的概率為未獲取到信息的概率為花費(fèi)成本越多,獲取到信息的概率越大,其中k 為花費(fèi)系數(shù),表征學(xué)生獲取信息的難易程度,當(dāng)k值較小時(shí),學(xué)生很容易獲取到信息,當(dāng)k 值較大時(shí),學(xué)生獲取到信息的難度變大。學(xué)生決策的目的是最大化自己的收益,他需要決定是否花費(fèi)成本獲取信息以及花費(fèi)多少成本。
為了研究信息對(duì)學(xué)生匹配收益的影響,首先假設(shè)政府提供院校全部信息,學(xué)生有著確定的偏好,即學(xué)生獲取信息不需要花費(fèi)成本,當(dāng)獲取信息的學(xué)生比例增加時(shí),所有學(xué)生的期望收益的變化情況。當(dāng)學(xué)生獲取信息的比例由0%增加到100%時(shí),學(xué)生的期望收益上升了約7 個(gè)百分點(diǎn)(見(jiàn)圖1)。
結(jié)論1:當(dāng)學(xué)生能免費(fèi)獲取信息時(shí),隨著獲取到信息的學(xué)生比例的增加,學(xué)生整體期望收益也在逐步提高,也就是說(shuō),免費(fèi)提供信息能顯著提高學(xué)生的匹配收益;
花費(fèi)系數(shù) 表征學(xué)生獲取信息的難易程度,k 值越大學(xué)生越難獲取到信息,此仿真實(shí)驗(yàn)中花費(fèi)系數(shù)k 值按對(duì)數(shù)尺度增大,取值,當(dāng)k=0 時(shí),學(xué)生獲取信息不花費(fèi)成本,此時(shí)學(xué)生有較高的期望收益,隨著k 的增大,學(xué)生為了成功獲取信息需要花費(fèi)更多的成本,學(xué)生期望收益逐漸下降,當(dāng)k>10.50 時(shí),學(xué)生的收益與未獲取信息時(shí)的收益持平,說(shuō)明此時(shí)學(xué)生沒(méi)有動(dòng)機(jī)花費(fèi)成本獲取信息(見(jiàn)圖2)。
結(jié)論2:在花費(fèi)成本獲取信息情況下,當(dāng)獲取信息難度較低時(shí),學(xué)生愿意花費(fèi)一定成本獲取信息以提高收益,而當(dāng)獲取信息的難度很大時(shí),學(xué)生沒(méi)有意愿花費(fèi)成本獲取信息。
在獲取信息需要花費(fèi)成本的情況下,學(xué)生需要決策是否花費(fèi)成本以及花費(fèi)多少成本來(lái)獲取信息。在k<1.8 時(shí),學(xué)生的最優(yōu)花費(fèi)成本隨著k 值的增大而增大,學(xué)生的優(yōu)勢(shì)策略是花費(fèi)成本直到成功獲取信息為止;當(dāng)1.8<k<10.50 時(shí),學(xué)生的最優(yōu)成本隨著k>10.50 值的增大反而逐漸下降,表明學(xué)生此時(shí)有一定的意愿花費(fèi)成本去獲取信息,但不愿意付出太高的成本;當(dāng) 時(shí),學(xué)生沒(méi)有意愿去獲取信息(見(jiàn)圖3)。
結(jié)論3:在獲取信息難度較低的環(huán)境中,學(xué)生有很強(qiáng)的獲取信息的意愿,其優(yōu)勢(shì)策略是花費(fèi)成本直到成功獲取信息為止,當(dāng)獲取信息難度較大時(shí),學(xué)生會(huì)嘗試花費(fèi)成本去獲取信息,但不會(huì)花費(fèi)太高的成本,而在獲取信息難度很大的環(huán)境中,學(xué)生的最優(yōu)策略是不花費(fèi)成本。
針對(duì)目前高校錄取機(jī)制研究中缺乏的信息獲取模塊,本研究致力于探究引入信息獲取模塊后學(xué)生匹配收益的變化情況。通過(guò)理論分析和實(shí)驗(yàn)驗(yàn)證,說(shuō)明信息獲取是高校錄取過(guò)程中必不可少的一個(gè)步驟,且會(huì)顯著影響學(xué)生的匹配收益,所有學(xué)生都有意愿獲取自身偏好信息,且部分學(xué)生在特定情況下也有動(dòng)機(jī)獲取他人偏好信息。此研究有利于進(jìn)一步完善高校錄取模型,指導(dǎo)學(xué)生獲取更充分的信息,更好地利用信息,同時(shí)也可以為政府信息提供政策作指導(dǎo),提高社會(huì)福利。