喬 鐵
(鄭州大學,河南 鄭州450000)
現在手機上出現了很多用來給相貌評分的軟件,這些趣味軟件制作初衷大多是為了博君一笑,不講究評分的準確性和可重復性。 但是這也予人啟發:如果婚戀網站的軟件能更客觀的給每個會員一個準確評分的話,網站就能更好幫助用戶,從數百萬人的資料中尋找到最符合要求的目標。 本文就探討一下進行評價需要采集哪些信息,以及如何用綜合評價的方法由個人信息得出更合理的評分。
介紹對象的時候通常需要詢問擇偶者,獲得其對身高年齡等方面的要求。所以網站對會員評價前也要先采集身高,體重,年齡,相貌,財產等信息項,然后根據這些信息得到數字型的指標。 這些信息有些本來就是數字,例如身高年齡,可以把這些值直接作為指標值;有些則比較主觀,例如相貌,這就需要先取得清晰的照片,之后依據下文的方法從中獲得指標值。指標中有些是極大型的,例如收入,指標值是越大越好;有些是居中型的,例如體重,適中最好。 我們要把這些不同類型的指標統一轉換成取值范圍相同的極大型評分。 下面就具體地分項討論。
常人覺的身高是越高越好, 但實際上配偶雙方的身高差太大,不但生活中有很多不便,而且擇偶者(評價結果使用者)也會感到不妥。因此目標的最佳身高可以由擇偶者的身高加上(女性擇偶者)或減去(男性擇偶者)社會平均男女身高差確定,在此基礎上依據擇偶者偏好修正。 可見此項指標是一項居中性指標,最接近最佳身高的指標應取得最高分,偏離到一定程度取得最低分。用公式表示的話,目標身高指標記為H,根據擇偶者身高和偏好確定的最佳身高為H0,當事人能接受的偏差值為ΔH,最高分為100 分,最低分為0 分,那么可以使用以下公式:根據身高指標獲得評分。另外,年齡的性質和身高類似,評分也可用同樣的方法得到。

體重是否合適與身高有關,目前國際上常用的衡量人體胖瘦程度以及是否健康的一個標準BMI 指數即身體質量指數, 是用體重公斤數除以身高米數平方得出的數字。 bmi 低于18.5 是過輕,18.5-24.99是偏瘦,20-25 是適中,25-28 是過重,超過28 為肥胖。 因此由身高和BMI 適中范圍[20,25]能得到一個最佳的體重區間[G1,G2],在這個區間的體重都取得最高分100,超出這個區間遞減;根據身高和BMI 指數18 和25 的界限可以得到體重可接受下限L1和上限L2,在界限處取得最低分0 分。 取得的體重指標記為G, 那么,體重的評分可以由以下公式給出:

雖然有人對財產是否越多越好有異議,這里還是根據一般人的看法,讓更多的財產獲得更高的評分。 不過財產也有邊際效應,從0 到100 萬和從100 到200 萬意義完全不一樣。 所以評分和財產值不視為線性關系。 由財產數目獲得評分,如果要簡單處理的話可以用一些初期定義域為0 到無窮大,值域為0 到100,既是單調增加且凸的函數來給出評分,例如:(其中W 為財產數目。ω 為系數,根據物價水平等因素確定)。
如果想要更有理論根據的話可以先對擇偶者做一個調查,獲得可接受最低財產數,較滿意財產數,滿意財產數,這些數目對應評分0分,60 分,80 分。這樣把財產作為自變量,評分作為變量用程序進行擬合,得到擬合函數。 然后就可以用得到的函數對評價對象的財產指標進行評分。
一般人把相貌看作是主觀的事物,其實古人已經給出了一些客觀的評價標準,例如“三庭五眼”。五眼指的是臉的寬度比例,以眼形長度為單位,把臉的寬度分成五個等分,從左側發際至右側發際,為五只眼形。 兩只眼睛之間有一只眼睛的間距,兩眼外側至側發際各為一只眼睛的間距,各占比例的1/5。 三庭指臉的長度比例,把臉的長度分為三個等分,從前額發際線至眉骨,從眉骨至鼻底,從鼻底至下頦,各占臉長的1/3。 當然這是古人的看法,未必準確,但是也說明了相貌與器官比例有關。 現代人可以用統計學獲得最佳比例,例如,有人總結,理想的臉型產生距離。眼睛的寬度,應為同一水平臉部寬度的3/10;下巴長度應為臉長的1/5;眼球中心到眉毛底部的距離,應為臉長的1/10;眼球應為臉長的1/14;鼻子的表面積,要小于臉部總面積的5/100;理想嘴巴寬度應為同一水平臉部寬度的1/2。[2]那么就可以根據評分對象的標準照片來識別出各項比例,根據最佳比例用評價身高的方法對每一項進行評分,再用下文所述方法得到相貌綜合分。相貌還取決于膚色,其影響更大的是膚色的均勻程度,膚色越均勻越好。對于這一項,可以從照片的皮膚部分選取采樣點,從采樣點獲取亮度值,然后計算這些值的方差,方差越小說明膚色越均勻。
如果除了以上信息之外還能獲得第三方對評價對象的感受的話,也可以根據這些主觀感受進行評分。 例如把感受分為很好, 較好,一般,較差,很差五個選項,用做選擇題的方式讓網站會員對瀏覽過的異性會員信息進行評價,我們可以把這些選擇量化為100,80,60,40,20這樣的數值評分,然后把所有網友評分的算術平均值作為主觀方面的評分。
依照以上方法得到了身高、體重等分項評分S1、S2,…,Sn,然后要根據這些分數獲得最后的綜合分。 因為各項的重要程度不同,所以要給各項以不同的權值ωi,讓更重要的項對最終評分有更大影響。 權值要滿足因為這樣才能使綜合評分有和分項分有一樣的取值范圍。這里指標的重要性是比較主觀的東西,所以要采用主觀賦權法。例如可以采用10 分制打分, 評價人按照自己的價值觀對每項信息的重要性給出評分Ki,則權值有了各項評價分和各項的權值, 那么我們就可以根據某種評價模型獲得綜合評分,例如可以用線性加權綜合模型,這時第j 個評價對象的綜合分也可以使用非線性加權模型,這時第j 個評價對象的綜合分還可以用逼近理想解法(TOPSIS),這些方法各有優劣。 如何選擇,讀者可以參考相關的資料。 這樣,用綜合評價模型依據每個評價對象的信息給出綜合分,對評分進行排序之后就可把分值高的目標推薦給擇偶人。
本文的方法適用于婚戀網站,這些網站可以在用戶注冊的時候要求提供各項個人信息和自己的傾向要求,然后依據用戶(評價人)的傾向用綜合的方法對網站的數據庫里巨量的異性資料進行評分,這樣就可以把分值高的推薦給用戶。 如果要對模型改進的話,可以用數據挖掘工具對成功配對的會員進行分析, 然后根據獲得的關聯改進模型。此外,招聘網站亦可從本文得到借鑒。
[1]韓中庚.數學建模實用教程[M].北京:高等教育出版社,2012.