我們在日常生活中有這樣的經驗,觀察走路姿態,可以大致了解一個人。不久前,中科院心理所發布一項研究成果,利用計算機分析一個人走路的步態數據,可以在相當大的程度上預測一個人的自尊程度。
人們常說,“知人知面不知心”,以此來說明想了解一個人的內心是非常困難的。但是,我們也經常聽到,“閱人無數,識人有術”,強調從人的言談舉止歸納總結出識人的規律。這兩個看似矛盾的說法能夠被大家接受,說明都有其合理性。
強調“不知心”是說對一個人的內心理解很難,而解決這個難題的方法可能就是通過不斷練習、不斷總結識人的規律,也就是不斷學習的過程。為了達到識人的目的,需要有一個閱人無數的過程,如果我們能夠訓練計算機,是否也可以做到“識人”呢?從最近幾年針對行為大數據和心理學研究的結果來看,這是完全可能的,對計算機進行訓練,并使其具有識人能力的過程,就是機器學習的過程。
閱人無數的過程可以看作是在數據上的機器學習訓練過程,也就是受教學習過程;而識人的過程則是模型的應用。如果有了數據,結合機器學習,我們就有可能實現識人,也就是獲知人們的內心。
目前心理學的方法主要依賴于自我報告,但是人們往往愿意展現自我好的一面,所以其準確性會受到影響,而人們在實驗室環境下的行為表現與現實場景往往有所不同,實驗室的發現在實際應用的時候是要打折扣的。
隨著互聯網時代的到來,尤其是移動智能設備的普及,智能手機、手環、智能手表等各類可穿戴設備,幾乎能將人們所有的現實行為做全時程的、原生態的跟蹤和記錄。人們可能在心理學實驗室環境中進行有效的偽裝,卻很難在現實生活中長期這么做。因此,我們完全有可能利用網絡及智能設備實現對人們日常行為的數據采集,并通過機器學習獲得的模型對行為進行分析,對人們的內心進行識別,做到計算機識人之心。
微博擁有數量龐大、分布廣泛的用戶群體,他們在微博中進行原生態的個性化表達。為了從用戶在網絡平臺上的微博行為數據預測其人格特征,研究者從近兩百萬名新浪微博活躍用戶中隨機選取了547名用戶作為被試者,下載其微博行為記錄,并且進一步由原始記錄中提取845種行為特征,以此作為輸入;同時,對邀請參加實驗的微博用戶施測人格問卷,獲取其在各人格維度上的得分,以此作為輸出。結果表明,基于微博行為的人格計算模型擁有良好的測量屬性。此外,在人格計算模型中,微博行為與人格特征之間的預測關系也具有一定的可解釋性。這表明,通過微博行為來預測用戶的人格特征是完全可行的。
我們利用網絡數據,能夠實現對人們的人格特征的識別,但是我們一般都把網絡看做是虛擬社會。那么在現實社會中呢?
利用機器學習,我們通過智能設備獲取人們的日常行為數據,實現對心理特征的識別。結果發現,利用步態能夠比較準確識別人的自尊情況。
在這個實驗中,參加實驗的用戶首先會被要求填寫自評式的自尊量表,獲得被試者自我報告的自尊得分(輸出)。量表題目如:“6.我對于自己抱著肯定的態度”“10.有時候我認為自己一無是處”等。
之后用戶會被要求在一塊地毯上來回走動,兩個攝像頭被置于地毯兩端,用于捕捉被試者在走動過程中身體25個關節點的坐標以及面部表情和身體動作。
攝像頭以每秒20幀的速度捕獲人體25個關節在X、Y、Z三個軸上的三維坐標。研究人員從每個關節點的每一軸(共三軸)抽取64個特征,計算每個特征與被試者自尊得分的相關系數,并選取相關系數最大的5個特征來建立回歸模型,并預測個體的自尊得分。預測結果與被試者自我報告的自尊得分達到中等相關,能夠在一定程度上代替量表做自尊測量。鑒于男性和女性的步態存在一定差異,研究針對男性和女性的步態數據分別進行建模預測,對男性步態預測與自我報告得分之間的最高相關為0.43,女性為0.59,表明對女性預測性更好。研究結果表明,使用步態能夠實現對個體自尊的自動識別。
●資料來源:《北京日報》