項目功能差異(Differential Item Functioning,簡稱DIF)的研究最早始于20世紀60年代美國關于測驗的“項目偏差”研究。當時的民權運動、少數民族的平等問題特別受到關注,測驗偏差逐漸成為測驗評價中的一個標準部分,DIF的研究目標就是為了區分出對少數民族學生存在偏差并使之在測驗中偏離的項目。以教育測驗中的例子來說,如果某個題目對于有相同目標能力的男生和女生都存在差異,我們如何排除對男生、女生有偏差的題目,讓一定的教育內容和目標實現,這是DIF可能討論的內容。“項目功能差異”一詞指的是在控制團體能力差異之后,一個項目在不同團體中顯示的不同統計特征。
由于表現的形式、產生的原因或研究的角度不同,DIF的定義也各有不同。有根據項目難度定義的:如果一項目的難度在兩個不同子群體上的值有顯著差異,則認為項目功能差異存在,拉希模型(單參數的邏輯斯蒂模型)就是項目反應模型的一種;有根據項目難度和項目難度回歸線關系來定義的:一組測量項目如果是無偏的,那它們在兩個不同子群體中的難度值序列應該是完全相同的,其相關系數可以達到1,如果用散點圖來表示,這些項目的兩個難度值決定的坐標點將形成一條規則性很強的回歸線,而對于有DIF的項目,由于其兩難度值在兩序列中相對位置有差異,其坐標點就會游離于回歸線之外;有根據相同總分被試在項目上有相等做答題率來定義的:對于同一項目來說,若來自不同子群體的、測驗總分相同的被試,在該項目上答對概率不同,則該項目就存在DIF;……