表示一種測量工具、測量程式或測量結果的一致性和穩定性程度。又稱可靠性。它受隨機誤差影響,誤差越小,信度越高。也可視其為測量結果消除隨機誤差影響的程度,任何測量都有不同程度的隨機誤差,信度大小用信度係數表示,其值在0與±1之間。

  可以從3個方面來理解信度:①指實得分數和真分數相差的程度,相差越小,測量結果的信度越高。信度(rXX)可定義為真分數方差((垐)與實得分數方差(垑)的比率,即

。由於真分數在實際測量中是得不到的,而真分數方差等於實得分數方差減去隨機誤差分數方差(垁),所以,信度也可表示為: 。②指統計量與參數之間的接近程度。在統計學中,樣本的數字特征(如樣本的平均數和方差)稱為統計量,總體的數字特征(如總體的平均數和方差)稱為總體參數,簡稱參數。各種統計量都存在信度問題。統計量越接近參數,其信度就越高。知道瞭統計量與參數的接近程度,便可對參數進行區間估計。通常各種統計量的信度以各自的標準誤或機誤來表示。這一原理和方法也適用於查明實得分數與真分數的接近程度。通過對實得分數的標準誤或機誤的估計,可以利用區間估計的公式,算出實得分數與直分數的接近程度,從而得出測量結果的信度。③指一種測量工具先後兩次施測於相同被試所得結果前後一致的程度。一致性的程度越大,信度越高。一致性程度的高低以相關系數的大小來表示,稱為信度系數。

  信度是評價一種測量的重要指標,隻有實得分數接近或等於真分數,用同一工具多次測量同一特性獲得相同或近乎相同的結果,才能認為此結果是可靠的。任何測驗或量表編制後提供使用時,都必須說明其信度大小。

  在實際測量中主要采用計算信度系數的方法估計信度。依照計算方法的不同,可將信度分為4種:①再測信度:用一種測驗對同一被試組施測兩次,根據兩次測驗分數計算其相關系數。此種信度能表示兩次測驗結果有無變動,反映測驗分數的穩定程度,故又稱穩定性系數。在沒有復本可用,而現實條件又允許重復施測時,一般采用這種再測法來估計其信度。②復本信度:用一種測驗的兩個等值復本施測於同一被試組,然後計算兩次得分的相關系數。一般說來,復本法是考查測驗信度最好的方法。③內部一致性信度:測驗的同質性程度。如果測驗中各測題得分有正相關,則測驗是同質的。考查測驗內部一致性的常用方法有分半法、庫德-理查森公式和克龍巴赫α 系數。這樣求得的信度系數也叫做內部一致性系數。分半法是考查測驗信度最常用的方法,在測驗沒有復本且隻能實施一次時,常用此法估計信度,即把測驗題分成對等的兩半(一般按奇數題和偶數題分),根據各人在這兩半測驗所得分數計算其相關系數,即得分半信度。但分半法實際隻求得半個測驗的信度,由於在其他條件相等的情況下,測驗越長,信度越高,因此必須使用斯皮爾曼-佈朗公式加以校正,以估計整個測驗的信度。庫德爾-理查森公式以測驗各個項目的正確反應為基礎,或根據各人總分的平均數和標準差計算信度系數,即得庫-理信度。它代表一切可能的分半信度系數的平均數。但庫德-理查森公式隻適用於答對一題得一分、答錯無分的測驗。克龍巴赫ɑ系數則適用於多重記分的測驗信度估計。④評分者信度:隨機抽取數份試卷,由兩位或兩位以上評分者分別評分,然後計算每份試卷所評各分數之間的相關系數。在兩人評閱數份試卷(或1人先後兩次評閱數份試卷)時,用斯皮爾曼等級相關公式求相關;在3人以上評閱數份試卷時,則需計算肯德爾和諧系數。對一些無法完全客觀記分的測驗,常需考查評分者信度。以上計算信度系數的各種方法是以不同的假定和前提條件為基礎的,故所求得的數值意義不盡相同,因而不能單以數值來比較其信度高低。

  影響信度的因素很多。提高測量的信度要相應地從多方面著手,主要的方法有:①增加測驗或量表的長度以提高樣本的代表性;②測驗時間、測驗難度適當;③測試盡量在程度不齊的團體中進行;④施測程序和環境盡量標準化;⑤評分盡量客觀確定。