信度-百科詞條

　　表示一種測量工具、測量程式或測量結果的一致性和穩定性程度。又稱可靠性。它受隨機誤差影響，誤差越小，信度越高。也可視其為測量結果消除隨機誤差影響的程度，任何測量都有不同程度的隨機誤差，信度大小用信度係數表示，其值在0與±1之間。

　　可以從3個方面來理解信度:①指實得分數和真分數相差的程度，相差越小，測量結果的信度越高。信度(r_XX)可定義為真分數方差((垐)與實得分數方差（垑）的比率，即

。由於真分數在實際測量中是得不到的，而真分數方差等於實得分數方差減去隨機誤差分數方差(垁)，所以，信度也可表示為：

。②指統計量與參數之間的接近程度。在統計學中，樣本的數字特征（如樣本的平均數和方差）稱為統計量，總體的數字特征(如總體的平均數和方差)稱為總體參數，簡稱參數。各種統計量都存在信度問題。統計量越接近參數，其信度就越高。知道瞭統計量與參數的接近程度，便可對參數進行區間估計。通常各種統計量的信度以各自的標準誤或機誤來表示。這一原理和方法也適用於查明實得分數與真分數的接近程度。通過對實得分數的標準誤或機誤的估計，可以利用區間估計的公式，算出實得分數與直分數的接近程度，從而得出測量結果的信度。③指一種測量工具先後兩次施測於相同被試所得結果前後一致的程度。一致性的程度越大，信度越高。一致性程度的高低以相關系數的大小來表示，稱為信度系數。

　　信度是評價一種測量的重要指標，隻有實得分數接近或等於真分數，用同一工具多次測量同一特性獲得相同或近乎相同的結果，才能認為此結果是可靠的。任何測驗或量表編制後提供使用時，都必須說明其信度大小。

　　在實際測量中主要采用計算信度系數的方法估計信度。依照計算方法的不同，可將信度分為4種：①再測信度：用一種測驗對同一被試組施測兩次，根據兩次測驗分數計算其相關系數。此種信度能表示兩次測驗結果有無變動，反映測驗分數的穩定程度，故又稱穩定性系數。在沒有復本可用，而現實條件又允許重復施測時，一般采用這種再測法來估計其信度。②復本信度：用一種測驗的兩個等值復本施測於同一被試組，然後計算兩次得分的相關系數。一般說來，復本法是考查測驗信度最好的方法。③內部一致性信度：測驗的同質性程度。如果測驗中各測題得分有正相關，則測驗是同質的。考查測驗內部一致性的常用方法有分半法、庫德－理查森公式和克龍巴赫α 系數。這樣求得的信度系數也叫做內部一致性系數。分半法是考查測驗信度最常用的方法，在測驗沒有復本且隻能實施一次時，常用此法估計信度，即把測驗題分成對等的兩半（一般按奇數題和偶數題分），根據各人在這兩半測驗所得分數計算其相關系數，即得分半信度。但分半法實際隻求得半個測驗的信度，由於在其他條件相等的情況下，測驗越長，信度越高，因此必須使用斯皮爾曼－佈朗公式加以校正，以估計整個測驗的信度。庫德爾－理查森公式以測驗各個項目的正確反應為基礎，或根據各人總分的平均數和標準差計算信度系數，即得庫－理信度。它代表一切可能的分半信度系數的平均數。但庫德－理查森公式隻適用於答對一題得一分、答錯無分的測驗。克龍巴赫ɑ系數則適用於多重記分的測驗信度估計。④評分者信度：隨機抽取數份試卷，由兩位或兩位以上評分者分別評分，然後計算每份試卷所評各分數之間的相關系數。在兩人評閱數份試卷（或1人先後兩次評閱數份試卷）時，用斯皮爾曼等級相關公式求相關；在3人以上評閱數份試卷時，則需計算肯德爾和諧系數。對一些無法完全客觀記分的測驗，常需考查評分者信度。以上計算信度系數的各種方法是以不同的假定和前提條件為基礎的，故所求得的數值意義不盡相同，因而不能單以數值來比較其信度高低。

　　影響信度的因素很多。提高測量的信度要相應地從多方面著手，主要的方法有：①增加測驗或量表的長度以提高樣本的代表性；②測驗時間、測驗難度適當；③測試盡量在程度不齊的團體中進行；④施測程序和環境盡量標準化；⑤評分盡量客觀確定。