表示一項研究的真實性和準確性程度。又稱真確性。它與研究的目標密切相關,一項研究所得結果必須符合其目標才是有效的,因而效度也就是達到目標的程度。效度是相對的,僅針對特定目標而言,因此隻有程度上的差別。

  在測量方面,效度指一種測量手段能夠測得預期結果的程度。從統計學角度可把效度(rXY)定義為潛在真分數方差(垏)與實得分數方差(垑)的比率率,即:

。效度與 信度的關系為:信度是效度的必要條件,但不是充分條件。一個測量的效度要高,其信度必須高,而一個測量的信度高時,效度並不一定高。

  考驗效度的方法很多,J.W.弗倫奇和W.B.米歇貝根據測驗目標把效度分為內容效度、構想效度和效標關聯效度,這種分類為美國心理學會在1974年發行的《教育與心理測驗的標準》一書所采納,成為通行的效度分類方法。

  內容效度指測驗題目對有關內容或行為范圍取樣的適當性。成就測驗和熟練測驗特別註重這種效度。例如,在成就測驗中,測驗題目是根據教學大綱和教材內容適當抽出的,內容效度就是判斷測驗題目(內容)是否符合它欲測的目標。由於這種衡量效度的方法必須針對課程的目標和內容,以系統的邏輯方法詳細分析題目的性能,故又稱課程效度或邏輯效度。確定內容效度的方法主要有兩種:①專傢判斷,即由有關專傢對測驗題目與原定內容范圍的符合性作出判斷;②統計分析,即以一組被試在取自同樣內容范圍的兩個獨立測驗上得分的相關作出估計。內容效度很容易與表面效度相混淆,實際上兩者意義不同。表面效度指從外表(如測驗的材料及用語、試題的印刷等)直觀地看,測驗題目與測量目標的一致程度,它與內容效度所指測驗在實際測量上的有效程度不同。從技術意義上嚴格地說,表面效度不是效度,但為瞭取得被試的信任與合作,表面效度也不可忽視。

  構想效度指測驗分數能夠說明心理學理論上的某種結構或特質的程度。它主要適用於心理測驗,其目的是以心理學的概念說明和分析測驗分數的意義,即從心理學的理論觀點對測驗的結果加以解釋和探討。在心理學上,所謂構想是指心理學理論所涉及的抽象而屬假設性的概念、特質或變量,如智力、焦慮、機械能力傾向、成就動機等,通常采用某種操作性定義並用測驗來測量。確定構想效度的邏輯和方法一般是:先從某一構想的理論出發,導出各項關於心理功能或行為的基本假設,據以設計和編制測驗,然後由果求因,以相關、實驗和因素分析等方法,審查測驗結果是否符合心理學上的理論觀點。

  效標關聯效度指測驗分數與效度標準的一致程度。效度標準簡稱效標,是足以反映測驗所欲測量或預測的特質的獨立量數,並作為估計效度的參照標準。測驗分數與效標的一致程度以二者的相關系數表示,這種相關系數稱為效度系數。效度系數越大,測驗的效度越高。由於用相關系數這種統計數值表示,這種效度又稱統計效度。效標關聯效度可分同時效度和預測效度。同時效度指測驗分數與當前的效標之間的相關程度,通常與心理特性的評估和診斷有關,常用的效標資料包括在校學業成績、教師評定的等級、臨床檢查、其他同性質測驗的結果等;預測效度指測驗分數與將來的效標之間的相關程度,它對人員的甄選、分類與安置工作等甚為重要,常用的效標資料包括專業訓練的成績和實際工作的成果等。它運用追蹤法對行為表現作長期觀察、考核和記錄,以累積所得的事實資料衡量測驗結果對將來成就的預測性。

  測量的各種效度的區別在於各自強調的方面不同。一個測驗可以有多種效度,每種效度視使用者的具體目的而定,因此,一般不存在測驗的統一效度。但各種效度又是相互聯系和補充的。內容效度和構想效度既是效標關聯效度的保證,又須得到它的支持。考察內容效度和效標關聯效度又有助於確定構想效度。

  在心理學研究(特別是實驗研究)文獻中,還常使用內在效度和外在效度的概念,這與測量的效度的含義有所不同。內在效度指研究的自變量和因變量之間存在明確關系的程度。如果一項研究經過分析表明,因變量的變化確系主試操縱的自變量的變化所引起,並不因其他變量的影響而變得模糊不清或復雜化,那麼這項研究就具有內在效度。影響內在效度的因素較多,主要有:①歷史:包括前攝歷史因素和後攝歷史因素。前者指被試固有的或習得的差異,後者指在研究測量之外可能影響自變量和因變量之間差異的因素;②成熟:在研究過程中隨著時間的推移被試身心的變化所引起的系統變異;③選擇:選擇被試的程序不適當而使被試組間一開始就存在系統性差異;④測量和測試手段:常見的有練習效應、敏感效應、選擇性效應及測試工具變異而影響研究的精確性;⑤統計回歸效應;⑥被試的亡失或更換;⑦實驗處理和程序:常見的有實驗處理和程序的信息擴散,以及由此而產生的補償性等同效應和補償性競爭效應等;⑧多種研究條件和因素的交互作用。控制上述8種因素的最有效途徑是采用隨機化程序。外在效度指研究結果能夠普遍化或可應用的程度。內在效度是外在效度的必要條件,但不是充分條件。研究的內在效度低,其外在效度必然低,但研究的內在效度高,其結果不一定能夠普遍化到較大總體和其他情景中去。因此,一項研究的外在效度也很重要。