電腦情報檢索的一種重要方式。檢索系統中的每一個記錄(文獻表示或資料條目)用一個由若幹標引詞的權值構成的向量來表示,稱為文獻向量。通過計算文獻向量之間的相似度生成聚類文檔,作為檢索的基礎。用戶的問題(資訊需求)也用同樣的方法表示,稱為提問向量。檢索作業(即提問向量與文獻向量的匹配操作)在系統的聚類文檔中進行。先計算給定提問向量與文獻(類)向量之間的相似度,然後使相似度超過某一閾值(或者根據預定要檢出的文獻獻數量)的文獻按相似度大小降序排列輸出。采用此方式的檢索系統實現瞭局部匹配策略和排序輸出技術,提高瞭檢索的靈活性和效率。它還可以采用相關反饋技術來自動優化提問向量,或者采用動態文獻向量調整技術來優化聚類文檔的結構,進一步改善檢索效果。基於上述原理建立的系統模型稱為向量空間模型。此模型以假定標引詞之間相互獨立(即具有正交性)為前提,故存在一定的理論缺陷。