向量檢索-百科詞條

　　電腦情報檢索的一種重要方式。檢索系統中的每一個記錄（文獻表示或資料條目）用一個由若幹標引詞的權值構成的向量來表示，稱為文獻向量。通過計算文獻向量之間的相似度生成聚類文檔，作為檢索的基礎。用戶的問題（資訊需求）也用同樣的方法表示，稱為提問向量。檢索作業（即提問向量與文獻向量的匹配操作）在系統的聚類文檔中進行。先計算給定提問向量與文獻（類）向量之間的相似度，然後使相似度超過某一閾值（或者根據預定要檢出的文獻獻數量）的文獻按相似度大小降序排列輸出。采用此方式的檢索系統實現瞭局部匹配策略和排序輸出技術，提高瞭檢索的靈活性和效率。它還可以采用相關反饋技術來自動優化提問向量，或者采用動態文獻向量調整技術來優化聚類文檔的結構，進一步改善檢索效果。基於上述原理建立的系統模型稱為向量空間模型。此模型以假定標引詞之間相互獨立（即具有正交性）為前提，故存在一定的理論缺陷。