加工文獻以生成全文資料庫或書目文摘資料庫的電腦系統。通常由以下幾個子系統構成:①數位化資訊生成和採集子系統。主要有兩個功能:一是將現存的以不同形式和載體存儲的資訊資料,如紙質資料、圖片、聲像資料等轉化成數位形式,使用的技術有文字圖像掃描處理、圖像和語言的識別等。另一個功能是直接獲取已經數位化的資料。②資料處理子系統。對資料進行去噪、壓縮、加密、格式轉換等處理,做到既有利於讀者閱讀,又能保護數位資料內容原創者或擁有者的利益。③元資料提取與加工子系統。基本功功能是提取和生成元數據,對原始文獻進行描述,這部分工作既可以手工完成,也可以自動化的方式(如自動標引、自動文摘)完成,常用的方法是在機器輔助下進行人工提取。④數據存儲與管理子系統。文獻加工系統所形成的數據庫一般都擁有海量信息,數據存儲與管理子系統一方面要保證海量信息存儲有序,另一方面還要保證不會影響讀取速度和服務效果。同時,還涉及數據的標識指引,即用數字對象唯一標識符來標識系統中的數字對象,以方便人們的利用,目前數字對象唯一標識符有多種方案如URN、PURL、Handle System等。⑤管理子系統。包括工作人員管理,加工任務分配、工作量統計、數據庫維護等。