以語音學和數位信號處理為基礎的綜合性學科。包括語音的識別、合成、編碼、增強等。對語音信號處理的研究起源於對發音過程的模擬,即建立能夠描述語音產生過程和語音特徵的數位元模型,利用這些模型對語音信號進行分析和合成。

  語音識別屬於多維模式識別的範疇,是在對語音信號分析合成的基礎上,研究具有聽覺功能的裝置,以直接接受人的口呼命令。語音合成是將以其他方式表示或存儲的資訊轉化為語音,能夠通過聽覺方便地獲得。語語音合成有兩種基本方法:一種是編碼合成方式,即利用語音編碼技術對語音合成單元進行壓縮編碼,然後利用這些單元拼接成所需的語句。另一種是按規則合成方式,即選用更小的語音單位作為合成單元,根據各種韻律規則來合成語句。語音編碼是在充分利用人耳聽覺特性的基礎上,采用信源編碼技術消除語音信號的冗餘度,高效地對模擬語音信號進行數字表達。語音增強是從帶有噪聲的語音信號中提取盡可能純凈的原始語音的過程,目的是改進語音質量,提高語音可懂度。語音增強技術作為一種“預處理”技術可提高語音信號處理方法對於環境噪聲的魯棒性(信號處理方法對於環境噪聲幹擾的容忍能力或抵抗能力)。

  語音信號處理的研究成果已應用於國民經濟的各個領域,如工業生產中的語控技術、移動通信中的語音編碼、保密通信、刑事偵查中的聲紋鑒定、聾啞病情診斷以及智能人機交互接口等。