數理語言學的一個分支。採用電腦技術和統計方法,編制特定的數學程式和數量模型來研究文章風格的學科。主要研究內容有:①根據語言單位之間的數量關係,對不同的比率進行比較,歸入不同的類型,確定文章風格的差異;②把語言成分看作變數,研究語言變數之間的相關程度,推斷風格的變異情形;③把語言集團的語言變異與語言集團的地理位置結合起來研究,測定不同地理區域的人群之間的語言關係,確定相關性最高的區域;④通過語言單位出現頻率的統計,揭示語言成分在較大序列中的分佈特徵,瞭解不不同文章的風格,判斷文章的作者或寫作年代。目前,在電子計算機上一般可以采用相關矩陣的方法來確定作者的文體風格特征。

  設某一作者m的二階相關矩陣為m(ij),則他的語言與標準語之間的偏離指數δ(m)可按如下公式計算:

其中E( ij)為標準語的二階相關矩陣, δ( m)的值越小,作者 m的語言就越接近標準語。

  設有兩個作者mn,作者m的二階相關矩陣為m(ij),作者n的二階相關矩陣為n(ij),則這兩個作者的風格的接近程度可用相關指數S來表示:

S的值越大,兩個作者的風格就越接近。