綜合不同語法分析技術的形式特徵並建立統一的資料結構,以類比各種自然語言處理技術的實驗性軟體支援系統,又稱通用語法處理程式,英文縮寫 GSP,它是1973年R.卡普蘭為瞭研究語法分析和回應生成的需要提出的。

  圖表(chart)是通用語法處理程式的核心部分,用來表示語法和輸入語句的一種單一的資料結構。圖表實質上是語法樹的一種修正形式。在語法樹中每一條有向弧都代表弧線射出節點和弧線進入節點之間的“父子”關係。如果從一個節點射出出若幹條弧線分別通向不同的子節點,那麼這些子節點自左至右地形成一種“兄弟”關系。但是在語法樹中,節點之間的父子關系是用有向弧顯式表出的,而兄弟關系隻是一種隱含關系,並沒有用弧線連接。從每一語法樹構造其對應的圖表須遵循兩條規則:①將所有表示父子關系的弧線刪除,但保留父節點到其長子節點的弧線,同時將所有兄弟節點用有向弧從兄到弟地(即從左到右方向)連接起來;②節點與弧線標號互換,原來的節點標號變成瞭弧線標號,原來弧線沒有標號,現在則是節點沒有標號。圖1是名詞短語的語法樹及其對應的分析圖表。

  用圖表還可以有效地表示“森林”──由若幹棵不連的樹組成的有序集合。圖2表示由名詞短語和動詞的語法樹形成的森林及其對應的圖表。圖3表明用圖表還可以簡明有效地表示詞或短語的多義現象(稱為歧義性)。通用語法處理程序除瞭建立圖表分析技術外,還在遞歸、回溯和指針移動等方面有較完善的控制策略。系統還有程序協同功能,各程序(過程)能掛起暫停或繼續運行。圖表是表示自然語言句法的適用數據結構,運用圖表技術有利於將語法中較小組成部分集結為較大組成部分以便分析,因而在自然語言處理系統的研制中受到重視。

  

參考書目

 R.Rustin,ed.,Natural Language Processing,Algorithmics Press, New York,1973.