又稱自動化翻譯。應用語言學中的一門新興的實驗性學科,研究如何利用電子電腦按一定程式自動進行自然語言之間的翻譯問題。

  20世紀30年代初,法國科學傢G.B.阿爾楚尼提出瞭用機器來進行翻譯的想法。1933年,蘇聯發明傢П.П.特羅揚斯基設計瞭把一種語言翻譯成另一種語言的機器,並在同年9月5日登記瞭他的發明。但是,由於30年代技術水準還很低,他的翻譯機沒有製成。1946年電子電腦問世後,英國工程師A.D.佈斯和美國工程師WW.韋弗在討論電子計算機的應用范圍時,提出瞭利用計算機進行語言自動翻譯的想法。1949年,韋弗發表瞭一份以《翻譯》為題的備忘錄,正式提出瞭機器翻譯的問題。1954年,美國喬治敦大學在國際商用機器公司的協同下,用IBM-701計算機進行瞭世界上第一次機器翻譯試驗,此後,蘇聯、英國、日本、中國等國,也相繼進行瞭機器翻譯試驗。1966年11日,美國科學院語言自動加工咨詢委員會公佈瞭一個題為《語言與機器》的報告,對機器翻譯采取否定態度,一些國傢的機器翻譯研究轉入低潮。70年代初,由於現實的需要及技術的進步,機器翻譯又重新興旺起來,現在仍在不斷發展中。美國、加拿大、法國、日本、蘇聯都先後建立瞭一批翻譯能力較強的機器翻譯系統。有的系統已提供給一些單位試用,如法國的俄法機器翻譯系統。有的系統已在一定范圍內正式投入使用,如加拿大的TAUM-METEO英法機器翻譯系統,用於天氣預報。還有的系統已投入市場,如美國的SYSTRAN系統和WEIDNER系統。前者在大計算機上運行,每小時能譯幾十萬詞,但譯後需加工。後者在微型機上運行,速度雖比前者慢,但仍比人譯得快。

  中國機器翻譯研究起步於1957年,是世界上第4個開始搞機器翻譯的國傢,60年代中期以後一度中斷,70年代中期以來有瞭進一步的發展。現在,中國社會科學院語言研究所、中國科學技術情報研究所、中國科學院計算技術研究所、黑龍江大學、哈爾濱工業大學等單位都在進行機器翻譯的研究;上機進行過實驗的機器翻譯系統已有十多個,翻譯的語種和類型有英漢、俄漢、法漢、日漢等一對一的系統,也有漢譯英、法、日、俄、德的一對多系統。此外,還建立瞭一個漢語語料庫和一個科技英語語料庫。中國機器翻譯系統的規模正在不斷地擴大,內容正在不斷地完善。

  機器翻譯的研究是建立在語言學、數學和計算機科學這3門學科的基礎之上的。語言學傢提供適合於計算機進行加工的詞典和語法規則,數學傢把語言學傢提供的材料形式化和代碼化,計算機科學傢給機器翻譯提供軟件手段和硬件設備,並進行程序設計。缺少上述任何一方面,機器翻譯就不能實現,機器翻譯效果的好壞,也完全取決於這3個方面的共同努力。

  整個機器翻譯的過程可以分為原文分析、原文譯文轉換和譯文生成3個階段。

  在具體的機器翻譯系統中,根據不同方案的目的和要求,可以將原文譯文轉換階段與原文分析階段結合在一起,而把譯文生成階段獨立起來,建立相關分析獨立生成系統。在這樣的系統中,原語分析時要考慮譯語的特點,而在譯語生成時則不考慮原語的特點。在搞多種語言對一種語言的翻譯時,宜於采用這樣的相關分析獨立生成系統。也可以把原文分析階段獨立起來,把原文譯文轉換階段同譯文生成階段結合起來,建立獨立分析相關生成系統。在這樣的系統中,原語分析時不考慮譯語的特點,而在譯語生成時要考慮原語的特點,在搞一種語言對多種語言的翻譯時,宜於采用這樣的獨立分析相關生成系統。還可以把原文分析、原文譯文轉換與譯文生成分別獨立開來,建立獨立分析獨立生成系統。在這樣的系統中,分析原語時不考慮譯語的特點,生成譯語時也不考慮原語的特點,原語譯語的差異通過原文譯文轉換來解決。在搞多種語言對多種語言的翻譯時,宜於采用這樣的獨立分析獨立生成系統。

  迄今存在和正在研制的機器翻譯系統按其加工的深度可以分為3種類型:第1類是以詞匯為主的機器翻譯系統;第2類是以句法為主的機器翻譯系統;第3類是以語義為主的機器翻譯系統。

  從美國喬治敦大學的機器翻譯試驗到50年代末的系統,基本上屬於第1類機器翻譯系統。它們的特點是:①以詞匯轉換為中心,建立雙語詞典,翻譯時,文句加工的目的在於立即確定相應於原語各個詞的譯語等價詞;②如果原語的一個詞對應於譯語的若幹個詞,機器翻譯系統本身並不能決定選擇哪一個,而隻能把各種可能的選擇全都輸出;③語言和程序不分,語法的規則與程序的算法混在一起,算法就是規則。由於第一類機器翻譯系統的上述特點,它的譯文質量是極為低劣的,並且,設計這樣的系統是一種十分瑣碎而繁雜的工作,系統設計成之後沒有擴展的餘地,修改時牽一發而動全身,給系統的改進造成極大困難。

  60年代以來建立的機器翻譯系統絕大部分是第2類機器翻譯系統。它們的特點是:①把句法的研究放在第一位,首先用代碼化的結構標志來表示原語文句的結構,再把原語的結構標志轉換為譯語的結構標志,最後構成譯語的輸出文句;②對於多義詞必須進行專門的處理,根據上下文關系選擇出恰當的詞義,不容許把若幹個譯文詞一攬子列出來;③語法與算法分開,在一定的條件之下,使語法處於一定類別的界限之內,使語法能由給定的算法來計算,並可由這種給定的算法描寫為相應的公式,從而不改變算法也能進行語法的變換,這樣,語法的編寫和修改就可以不考慮算法。第2類機器翻譯系統不論在譯文的質量上還是在使用的方便上,都比第1類機器翻譯系統大大地前進瞭一步。

  70年代以來,有些機器翻譯者提出瞭以語義為主的第3類機器翻譯系統。引入語義平面之後,就要求在語言描寫方面作一些實質性的改變,因為在以句法為主的機器翻譯系統中,最小的翻譯單位是詞,最大的翻譯單位是單個的句子,機器翻譯的算法隻考慮對一個句子的自動加工,而不考慮分屬不同句子的詞與詞之間的聯系。第3類機器翻譯系統必須超出句子范圍來考慮問題,除瞭義素、詞、詞組、句子之外,還要研究大於句子的句段和篇章。為瞭建立第3類機器翻譯系統,語言學傢要深入研究語義學,數學傢要制定語義表示和語義加工的算法,在程序設計方面,也要考慮語義加工的特點。

  目前世界上絕大多數的機器翻譯系統都是第2類機器翻譯系統,研究的重點主要放在句法方面。有些系統以句法為主,適當增加瞭一些語義參數,以解決句法上的歧義問題。由於語義研究還不成熟,建立第3類機器翻譯系統還有相當大的困難。

  

參考書目

 劉湧泉等著:《中國的機器翻譯》,知識出版社,上海,1984。

 B.Henisz-Dostert et al,Mɑchine Trɑnslɑtion,Mouton Publishers,The Hague-Paris-New York,1979.

 劉湧泉,高祖舜,劉倬:《機器翻譯淺說》,科學普及出版社,北京,1964。