概況 關於世界上的語種數目,幾十年來學者們曾做過不懈的調查和統計,以期得到比較確切的數字,但仍有爭議。首先,語言本身在由一代人傳給另一代人的過程中有變化,到一定階段會形成若幹方言,而方言的不斷變化最終會產生新的語言;另一方面,已有的語言又可能由於社會和其他原因逐漸消亡。此外,由於不同學者使用的標準不同,語言和方言之間往往很難劃出明確的界線。

  劃分語言的標準有幾種。一般說,當語言變變體發展到交談雙方不能互通的時候,它們就成為各自獨立的語言。但這一標準也有例外。挪威人、瑞典人和丹麥人彼此用各自的語言交談,能夠互通,但人們通常把他們的語言看作是3種不同的語言;另一方面,阿拉伯語各方言之間差別很大,摩洛哥地區通行的阿拉伯語方言跟巴勒斯坦地區通行的方言,其差別之大,猶如西班牙語之於法語,但人們並不把阿拉伯語諸方言分別看作獨立的語言。另一種標準是看使用某一語言的社團是否有獨立的文化。根據這一標準,人們一般認為荷蘭本土的荷蘭語和南非的阿非利堪斯語是兩種獨立的語言,盡管這兩種語言可以互通;而荷蘭語和比利時的弗拉芒語雖然在兩個不同的政治實體中使用,卻常被某些學者看作是一種語言。除此之外,還有語言-社會的和語言-民族的標準。但是,不同語言學傢在具體運用這些標準的時候,往往具有較強的主觀色彩和各自不同的側重面,所以,到底算是一種還是幾種語言,在許多情況下往往是由歷史和習慣決定的,其原因十分復雜,試圖單靠現有的語言標準去做出判斷和解釋,很難做到準確可靠。

  由於語言與方言之間不易界說清楚,學者們在統計世界諸語言時,所得的數字往往出入很大。此外,非洲、美洲、澳大利亞等地本土人民所說的語言,學者們對它們的瞭解還非常有限,要弄明白確數當然就更加困難。而正是在這些地區,語言的數量相當大。因此有些語言學傢主張,在目前情況下,對世界語言的數目隻能作出某些近似的估計,一種估計是2500~5000種,還有一種估計是4000~8000種。

  就使用人數來說,世界諸語言很不平衡,少數語言有可觀的使用人數,而大多數語言使用人數則很少。有的印第安語少到隻有幾十個人,甚至幾個人。個別語言,由於使用它的最後一個人死去,這種語言也隨之消亡。如1898年,隨著南斯拉夫克爾克島上說達爾馬提亞語的最後一個人死去,這種語言也就不復存在瞭。全世界有10種語言的使用者加在一起,超過世界總人口的半數,它們是:漢語、英語、俄語、西班牙語、印地語、阿拉伯語、日語、德語、葡萄牙語、烏爾都語。另外,世界上幾千種語言中,按使用人數排在最前面的100種語言,其總人數占世界人口90%以上;但又有1000多種語言,其使用者加在一起還不到世界人口的1%。這是世界諸語言使用情況的一個重要特點。世界語言的地理分佈也很不平衡,大多數語言隻在很有限的區域內起傳遞信息的作用,而少數語言卻在十分廣闊的區域內通行,如英語、西班牙語。就語系分佈而言,情況更是如此。印歐語系的語言,無論從使用人數還是從分佈區域看,均堪稱世界最大的語系,而北美有的印第安語的語系少到隻包括幾種語言,如愛斯基摩 -阿留申語系實際隻包括兩種語言,使用人數也很少。

  分類 一般地講,世界諸語言有3種分類法:①類型分類法,②區域分類法(或稱地理分類法),③譜系分類法(或稱發生學分類法)。

  這3種分類法的理論基礎各不相同,因而根據這些方法劃分語言類別,往往互有交叉。

  類型分類法 傳統的類型分類法主要根據詞的形態結構(不是根據親屬關系)來劃分語言。這是一種純粹的共時分類法,它按照結構的同形特點,把語言劃分為若幹類型,既不考慮它們的歷史來源,也不考慮它們過去和現在的地理分佈。根據語言的形態標準,一般分作3 大類:① 分析型語言(即國外學者所說的孤立語)。其特點是詞基本上無專門表示語法意義的附加成分,形態變化很少,語法關系靠詞序和虛詞來表示。大多數分析型語言都是單音節的,其中許多語言有幾個聲調。漢藏語系的語言多是分析型語言,非洲的一些語言也是分析型語言。②粘著型語言。其特點是詞內有專門表示語法意義的附加成分,一個附加成分表達一種語法意義,一種語法意義也基本上由一個附加成分來表達;詞根或詞幹跟附加成分的結合不緊密。屬於粘著型語言的有:古代的蘇默語(已消亡)、烏拉爾、阿爾泰、高加索、達羅毗荼等語系的許多語言,以及亞洲和太平洋地區的另一些語言如日語、朝鮮語、巴佈亞諸語言等。歐洲的巴斯克語、非洲的斯瓦希裡語、班圖諸語言、美洲本土的語言等,也都屬粘著型語言。英語的某些復合詞具有粘著型語言的特點。有些學者認為,粘著型語言是介於分析型語言和屈析型語言之間的語言。③屈折型語言。其特點是用詞形表示語法關系(一個格式往往可以表示幾種語法意義)。詞根或詞幹跟附加意義結合很緊密,往往不易截然分開;有的甚至用內部屈折來表達語法意義。屈折型語言的數量比粘著型語言的數量要少得多,但它包括兩個重要語系──印歐語系和阿非羅-亞細亞語系(閃-含)的語言,如梵語、希臘語、拉丁語、阿拉伯語、希伯來語,以及歐洲的許多近代語言,如俄語等。

  有些語言學傢建議除以上三類語言外,再加一類“多式綜合語”(中國有些學者也稱“編插語”)。其特點是把主語、賓語和其他語法項結合到動詞詞幹上,以構成一個單獨的詞,但表達一個句子的意思。屬這類語言的如愛斯基摩 -阿留申諸語言等。

  晚近的形態分類法則是根據句子的基本成分──主語(S)、動詞(V)和賓語(O)──在簡單陳述句中的位置來劃分語言。這樣可以把世界諸語言劃分為3個主要的類型:SVO型(主-動-賓)、VSO型(動-主-賓)和SOV 型(主-賓-動)。句法系統在這裡受各語言間的共性成分的影響。類型分類歷來不及譜系分類用得廣泛,主要是因為傳統的類型分類僅著眼於語言的表面特征,使得許多情況無法界說清楚。通過考察語言的底層結構來確定那些對語言結構起支配作用的共性成分,是今天的重要研究課題之一。由於這樣的共性成分是可以認識的,因而有可能改變我們對類型分類可靠性和實用性的認識。

  區域分類法 區域分類法是按地區劃分語言的一種方法,它的主要依據是:由於地理上相鄰,一些語言在長期的聚合過程中會獲得某些共同的特征。一個地區的語言,往往會受到該地區具有文化優勢的語言的影響,這些語言之間也會產生相互影響,從而在語音、詞匯、語法上具有較多的一致性。這種方法使語言有可能取得較大的分類,不致過於繁瑣。在某些地區的語言事實和語言親屬關系不夠清楚的情況下,人們常把區域分類法和譜系分類法結合起來使用,有些學者對美洲印第安語和巴佈亞等地的語言就是采取這種做法。

世界諸語言分類表

世界諸語言分類表 續表

世界諸語言分類表 續表

世界諸語言分類表 續表

  這裡一個相關的重要問題是語言聯盟(又稱“語言區域”)問題,近年來它日益受到語言學傢的廣泛關註。所謂語言聯盟,是指同一地區或毗鄰地區通行的數種沒有親屬關系的語言,由於長期接觸,互相影響而獲得語法、語音等方面的許多相似或共同特征。這種現象在19世紀還被人認為是不可思議的,不少人認為兩種語言的形態隻能是相互排斥,不可能混合,即便有也是一種畸形現象。包括A.梅耶在內的一些著名學者都持有這種觀點。但是最近幾十年來,一些語言學傢的研究結果已經推翻瞭這種看法。事實證明,音位和形態系統的相互滲透並無界限可言。語言學傢已經描寫瞭許多具有混合體系(語音體系和形態 -句法體系)的語言,證明語言滲透所引起的語言聯盟,是世界上幾乎所有地區都普遍存在的一種現象。例如巴爾幹語言聯盟,所涉及的語言有現代希臘語、阿爾巴尼亞語、羅馬尼亞語、保加利亞語,以及部分涉及塞爾維亞-克羅地亞語和土耳其語。雖然除土耳其語外,其他語言均屬印歐語系,但大多不屬同一語族(希臘語和阿爾巴尼亞語各構成一個獨立的語族,羅馬尼亞語屬羅曼語族,保加利亞語、塞爾維亞 -克羅地亞語屬斯拉夫語族)。它們中除個別語言之間共同特點較多外,大部分語言並無密切的關系。但是在長達幾個世紀的接觸中,由於拜占庭文化在這個地區顯示出的較強凝聚力和各語言間的相互影響、滲透,上述語言獲得瞭被世人稱為 “巴爾幹語言特點”的許多共同特征。這不僅表現在詞匯平面上,也表現在音位和形態 -句法平面上。今天,巴爾幹半島語言聯盟所包括的地區,還有進一步擴大的趨勢。類似的例子還有印度次大陸、南非等地的語言聯盟。對這種現象的進一步研究,無疑會給語言分類提出許多新的課題、展示新的前景。

  譜系分類法 譜系分類法是近代用得最廣泛的一種分類法。它主要根據某一共同母語在分化過程中保留下來的共同特征(語音、詞匯、語法方面的共同成分)來劃分語言。譜系分類和區域分類,都具有明顯的歷時性。在19世紀以前的好幾百年中,《聖經》關於人種分佈的傳說對語言分類的研究產生過影響。1786年,英國學者W.瓊斯比較瞭梵語、希臘語、拉丁語的某些共同特點之後,發現瞭其間的對應規律,於是提出印歐諸語言同屬一系的理論。此後,歷史比較語言學興起,學者們用這種方法又研究瞭許多別系的語言。某些學者在譜系分類的基礎上,企圖重建“人類最初的共同語言形式”(有的學者稱作化石語言),以此來證明世界諸語言同出一源的假說。這種構擬建立在層層假設之上,多半是無法驗證的。受到學者重視的是有文獻可據和推斷周密的譜系分類,即歷史比較語言學。

  關於譜系分類的層次和術語,各國學者不盡統一,一般區分為語系、語族、語支等。語系是有共同來源的諸語言的總稱,語系之下可根據語言的親疏程度再細分為語族、語支。越往下,其成員的親屬關系越密切。德國語言學傢A.施萊歇爾把這種關系概括為譜系樹模型,即把同一語系的語言間的關系比喻為一棵樹的形狀,由根部和主幹(語系)分出若幹枝杈(語族和語支)。他把自己對語言類別的描述比作達爾文對生物進化類別的描述。德國的另一位語言學傢J.施密特則提出瞭印歐語言傳播的“波浪理論”(又稱“波浪說”),以取代施萊歇爾的“譜系樹”之說。施密特認為,原始印歐語由許多方言組成,其中新的語言成分從中心區向四周作波浪式傳播。印歐諸語言由一系列共同語言特征聯結在一起,這些語言之間並無明確的界限,是逐漸地,不明顯地從一種語言過渡到另一種語言。他的理論對印歐語研究產生過較大影響。現在世界上許多地區的“語言聯盟”現象是“波浪理論”的一個很好的印證。

  對於親屬關系沒有太多實證的語言,特別是像美洲和巴佈亞等地那些調查還不夠詳盡的語言,近年來有些語言學傢傾向於把它們劃歸在某一個聯系比較松散的大語群中。由於使用的術語很不統一,或者術語相同,而內涵並不相同,世界諸語言的語系的劃分往往出入很大,從三四十個到一百多個不等。另外,由於語言內部的情況千差萬別,確定語言親屬關系往往有很大困難,對其中有些語言,有時隻好滿足於區域的分類。下面雖然主要是譜系分類,但有的地方也參照瞭區域分類的方法。在各語系中,印歐語系的研究是最深入的,分類也最詳盡,而其他語系的界說則由於研究的深度不同而詳略不一。一般來說,越往下細分,困難越大,分歧也越多。目前對世界上許多語言的研究還不夠深入細致,在下面的分類中,有些語言隻劃分到語族一層。

  無論是類型分類法,還是區域分類法、譜系分類法,都首先有賴於對各語言作準確細致的描寫,但是在許多情況下今天卻難於做到。一個人由於情況所限,僅靠他個人的語言知識是不可能對世界諸語言作出接近實際的分類的。但他卻可以綜合前人或他人的研究成果來做到這一點。在這方面,較早的例子有法國語言學傢A.梅耶和M.柯恩主持編寫的《世界的語言》(1952),晚近的例子有美國語言學傢C.F.沃格林,他的工作是值得稱道的。他本人的主要研究領域是北美印第安語,但他和F.M.沃格林合作出版的《世界語言的分類與索引》(1977),卻把各國學者關於各語系、語族(甚至語支)分類問題的研究成果匯集於一書,客觀加以介紹,並闡述自己的意見,使讀者得以瞭解在某個語系、語族或語支的分類問題上各有關學者的不同主張,便於讀者自己去分析比較。

  美洲印第安語言 對於美洲印第安語的研究還很不夠。語言學傢、特別是美國的一些語言學傢,為拯救某些瀕於消亡的印第安語,做瞭大量記錄和分析。但由於印第安語數量很大( 估計語言和方言逾1000種),且絕大多數沒有文字,至今連這些語言的數字還難以確定。關於美洲印第安語的譜系分類分歧很大,有的學者劃分的語系多達100多個。近年來有歸並語系的傾向,有的學者用“大語群”這一術語來包括若幹語系,但是都遠非定論。某些學者甚至推測除愛斯基摩 -阿留申等極個別語系外,北美、南美和中美的所有印第安語言最終都可能有親屬關系,但這有待於語言學上的證實。

  關於印第安語的劃分,習慣上以墨西哥為界,以北的稱作北美印第安語,以南(包括墨西哥)的稱作中美和南美印第安語(有時統稱為南美印第安語)。中美和南美的印第安語的數量比北美印第安語要多得多,但對它們的研究卻遜於對北美印第安語的研究,文獻資料更少。

  巴佈亞和澳大利亞諸語言 巴佈亞諸語言主要分佈於新幾內亞島,少數分佈在新不列顛和所羅門群島。幾十年前,新幾內亞在語言學上被稱做不為人所知的地方。近年由於語言學傢的努力,大部分新幾內亞的語言得到瞭識別。島上居民由於叢林遍地,基本上處於隔絕狀態。語言多達650種以上。有的語言隻有幾十個人使用,有時相鄰的兩個村子的語言不能互通。學者們對這些語言的分類往往各執一說。有的把它們劃歸許多語系,然後把這些語系算作一個松散地結合在一起的大語群。分佈最廣的巴佈亞語言是島西部的本圖尼語,其次是馬林德語和寧博拉語等;在島東部,主要語言包括恩加語、卡泰語和基懷語。

  澳大利亞的土著語言多達200種以上,其中許多正在消亡。使用人數比較多的語言隻有分佈於托裡斯海峽諸島的馬佈亞格語,其他大部分語言隻有幾百個使用者。

  系屬不明的語言 語言間的親屬關系,隻有在對語言進行充分調查的基礎上才能確定,分類也才有根據。但是由於語言材料不足,更由於譜系分類法所依賴的歷史比較法的局限性,世界上還有某些語言至今系屬不明,如西班牙和比利牛斯山西部法國部分省份的巴斯克語。學者們做過多種嘗試,陸續將巴斯克語跟柏柏爾諸語言、阿爾岡基亞諸語言、已消亡的歐洲語言如伊比利亞語等進行比較,都沒有得出結論;還有學者認為它是阿基坦人的語言的派生語;有的又說它跟高加索諸語言有遠親關系。但到目前為止,比較一致的看法仍認為它是一種跟別的語言沒有親屬關系的獨立語言。

  分佈於克什米爾西部喀喇昆侖山脈的佈魯沙斯基語,是另一種系屬不明的語言。雖然它的語音系統跟印度諸語言、其語法跟達羅毗荼諸語言有相似之處,但它們之間卻沒有親屬關系,也沒有發現與別的語言有親屬關系。

  分佈於庫頁島和北海道附近島嶼的阿伊努語,曾有學者認為它跟日語有親屬關系,也有人認為它與印歐語有關系,近世學者又提出它屬於古西伯利亞諸語言,但這些看法都沒有得到普遍承認。

  關於日語和朝鮮語的系屬問題,也存在著爭議。傳統上,人們習慣於把它們看作是系屬不明的語言,可是近年來,有些語言學傢傾向於把它們(特別是朝鮮語)劃歸阿爾泰語系,甚至有的學者把日語劃歸南島語系,這些都需要語言學上的確證。

  系屬不明的語言在其他地區還有一些,情況也不盡相同,有待於學者們進一步探討。(見彩圖)

世界主要語系分佈圖

歐洲主要語言分佈圖、世界主要語言分佈圖