道德信念

[拼音]:jiqi fanyi

[英文]:machine translation

又稱自動化翻譯。應用語言學中的一門新興的實驗性學科,研究如何利用電子計算機按一定程式自動進行自然語言之間的翻譯問題。

20世紀30年代初,法國科學家G.B.阿爾楚尼提出了用機器來進行翻譯的想法。1933年,蘇聯發明家П.П.特羅揚斯基設計了把一種語言翻譯成另一種語言的機器,並在同年9月5日登記了他的發明。但是,由於30年代技術水平還很低,他的翻譯機沒有製成。1946年電子計算機問世後,英國工程師A.D.布斯和美國工程師W.韋弗在討論電子計算機的應用範圍時,提出了利用計算機進行語言自動翻譯的想法。1949年,韋弗發表了一份以《翻譯》為題的備忘錄,正式提出了機器翻譯的問題。1954年,美國喬治敦大學在國際商用機器公司的協同下,用IBM-701計算機進行了世界上第一次機器翻譯試驗,此後,蘇聯、英國、日本、中國等國,也相繼進行了機器翻譯試驗。1966年11日,美國科學院語言自動加工諮詢委員會公佈了一個題為《語言與機器》的報告,對機器翻譯採取否定態度,一些國家的機器翻譯研究轉入低潮。70年代初,由於現實的需要及技術的進步,機器翻譯又重新興旺起來,現在仍在不斷髮展中。美國、加拿大、法國、日本、蘇聯都先後建立了一批翻譯能力較強的機器翻譯系統。有的系統已提供給一些單位試用,如法國的俄法機器翻譯系統。有的系統已在一定範圍內正式投入使用,如加拿大的TAUM-METEO英法機器翻譯系統,用於天氣預報。還有的系統已投入市場,如美國的SYSTRAN系統和WEIDNER系統。前者在大計算機上執行,每小時能譯幾十萬詞,但譯後需加工。後者在微型機上執行,速度雖比前者慢,但仍比人譯得快。

中國機器翻譯研究起步於1957年,是世界上第4個開始搞機器翻譯的國家,60年代中期以後一度中斷,70年代中期以來有了進一步的發展。現在,中國社會科學院語言研究所、中國科學技術情報研究所、中國科學院計算技術研究所、黑龍江大學、哈爾濱工業大學等單位都在進行機器翻譯的研究;上機進行過實驗的機器翻譯系統已有十多個,翻譯的語種和型別有英漢、俄漢、法漢、日漢等一對一的系統,也有漢譯英、法、日、俄、德的一對多系統。此外,還建立了一個漢語語料庫和一個科技英語語料庫。中國機器翻譯系統的規模正在不斷地擴大,內容正在不斷地完善。

機器翻譯的研究是建立在語言學、數學和電腦科學這3門學科的基礎之上的。語言學家提供適合於計算機進行加工的詞典和語法規則,數學家把語言學家提供的材料形式化和程式碼化,電腦科學家給機器翻譯提供軟體手段和硬體裝置,並進行程式設計。缺少上述任何一方面,機器翻譯就不能實現,機器翻譯效果的好壞,也完全取決於這3個方面的共同努力。

整個機器翻譯的過程可以分為原文分析、原文譯文轉換和譯文生成3個階段。

在具體的機器翻譯系統中,根據不同方案的目的和要求,可以將原文譯文轉換階段與原文分析階段結合在一起,而把譯文生成階段獨立起來,建立相關分析獨立生成系統。在這樣的系統中,原語分析時要考慮譯語的特點,而在譯語生成時則不考慮原語的特點。在搞多種語言對一種語言的翻譯時,宜於採用這樣的相關分析獨立生成系統。也可以把原文分析階段獨立起來,把原文譯文轉換階段同譯文生成階段結合起來,建立獨立分析相關生成系統。在這樣的系統中,原語分析時不考慮譯語的特點,而在譯語生成時要考慮原語的特點,在搞一種語言對多種語言的翻譯時,宜於採用這樣的獨立分析相關生成系統。還可以把原文分析、原文譯文轉換與譯文生成分別獨立開來,建立獨立分析獨立生成系統。在這樣的系統中,分析原語時不考慮譯語的特點,生成譯語時也不考慮原語的特點,原語譯語的差異通過原文譯文轉換來解決。在搞多種語言對多種語言的翻譯時,宜於採用這樣的獨立分析獨立生成系統。

迄今存在和正在研製的機器翻譯系統按其加工的深度可以分為3種類型:第1類是以詞彙為主的機器翻譯系統;第2類是以句法為主的機器翻譯系統;第3類是以語義為主的機器翻譯系統。

從美國喬治敦大學的機器翻譯試驗到50年代末的系統,基本上屬於第1類機器翻譯系統。它們的特點是:

(1)以詞彙轉換為中心,建立雙語詞典,翻譯時,文句加工的目的在於立即確定相應於原語各個詞的譯語等價詞;

(2)如果原語的一個詞對應於譯語的若干個詞,機器翻譯系統本身並不能決定選擇哪一個,而只能把各種可能的選擇全都輸出;

(3)語言和程式不分,語法的規則與程式的演算法混在一起,演算法就是規則。由於第一類機器翻譯系統的上述特點,它的譯文質量是極為低劣的,並且,設計這樣的系統是一種十分瑣碎而繁雜的工作,系統設計成之後沒有擴充套件的餘地,修改時牽一髮而動全身,給系統的改進造成極大困難。

60年代以來建立的機器翻譯系統絕大部分是第 2類機器翻譯系統。它們的特點是:

(1)把句法的研究放在第一位,首先用程式碼化的結構標誌來表示原語文句的結構,再把原語的結構標誌轉換為譯語的結構標誌,最後構成譯語的輸出文句;

(2)對於多義詞必須進行專門的處理,根據上下文關係選擇出恰當的詞義,不容許把若干個譯文詞一攬子列出來;

(3)語法與演算法分開,在一定的條件之下,使語法處於一定類別的界限之內,使語法能由給定的演算法來計算,並可由這種給定的演算法描寫為相應的公式,從而不改變演算法也能進行語法的變換,這樣,語法的編寫和修改就可以不考慮演算法。第2類機器翻譯系統不論在譯文的質量上還是在使用的方便上,都比第1類機器翻譯系統大大地前進了一步。

70年代以來,有些機器翻譯者提出了以語義為主的第3類機器翻譯系統。引入語義平面之後,就要求在語言描寫方面作一些實質性的改變,因為在以句法為主的機器翻譯系統中,最小的翻譯單位是詞,最大的翻譯單位是單個的句子,機器翻譯的演算法只考慮對一個句子的自動加工,而不考慮分屬不同句子的詞與詞之間的聯絡。第3類機器翻譯系統必須超出句子範圍來考慮問題,除了義素、詞、片語、句子之外,還要研究大於句子的句段和篇章。為了建立第3類機器翻譯系統,語言學家要深入研究語義學,數學家要制定語義表示和語義加工的演算法,在程式設計方面,也要考慮語義加工的特點。

目前世界上絕大多數的機器翻譯系統都是第 2類機器翻譯系統,研究的重點主要放在句法方面。有些系統以句法為主,適當增加了一些語義引數,以解決句法上的歧義問題。由於語義研究還不成熟,建立第3類機器翻譯系統還有相當大的困難。

參考書目

劉湧泉等著:《中國的機器翻譯》,知識出版社,上海,1984。

B. Henisz-Dostert et al , Mɑchine Trɑnslɑtion,Mouton Publishers,The Hague-Paris-New York,1979.

劉湧泉,高祖舜,劉倬:《機器翻譯淺說》,科學普及出版社,北京,1964。