10年專業(yè)筆譯品牌?
10年數(shù)萬(wàn)場(chǎng)口譯
專業(yè)留學(xué)移民翻譯
多語(yǔ)言網(wǎng)站翻譯
89種語(yǔ)言服務(wù)
3.1 傳統(tǒng)翻譯方法
所謂的傳統(tǒng)翻譯方法主要指如下四種基本的翻譯方法:(1)基于規(guī)則(rule-based)的語(yǔ)音翻譯方法;(2)基于事例(example-based)和模板(template-based)的語(yǔ)音翻譯方法;(3)基于中間語(yǔ)義表示的(inter-lingual)語(yǔ)音翻譯方法;(4)基于統(tǒng)計(jì)模型的(statistical)翻譯方法。由于這四種翻譯方法是在文本機(jī)器翻譯中提出來(lái)的,并切有的已被廣泛地應(yīng)用于商業(yè)化翻譯軟件和實(shí)驗(yàn)系統(tǒng)中,因此,我們將其稱之為主流的翻譯方法。關(guān)于這些方法的優(yōu)缺點(diǎn)已經(jīng)有很多論著中給予了評(píng)述,這里我們不再贅述。
3.2 非傳統(tǒng)翻譯方法
所謂的非傳統(tǒng)翻譯方法是指除上述四種基本的方法以外,近幾年來(lái)提出和被嘗試的其它各種新的翻譯策略。盡管這些翻譯方法不像傳統(tǒng)的翻譯方法那樣被廣泛地承認(rèn)和采用,但它們畢竟是眾多的研究者向著實(shí)用、高效的翻譯目標(biāo)逼近的見(jiàn)證,而且其中的許多思想和策略同樣值得我們借鑒。我們將這些翻譯方法稱之為非主流的翻譯方法。
1997年Wakita等人曾提出了一種局部抽取可正確翻譯成分的語(yǔ)音翻譯方法[Wakita et al., 1997],其基本思想是以基于事例的翻譯方法為基礎(chǔ),翻譯模塊首先對(duì)輸入語(yǔ)句進(jìn)行句法和語(yǔ)義解析,然后在解析結(jié)果中尋找那些具有一定的長(zhǎng)度(詞匯達(dá)到一定的個(gè)數(shù))、結(jié)構(gòu)上符合句法、與事例庫(kù)中某一例句(或片斷)的語(yǔ)義距離小于給定門限的那些片斷或語(yǔ)塊,最后通過(guò)基于事例的翻譯方法只翻譯那些符合條件的片斷或語(yǔ)塊。實(shí)際上這種方法采用的是一種“回避困難”的權(quán)宜之計(jì)。我們注意到,這種翻譯方法并不是從整個(gè)輸入語(yǔ)句的全局來(lái)進(jìn)行語(yǔ)塊或片斷的切分[Furuse et al, 1998],而只是局部地計(jì)算片斷與事例庫(kù)中短語(yǔ)(或片斷)的語(yǔ)義距離,這樣有可能抽取出的翻譯片斷與原輸入語(yǔ)句的含義并不相符,而且,有時(shí)候整個(gè)輸入語(yǔ)句中抽取不出任何可翻譯的片斷,整個(gè)翻譯系統(tǒng)也就無(wú)任何輸出。另外,這種翻譯方法與語(yǔ)義計(jì)算密切相關(guān),因此,需要有一部高質(zhì)量的語(yǔ)義詞典和能夠真正反映片斷之間相似性的語(yǔ)義距離測(cè)度模型,而這些對(duì)于中文計(jì)算來(lái)說(shuō),往往都是比較困難的。
1999年日本德島大學(xué)(The University of Tokushima)教授任福繼博士提出了一種基于超函數(shù)的翻譯方法(Super-Function Based Machine Translation, SFBMT),這種翻譯方法的基本出發(fā)點(diǎn)是:在目前機(jī)器翻譯系統(tǒng)不能做到“信、達(dá)、雅”翻譯目標(biāo)的情況下,用戶與其對(duì)系統(tǒng)翻譯正確率和譯文可讀性等提出不現(xiàn)實(shí)的過(guò)高要求,還不如提高系統(tǒng)的運(yùn)行速度、減少系統(tǒng)開(kāi)銷、提高系統(tǒng)可控性和易修改性等性能來(lái)得現(xiàn)實(shí)。例如,一個(gè)以英語(yǔ)為母語(yǔ)的機(jī)器翻譯系統(tǒng)用戶并不會(huì)在意系統(tǒng)把“吃藥”翻譯成“take medicine”還是“eat medicine”。因此,基于這種考慮,任福繼教授提出了利用超函數(shù)(Supper-Function, SF)建立原語(yǔ)言輸入與目標(biāo)語(yǔ)言輸出之間映射關(guān)系的實(shí)現(xiàn)思路。具體地講,這種方法不像其它基于分析的機(jī)器翻譯系統(tǒng)一樣對(duì)原語(yǔ)言句子進(jìn)行徹底的句法和語(yǔ)義分析,而是通過(guò)構(gòu)造SF來(lái)建立原語(yǔ)言句子模板和目標(biāo)語(yǔ)言句子模板的對(duì)應(yīng)關(guān)系 [Ren, 1999a]。問(wèn)題的關(guān)鍵是如何獲取SF。[Ren, 1999b] 和 [Ren et al., 2000]介紹了一種機(jī)器輔助的從雙語(yǔ)對(duì)照語(yǔ)料中獲取SF的基本方法。實(shí)際上,這種基于SF的直接翻譯方法,在本質(zhì)上與統(tǒng)計(jì)模型和模板方法是完全一直的。
日本ATR-SLT (Spoken Language Translation Laboratories)研究所的Yamamoto等人提出了一種基于輸入語(yǔ)句改寫的口語(yǔ)翻譯模型,稱之為Sandglass翻譯模型[Yamamoto et al, 2001, 2002;Zong, 2001; 宗,2002b]。這種翻譯方法的一種解釋是當(dāng)翻譯引擎不能實(shí)現(xiàn)輸入句子的正確翻譯時(shí),讓系統(tǒng)的原語(yǔ)言預(yù)處理模塊自己實(shí)現(xiàn)輸入句子的自動(dòng)改寫,并不斷為翻譯引擎提供原來(lái)語(yǔ)句另外可能的表達(dá)形式。其基本思想是借鑒和模擬人在進(jìn)行口語(yǔ)翻譯時(shí)的基本模式。另一種解釋是,由于翻譯模塊能夠處理的語(yǔ)言現(xiàn)象往往是有限的,如果系統(tǒng)原語(yǔ)言預(yù)處理模塊能夠生成輸入語(yǔ)句的其它多種表達(dá)形式,那么這些表達(dá)形式中只要有一個(gè)落入到系統(tǒng)可以處理的有限的句型集之內(nèi),系統(tǒng)就可以得到原輸入語(yǔ)句的正確翻譯結(jié)果。Sandglass翻譯模型的直接效果是把復(fù)雜的原語(yǔ)言解析任務(wù)從翻譯模塊中分離出來(lái),讓原語(yǔ)言本身來(lái)表達(dá)輸入語(yǔ)句的含義,翻譯模塊可以采用簡(jiǎn)單的轉(zhuǎn)換方法,例如:模板直接匹配等方法,實(shí)現(xiàn)有限集內(nèi)原語(yǔ)言到目標(biāo)語(yǔ)言的翻譯轉(zhuǎn)換。
實(shí)際上,Sandglass口語(yǔ)翻譯模型面臨許多新的問(wèn)題和技術(shù)難點(diǎn),而且,人們最容易提出這樣一個(gè)問(wèn)題:如果系統(tǒng)能夠?qū)υ斎胝Z(yǔ)句進(jìn)行分析和改寫,那么,為什么不直接將其翻譯呢?
后來(lái),人們提出了基于簡(jiǎn)化表達(dá)式的語(yǔ)音翻譯方法[Zong et al., 2000b]等多種方法??偲饋?lái)說(shuō),非傳統(tǒng)方法基本上都是在傳統(tǒng)方法的基礎(chǔ)上進(jìn)行的改造。
3.3 人機(jī)互助的混合翻譯方法
人機(jī)互助的混合翻譯方法是指多種翻譯策略并用的多引擎交互式口語(yǔ)翻譯方法。目前從事的語(yǔ)音翻譯研究都是針對(duì)推進(jìn)式的對(duì)話方式(push-to-talk dialogue),即兩個(gè)持不同語(yǔ)言的說(shuō)話人之間的對(duì)話過(guò)程是按每人一句進(jìn)行的,也就是說(shuō)當(dāng)一方說(shuō)完以后,系統(tǒng)把該說(shuō)話人的語(yǔ)句翻譯完畢并發(fā)送給對(duì)方,對(duì)方聽(tīng)完來(lái)自彼端說(shuō)話人的翻譯語(yǔ)音后才開(kāi)始發(fā)音。在這種情況下,翻譯人員(翻譯器)可以有機(jī)會(huì)與說(shuō)話人溝通,在實(shí)施翻譯之前翻譯(器)可以主動(dòng)地與說(shuō)話人對(duì)話,弄清說(shuō)話人使用的詞匯,確認(rèn)說(shuō)話者的意圖。我們認(rèn)為,在這種對(duì)話翻譯系統(tǒng)中,中間翻譯角色必須具備與說(shuō)話人對(duì)話的能力,即翻譯者與說(shuō)話人之間應(yīng)該是交互式的,而不是單向的。但從目前研究情況來(lái)看,除了JANUS系統(tǒng)外,幾乎都不是人機(jī)交互式的,人們只是在原語(yǔ)言識(shí)別和分析技術(shù)上下功夫,一廂情愿地希望能夠通過(guò)改進(jìn)識(shí)別技術(shù)和翻譯策略來(lái)提高系統(tǒng)翻譯的正確率和魯棒性,但實(shí)際上這有點(diǎn)兒徒勞無(wú)功,因?yàn)楫吘谷苏f(shuō)話是無(wú)法控制的,說(shuō)話人愿意怎么講就怎么講,想到哪里就說(shuō)到哪里,根本不像書(shū)面語(yǔ)那樣經(jīng)過(guò)深思熟慮,并且有表達(dá)符號(hào)標(biāo)記,而且說(shuō)話人可能隨時(shí)對(duì)前面說(shuō)過(guò)的話進(jìn)行修正,在這種情況下讓系統(tǒng)無(wú)論“聽(tīng)懂”還是“聽(tīng)不懂”硬去翻譯,根本不給系統(tǒng)提問(wèn)的機(jī)會(huì),這有點(diǎn)兒不合情理,好像翻譯器和說(shuō)話人也都是不負(fù)責(zé)任的,說(shuō)話人不管系統(tǒng)是否理解,只管說(shuō),系統(tǒng)則不管理解的對(duì)與錯(cuò),只管翻。以這種方式實(shí)現(xiàn)的語(yǔ)音翻譯系統(tǒng)的正確率和魯棒性至今沒(méi)有根本性的改進(jìn)和提高也似乎是情理之中的事情。
近幾年中人們提出了一些交互式翻譯的設(shè)想[Waibel, 1996; Boitet, 1996; Blanchon, 1996; Seligman, 1997, 1998],但通過(guò)對(duì)這些交互式口語(yǔ)翻譯系統(tǒng)的分析我們發(fā)現(xiàn),其交互過(guò)程都是針如何校對(duì)語(yǔ)音識(shí)別器的錯(cuò)誤結(jié)果進(jìn)行的,這種實(shí)現(xiàn)思想的出發(fā)點(diǎn)都是認(rèn)為機(jī)器翻譯模塊只能接受100%正確的輸入語(yǔ)句。而實(shí)際上這是不現(xiàn)實(shí)的,一方面,語(yǔ)音識(shí)別器不可能做到無(wú)錯(cuò)誤識(shí)別,尤其說(shuō)話人在復(fù)雜環(huán)境下;另一方面,說(shuō)話人與系統(tǒng)之間的交互過(guò)程勢(shì)必要影響系統(tǒng)的實(shí)時(shí)性,更重要的是說(shuō)話人是否愿意使用這樣一個(gè)繁瑣的需要不停地校對(duì)錯(cuò)誤的用戶界面,用戶所能夠忍受的極限有多大?進(jìn)一步分析,即使機(jī)器翻譯模塊接收到的輸入是完全正確的,系統(tǒng)就一定能夠得到正確的輸出嗎?顯然未必。那么,問(wèn)題就在于系統(tǒng)是否能夠真正“理解”說(shuō)話人的意圖,如果系統(tǒng)一旦發(fā)現(xiàn)輸入語(yǔ)句中存在無(wú)法消除的歧義,系統(tǒng)如何與說(shuō)話人進(jìn)行交互,向說(shuō)話人獲取系統(tǒng)想要得到的知識(shí)。因此,基于這樣的考慮我們提出了基于對(duì)話管理的交互式語(yǔ)音翻譯方法[Zong et al., 2002],在這個(gè)交互式翻譯框架下,我們提出了基于填充槽的翻譯方法(Slot-based translation)。
譯雅馨深圳翻譯認(rèn)為,基于對(duì)話管理的交互式口語(yǔ)翻譯方法基本上模擬了人的翻譯過(guò)程,該方法不但可以方便地集成傳統(tǒng)翻譯方法和非傳統(tǒng)翻譯方法中的多種翻譯策略,而且可以將語(yǔ)音-語(yǔ)音翻譯和文本-語(yǔ)音翻譯有效地統(tǒng)一起來(lái),有利于推進(jìn)口語(yǔ)翻譯系統(tǒng)的盡早實(shí)用化。
3.4 分析方法與統(tǒng)計(jì)方法的比較
分析方法與統(tǒng)計(jì)方法一直是自然語(yǔ)言處理中采用的兩大主流方法,實(shí)際上,在我們上面介紹的三種翻譯方法中,分析方法與統(tǒng)計(jì)方法都是不可缺少的兩種基本方法。在過(guò)去自然語(yǔ)言處理研究中,尤其是機(jī)器翻譯研究的幾十年中,關(guān)于這兩種方法的優(yōu)劣比較和結(jié)合策略等問(wèn)題的爭(zhēng)論從來(lái)都沒(méi)有停止過(guò)。2002年日本ATR-SLT的Sumita博士介紹,在ATR進(jìn)行的語(yǔ)音翻譯實(shí)驗(yàn)中,基于事例的翻譯方法的正確率要遠(yuǎn)遠(yuǎn)高于基于統(tǒng)計(jì)的翻譯方法[Sumita, 2002]