欢迎光临长春翻译网
关于我们 | 加入收藏夹 | English
当前位置:主页>机械翻译>
全文翻译技术的发展脉络
来源:  作者:本站

基于规则的机器翻译的技术是最成熟的,也是到目前为止应用最广的,目前有影响的机器翻译系统都是基于规则的。基于规则的机器翻译系统就是对语言语句的词法、语法、语义和句法进行分析、判断和取舍,然后重新排列组合,生成等价的目标语言。

  基于中间语言的方法是对源语言进行分析后产生一种成为中间语言的表示形式,然后直接由这种中间语言的表示形式生成目标语言。所谓中间语言就是自然语言的计算机表示形式的系统化,它试图创造出一种独立于各种自然语言,同时又能表示各种自然语言的人工语言。

  基于规则的机器翻译发展到今天,相对来说已比较成熟。虽然经过长期的努力,人们已经建立含有成千上万个规则的规则库,覆盖了相当大的语言现象,但是从理论上讲,这种过程仍然很有限。因为语言是一个民族经过几千年的积累,是约定俗成而又动态发展的。随着社会的不断发展,新的词汇和语言现象不断出现。现有的机器翻译系统的规则再多,也只是特定语言现象的概括和总结。因此,基于规则的机器翻译方法借鉴了其他方法的优点,并产生很多变化,主要体现在以下几个方面:

  在规则的获取方面,传统的规则方法主要依靠语言学家总结规则进行调试,而现在更加重视从语料库中获取规则(如采用错误驱动的学习算法);

  传统的规则方法往往偏重描述粗粒度的、全局化的大范围语言学规则知识,而现在则更加重视描述细粒度的、局部的小范围的语言学知识,呈现出“小规则库、大词典”的趋势;

  在知识表示方面,为了以更小的粒度、更加准确地对翻译知识进行描述,一般要对单纯的上下文无关规则做一些改进;

  传统的规则方法采用的往往是非此即彼的确定性原则,系统的鲁棒性较差,而现在规则系统中一般都引入各种形式的概率或评分函数,系统的鲁棒性有所提高。

  基于语料库的机器翻译方法

  基于统计的机器翻译方法和基于实例的机器翻译方法都是使用语料库作为翻译知识的来源。二者的区别在于:在基于统计的机器翻译方法中,知识的表示是统计数据,而不是语料库本身,翻译知识的获取是在翻译之前完成,翻译的过程中不再使用语料库;而在基于实例的机器翻译方法中,双语语料库本身就是翻译知识的一种表现形式(不一定是惟一的),翻译知识的获取在翻译之前没有全部完成,在翻译的过程中还要查询并利用语料库。

  统计翻译的数学模型是由IBM公司的Brown等人提出来的。统计机器翻译的基本思想是,把机器翻译看成是一个信息传输的过程,用一种信道模型对机器翻译进行解释。假设一段源语言文本S,经过某一噪声信道后变成目标语言T,也就是说,假设目标语言文本T是由一段源语言文本S经过某种奇怪的编码得到的,那么翻译的目标就是要将T还原成S,这也就是一个解码的过程。
上一页12 下一页

免责声明:凡本站注明来源为xx所属媒体的作品,均转载自其它媒体转载目的在于传递更多信息,并不代表本站赞同其观点和对其真实性负责。