机器翻译对翻译专业人员的影响与促进外文翻译资料

 2022-11-11 11:21:38

文献翻译原文

Extracted from Machine Translation and Human Translation: In Competition or in Complementation?

JOHN HUTCHINS University of East Anglia

[From: International Journal of Translation, vol.13, no.1-2, Jan-Dec 2001]

1.INTRODUCTION

Ever since the idea of using computers to translate natural languages was first proposed in the 1940s and since the first investigations were begun in the 1950s, translators have watched developments either in scorn or in trepidation. Either they have dismissed the very notion that anyone could even believe that translation could be mechanized, or (at the other extreme) they have feared that their profession would be taken over entirely by machines.

The first of these attitudes found expression as early as 1951 in a report for Unesco by J.E.Holmstrouml;m. He believed that from a machine translation (MT) system, “the resulting literary style would be atrocious and fuller of lsquo;howlersrsquo; and false values than the worst that any human translator produces”. The reason was that “translation is an art; something which at every step involves personal choice between uncondifiable alternatives; not merely direct substitutions of equated sets of symbols but choices of values dependent for their soundness on the whole antecedent education and personality of the translator” (Holmstrouml;m 1951). His comments preceded by three years the first tentative demonstration of a small prototype system, and were based on pure speculation. Nevertheless, such comments have been repeated again and again by translators for nearly fifty years, and no doubt they shall be heard again in the next fifty.

The second attitude has also persisted to the present day. However, there is now no doubt that computer-based translation systems are not rivals to human translators, but they are aids to enable them to increase productivity in technical translation or they provide means of translating material which no human translator has ever attempted. In this context we must distinguish (1) machine translation (MT), which aims to undertake the whole translation process, but whose output must invariably be revised; (2) computer aids for translators (translation tools), which support the professional translator; and (3) translation systems for the occasional non- translator user, which produce only rough versions to aid comprehension. These differences were not recognized until the late 1980s. The previous assumption had been that MT systems, whether running on a mainframe or a microcomputer, could serve all these functions with greater or lesser success. In part, this failure to identify different needs and to design systems specifically to meet them has contributed to misconceptions about translation technology and its impact for the professional translator.

2.THE FIRST MT SYSTEMS

When machine translation (MT) was in its infancy, in the early 1950s, research was necessarily modest in its aims (Hutchins 1986, 1997). It was constrained by the limitations of hardware, in particular by inadequate computer memories and slow access to storage (of dictionaries and texts), and by the unavailability of high-level programming languages. Even more crucially it could look to no assistance from the language experts. Syntax was a relatively neglected area of linguistic study and semantics was virtually ignored. The earliest researchers knew that whatever systems they could develop would produce poor quality results, and they assumed major involvement of human translators both in the preedition of input texts and in the post-editing of the output. To reduce problems of ambiguity - seen as the crucial difficulty - they proposed also the development of controlled languages and the restriction of systems to specific subject areas.

In this atmosphere the first demonstration system was developed, a collaboration between IBM and the Georgetown University in 1954. Based on small vocabularies and carefully selected texts, the translations produced were impressively colloquial. Consequently, the general public and potential sponsors of MT research were led to believe that good quality output from automatic systems was achievable within a matter of a few years. The belief was strength end by the emergence of greatly improved computer hardware, the first programming languages, and above all by developments in syntactic analysis based on research in formal grammars (e.g. by Chomsky and others.)

For the next decade MT research grew in ambition. It became widely assumed that the goal of MT must be the development of fully automatic systems producing high quality translations. The use of human assistance was initially regarded as an interim arrangement. The emphasis of research was therefore on the search for theories and methods for the achievement of lsquo;perfectrsquo; translations. It was of course this assumption that alarmed professional translators and that was famously criticised by Bar-Hillel (1960), who castigated current MT projects for their pursuit of the unattainable goal of fully automatic high quality machine translation. For most MT researchers in the 1960s, however, the current systems were temporary solutions to be superseded in the near future. They continued the lsquo;perfectionistrsquo; goal and gave virtually no serious consideration to how lsquo;less than perfectrsquo; MT could be used effectively and economically in practice. Even more damaging was the almost total neglect of the expertise of professional translators, who naturally became anxious and antagonistic. They foresaw the loss of their jobs, since this is what many MT researchers themselves believed was inevitable.

Progress was much slower than expected, and the output of systems showed no sign of improvements. Promises and forecasts of imminent breakthroughs did not come. With such lack of progress it was not surprising that in 1966 a committee set up by U

剩余内容已隐藏,支付完成后下载完整资料


文献翻译译文

选自:OHN HUTCHIN(东安格利亚大学)的《机器翻译与人类翻译:竞争还是互补?》国际翻译杂志,vol.13,no.1-2,2001年1月至12月

1.简介

自从有人在20世纪40年代首次提出使用计算机翻译自然语言的想法以来,在20世纪50年代开始就有人进行第一次调查,此后翻译人员一直在蔑视或惶恐地看待计算机翻译的发展。 有些人甚至认为翻译可以机械化,他们甚至驳斥了这种观点,从另一个极端来说,他们是担心他们的职业会完全被机器所替代。

早在1951年联合国教科文组织的一份报告中,J.E.Holmstrouml;m就首次表达了这个想法。 他认为,从机器翻译(MT)系统来看,“由机器翻译产生的文学风格将比任何人类译者所制造出的最坏的结果更加残暴,更加充满“咆哮感”和错误的价值观。”其原因在于“翻译是一门艺术;每一环节都涉及到个人在不可编纂的选择之间作出选择;这不仅是对一套等同符号的直接替代,而且更是对价值观的选择,这取决于译者的整个前期教育和个人人格”(Holmstrouml;m 1951)。这是他在三年前对一个小型原型系统进行第一次试探性演示时作出的评论,而且是基于纯粹的推测。然而在近五十年间,这种的想法一再被翻译者所重复,并且毫无疑问的是,在接下来的五十年里,这种想法将会再次掀起波澜。

第二种想法也一直到今天都还在持续。但显而易见基于计算机的翻译系统并不是人类翻译的对手,并且它还可以帮助人们提高技术翻译的效率,也能够提供人类译者在翻译材料时从未尝试过的翻译手段。在这一背景下,我们必须区分三种情况:

  1. 机器翻译(MT),它的目的是进行整个翻译过程,但必须修改它输出的内容;

(2)计算机辅助翻译(翻译工具),它是用来为专业译者提供帮助的;(3)“临时”非译者用户的翻译系统,它只翻译出粗略的版本,来帮助用户进行理解。而这些差异直到20世纪80年代末人们才发现这些差异。先前的假设是,无论是在主机上还是在微型计算机上运行,机器翻译系统都能或多或少地成功地实现以上所有的功能。未能确定不同的需求并设计专门的系统以满足这些需求的失败,在某种程度上导致了对翻译技术的误解及其对专业翻译人员的影响。

2.第一个机器翻译(MT)系统

20世纪50年代初,机器翻译(MT)还处于起步阶段,研究的目的必然是适度的(Hutchin1986,1997)。它受到硬件的限制,特别是计算机内存不足和(字典和文本)存储速度慢,以及无法使用高级编程语言。更重要的是,它没有寻求语言专家的帮助。句法是语言学研究中一个相对被忽视的领域,而语义学基本上是被忽略了。最初的一批研究者知道,他们开发的所有系统都会产生质量不好的结果,并且他们认为人类译者主要是要参与输入文本前的预先编辑和输出后的后期编辑。“产生歧义”被认为是关键的困难,为了减少歧义,他们还建议发展受控语言以及对特定主题领域的系统限制。在这样的氛围下,IBM和乔治城大学于1954年合作开发了第一个演示系统。基于小词汇表和精心挑选的文本,其所产生的口语化的翻译结果令人印象深刻。因此,普通公众和MT研究的潜在赞助者相信,自动化系统的高质量输出是可以在几年内实现的。在极大地改进了计算机硬件(第一代编程语言),最重要的是在形式语法研究的基础上发展了语法分析(例如乔姆斯基和其他人的研究)之后,这一信念得到了加强。

在此后的十年里,MT研究的雄心越来越大。人们普遍认为机器翻译的目标必须是开发产生高质量翻译的全自动系统。使用人力援助最初被视为一种临时安排,因为研究的重点是寻求实现“完美”翻译的理论和方法。当然,正是这一假设引起了专业翻译人员的警觉,Bar-Hillel(1960)严厉的批评了当时的机器翻译项目,原因在于它们追求的是“全自动高质量机器翻译”这一无法实现的目标。然而,对于20世纪60年代的大多数MT研究人员而言,目前的系统是在不久的将来被取代的临时解决方案。他们机组追求“完美主义”的目标,并且几乎没有认真考虑过如何在实践中有效和经济地使用“不完美”的机器翻译。更具破坏性的是,他们几乎完全忽视了专业翻译人员的专业知识,自然会让专业翻译人员变得焦虑和敌对。他们预见到会失去工作,因为这是许多机器翻译研究人员自认为是不可避免的。

进展比预期的要慢得多,各系统的产出也没有任何改善的迹象。有关即将取得突破的承诺和预测并未实现。在如此缺乏进展的情况下,1966年由美国研究赞助商设立的自动语言处理咨询委员会(ALPAC 1966)宣布机器翻译失败了,这并不令人意外,因为目前还没有能够实现高质量翻译的全自动系统,而且在不久的将来,这样的系统似乎没有什么前景。委员会还相信,就美国政府和军队对俄英翻译的需求而言,有足够的人力翻译资源可供使用。

虽然ALPAC的报告结束了美国(甚至全世界)的许多机器翻译研究项目,但这并没有消除公众认为研究的本质是寻求全自动解决方案的看法。随后的翻译技术史在一定程度上说明了早年这种错误的强调是如何被修复和纠正的。由于提供了翻译工具和翻译工作站,对翻译专业的忽视最终得到了纠正。机器翻译研究本身也越来越多地转向开发现实的实用系统,在这些系统中,人类在不同阶段的参与被完全接受成为设计架构的一个组成部分。自20世纪70年代初以来,机器翻译在三个主要方面继续发展:基于计算机的翻译工具、以各种方式涉及人工协助的可操作的机器翻译系统,以及从总体上改进机器翻译方法的“纯”理论研究。

3.机器翻译的大规模运营

尽管ALPAC报告得出了负面结论,但从20世纪70年代开始,无论是在美国还是在其他地方,机器翻译系统都已安装并投入成本效益运行。 特别是,加拿大和欧洲的多语种社区强调,迫切需要远远超出该专业能力的翻译生产水平,显然计算机能提供一些必要帮助。直到20世纪80年代后期,有一种模式主导了MT系统的使用。它是由早期系统就继承下来的:该系统产生了大量翻译质量较差的文本,这些文本(1)直接用于信息的同化和吸收。(2)提交广泛的后期编辑,目的是获得可出版质量的文本以供传播。作为提高质量的一种手段,许多组织在输入系统之前对文本的词汇、结构和样式进行了控制;这就是跨国公司和其他大型组织使用(并继续使用)Systran,Logos和类似大型机系统的方式。所有现有的商业和运营系统都产生产出,如果要达到可出版的质量,就必须对其进行编辑(修订)。只有在粗译可以接受的情况下,机器翻译系统的输出才能保持不变。MT系统的商业开发人员现在总是向客户强调,如果不进行修订,MT不能也不能产生可接受的翻译:他们强调了机器翻译输出不可避免的不完美的本质。他们完全承认有义务在从最初创作到最后传播的全部文件处理范围内,为文本的格式化、输入和修订提供先进的设施,并为其出版做好准备。现在人们普遍认为,MT本身在特定领域和受控环境中的工作效果最好。在这方面,第一个针对具体领域的成功是Meacute;teacute;o,这是一个将天气预报从英文翻译成法文的系统,自1977年以来一直被加拿大广播公司使用。施乐在20世纪70年代后期开始使用受控输入来实施Systran系统。事实上几乎所有的机器翻译系统的大规模实现都是针对特定领域的,原因很简单:所需的大型词典必须考虑到一个组织的特定词汇,因为即使是在相同的制造领域,一个公司特定的用法可能与其他公司无关。然而,与其以这种方式改造通用机器翻译系统,现在人们认识到,在某些情况下,从头开始设计用于受控语言的系统可能更好。近年来,学术机器翻译研究界以外的一些独立公司(如Volmac)一直在这样做;目前最大的发展是基于卡内基梅隆大学的研究的卡特彼勒项目。

4.私人电脑用的机器翻译。

在20世纪80年代初,当机器翻译系统的第一个版本出现在私人电脑上,人们普遍认为它们的使用方式与大型机系统的使用方式基本相同,即要么为信息目的制作未修订的粗略版本,要么为以后的修订和改进而制作“翻译草稿”。在这两种情况下,人们还普遍认为机器翻译输出的主要接受者将是翻译人员,或者至少是对源语言和目标语言都有很好了解的人;在大型组织中,预计大多数人将是受过专业培训的翻译人员。

然而,在20世纪80年代后期以及自20世纪90年代初以来的增长速度看来,这种模式及其假设已经被许多方面的发展所推翻。首先,已经有了专门为专业翻译人员设计的翻译工作站,这些工作站基本上是基于计算机的翻译工具,甚至不打算完全自动生成部分翻译(见下一节)。虽然一些专业翻译人员购买了私人电脑系统并成功使用了这些针对这个市场的系统,其他人更喜欢使用工作站,现在这些工作站对于独立翻译人员来说变得越来越便宜。其次,基于私人电脑的系统已被越来越多的人购买和使用,而这些人对翻译没有兴趣; 它们仅被用作“交流辅助工具”,而文本的翻译质量就不那么重要了。第三,全球电信网络和互联网的发展,使得能够以多种语言进行即时通信,导致对翻译系统和服务的需求迅速实时地与各种各样的电子文本大量增加( 从已发表的文章到电子邮件和“聊天室”对话。) 最后,许多不同语言(特别是在因特网上)的数据库和信息资源的广泛可用性导致需要具有内置翻译模块的多语言搜索和访问设备。(例如用于翻译搜索术语或翻译摘要或总结。)

5.翻译工具

一般来说,大多数评论员都认为“传统的”机器翻译(即完全自动化)本身对于专业翻译人员来说是非常不合适的。他们不想屈从于机器;很少有人愿意成为质量低劣的MT输出的校正者。他们长期以来一直寻求的是复杂的翻译工具。自20世纪90年代初以来,他们现在可以将它们变换为翻译工作站。这些都为译者提供了一个机会,使他们的工作更有成效,同时又不会消除翻译所带来的智力挑战。笔译工作站将词典和术语数据库、多语种文字处理、词汇和术语资源的管理、适当的文本输入和输出设施(如OCR扫描仪、电子传输、高级打印)结合在一起。最重要的是,它们包括一个“翻译记忆”设施,使翻译人员能够创建、调整、储存和查阅其中现有的翻译(无论是自己的还是他人的),以供以后(部分)重复使用或修订,或作为翻译示例的来源,这一设施现在被视为对专业翻译人员最重要的帮助。

翻译工具的开发变得可行,首先是在20世纪60年代后期出现了实时交互式计算机环境,然后在20世纪70年代实现了文字处理,在20世纪80年代出现了微型计算机,随后又出现了组织内联网和更大的计算机存储容量(Hutchins,1998)。传统机器翻译轨道的出现,导致了以往译者对机器翻译群体的对抗性下降。它们被视为是机器翻译研究的直接结果,实际上,“翻译记忆”设施实际上直接来源于基于统计的自动翻译方法中最初的“纯粹”MT对双语文本对齐的研究(见下文)。这种翻译辅助工具和翻译工作站最有效的应用之一就是计算机软件的本地化。在这一应用程序中,产品推出后需要尽快提供多种语言文件(例如用户和服务人员手册);这些文件必须根据所涉国家的具体文化背景加以调整。此外,文档从一个产品版本到下一个产品版本都是高度重复的。规模巨大的,海量的重复和快速生产的需要让计算机翻译成为唯一的解决方案。目前,包含翻译记忆的翻译工作站的销售正在迅速增长,特别是在欧洲(如Trados、Star、Atril)。它们的成功建立在生产力、术语一致性和整体质量明显提高的基础上。在许多工作站中,如果翻译内存不能提供合适或可用的版本,则翻译人员还可以选择自动翻译模块。这些模块要么基于现有的机器翻译系统(如TRADOS),要么基于翻译记忆系统供应商(如ATRIL)的开发。

6.机器翻译研究。

在ALPAC之后,对MT的研究当然会继续,从最初在70年代处于的低水平,再到80年代和90年代稳步复苏。翻译质量逐步提高,尽管不如许多人所希望的那么快(Hutchins,1986,1998)。一般来说,这一领域的改进来自基础广泛的研究,建立在广泛的、经过检验的计算和语言方法和技术的基础上。然而,和往常一样,这一领域继续吸引着完美主义者。很多时候,开发系统时并不知道如何使用它们,也不知道用户是谁,机器翻译被看作是探索新的语言和计算技术的试验场。然而,几乎在所有情况下,已经并且仍然发现新理论的“纯粹”采用并不像小样本的初始试验那样成功。仍然经常被遗忘(尤其是新研究者)的是,机器翻译是一项实际任务,是达到目的一种手段,而翻译本身(不管是自动化的还是非自动化的)从来没有也不可能是“完美的”;根据不同的情况和要求,对同一文本总是有其他可能的(往往是多个)翻译。机器翻译也不会有什么不同:不可能有一个“完美”的自动翻译。机器翻译系统的使用取决于其在实际情况下的成本效益。

机器翻译研究的主要焦点仍然是科技性质的书面文件翻译系统的发展,在可能性范围之外是文学和法律文本,实际上是任何风格和表现形式是“信息”的重要组成部分的文本。直到如今,口语都还在范围之外。然而,在过去的十五年里,口语翻译的研究(在高度受限的领域内)已经发展成为机器翻译活动的一个重要领域。诸如日本ATR、美国卡内基-梅隆大学(Carnegie-Mellon University)和德国Verbmobil项目等研究项目都雄心勃勃。但他们没有犯试图构建通用系统的错误:系统受到限制,仅限于特定的领域、子语言和用户类别。虽然成功只是局部的,但也有明显的潜在好处。

一般来说,它假设系统适用于那些了解源语言和目标语言的人。 也已经开始进行一些针对对目标语言一无所知的发言者或作家的系统的研究。在这些情况下,需要的是用未知语言创建消息的方法;它不必是任何现有原文的直译。通过互动对话,可以组成可翻译的“信息”,以便在目标语言中自动转换为惯用和正确的消息,而无需发起人的进一步参与。

对于那些完全不懂源语言的人来说,还需要合适的系统。到目前为止,这一需要一方面是通过使用较老的批处理系统的未经修订的产出(例如因特网服务,见下文),另一方面是通过廉价的基于个人电脑的软件来满足的。当然,没有一个是完全令人满意的,专门针对这个潜在的巨大市场的全自动系统的开发是对未来MT研究的一个挑战。

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[19000],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。