开发和使用适合法律英语学习的语料库外文翻译资料

 2022-11-24 10:23:36

文献翻译

出处:Jason Skier. Development and Use of a Corpus Tailored for Legal English Learning[J] Jutarat Vibulphol Chulalongkorn University, 2016

原文:

Development and Use of a Corpus Tailored for Legal English Learning

When most lawyers hear the word “corpus”, they typically think of the habeas corpus proceeding, which demands that the body of a prisoner be brought before a judge; while corpus linguistics examines a body of text to research relationships between words. Legal English frequently differs from general English in both meaning and usage. For example, the word lsquo;hearingrsquo; typically refers to a personrsquo;s ability to perceive sound. In legal English, however, the same word describes a court session where attorneys may present evidence and legal arguments to persuade a tribunal. Accordingly, the phrase lsquo;I lost my hearing yesterdayrsquo; conveys completely a different meaning in legal English versus general English. Therefore, attempting to use non-legal corpora to research legal English usage will not yield meaningful results.

Using the legal English corpus, anyone looking to accurately describe judicial error could use collocation to reveal that “manifest”, “plain”, “reversible” and “harmless” are frequently discussed with “error”. Investigation will further reveal that these are all discrete types of errors, and that the correct nomenclature must be used to convey the proper legal meaning (Stith, 1990). Correct use of legal English nomenclature is vitally important for all attorneys. Using incorrect terms fails to give adversaries proper notice, and failing to give proper notice may constitute waiver of an issue (Hawaii Rules of Appellate Procedure 28(b)(7), 1984). This requirement is strictly followed because, “courts are not gambling halls, but forums for the discovery of truth” (State v. Haanio, 2001). Accordingly, creating a corpus specifically for legal English would be useful for learning proper use of English in the legal context, especially for non-native English speakers.

While the benefits of using corpora in other types of language classrooms have been well documented (e.g. Crosthwaite, 2012; OKeeffe, McCarthy, amp; Carter, 2007; Yoon amp; Hirvela, 2004), the use of corpora to assist legal English learning has not been widely explored (Fan amp; Xunfeng, 2002; Hafner amp; Candlin, 2007; Hunston, 2002). For this project, a corpus was created using published court decisions regularly used by attorneys in the United States to study legal issues. This paper also shows how language learners can analyze this corpus using concordance, collocation, and chunking to discover legal English lexicon.

Literature Review

The lexical approach

This work was motivated by the principles of the lexical approach proposed by Lewis (1993), which considers language to be more than random combinations of single words but rather non- random combinations of specific phrases and idioms, called lexicon. Lexicon consists of frequently produced chunks of language combining to produce coherent communication (Lewis, 1993). Central to this idea is collocation, or the examination of which words frequently appear in close proximity to other words. These repeating collocated chunks, such as lsquo;burden of proofrsquo; or lsquo;cry wolfrsquo;, are commonly found in authentic language use but not directly understood by examining individual words. The ability to comprehend and produce these lexical chunks is essential for language learning.

Corpus analysis is used to facilitate the learning of lexicon by examining authentic texts to show snippets of actual use of a search term, locating words commonly found in close proximity, and showing set phrases. Lewis (1993) suggests authentic texts because they contain natural jargon, word relationships, and fixed phrases commonly used in communication rather than artificial creations. This information produced by corpus analysis is useful for language learners because often these word relationships are not intuitive for non-native speakers. Computers are sometimes used to assist the analysis of bulk collections of texts to reveal these relationships.

Corpus LinguisticsCorpus linguistics leverages the power of computers to analyze large collections of authentic texts to locate language chunks, and was therefore recommended by Lewis (1997) as a tool to facilitate the implementation of the lexical approach. Because analyzing large volumes of text requires significant computer processing power, the first significant attempt at using corpus linguistics for foreign language learning was not until the 1987 publication of the Collins Birmingham University International Language Database, commonly referred to as COBUILD. Continually updated to the present day, the full COBUILD corpus currently contains 4.5 billion words (Collins, 2013). The Bank of English, a subset containing 650 million words, is a widely used reference tool considered to be a representative sample of current, general English usage (Collins, 2013). The first major attempt at a corpus specifically for academic use was the Academic Word List, a 3.5 million-word corpus consisting of journals and textbooks from various native English speaking countries covering assorted academic subjects (Coxhead, 1998).

User created corpora

In addition to premade corpora described in the previous section, Lewis (2001) suggested that users might alternatively create corpora tailored for their specific academic purposes. However, when constructing corpora, users should be aware that including high quality materials in corpora yields better results than texts merely meeting the minimum criteria (Hyland, 1999; Reppen, 2004).

Few prior studies have discussed using corpora to facilitate learning legal English. Fan and Xunfeng (2002) documented the use of a bilingual corpus of Chinese and English law to assist translat

剩余内容已隐藏,支付完成后下载完整资料


译文:

开发和使用适合法律英语学习的语料库

当大多数律师听到“corpus”一词时,他们通常会考虑到人身保护令程序,要求将囚犯带到法官面前;而语料库语言学是用来检查文本的主体来研究单词之间的关系。法律英语在意义和用法上都与普通英语不同。例如,“hearing”这个词通常是指一个人感知声音的能力。然而,在法律英语中,同一个词描述了法庭会议,律师可以提出证据和法律论据来说服法庭。因此,“I lost my hearing yesterday”这个短语在法律英语与普通英语中意思完全不同。因此,使用非法律语料库来研究法律英语的使用不会产生有法律意义的结果。

使用法律英文语料库,任何想要准确描述司法错误的人都可以使用搭配来揭示“明显的”,“清楚的”,“可逆的”和“无害的”,经常和“错误”一起讨论。调查将进一步揭示,这些都是不同类型的错误,必须使用正确的命名法来传达适当的法律意义(Stith,1990)。使用正确的法律英语对所有律师来说至关重要。使用错误的法律词汇会导致给出错误的法律建议,并且进一步导致上诉的失败(夏威夷上诉程序28(b)(7),1984))。 严格遵守这一要求是因为“法庭不是赌场,而是发现真相的论坛”(State v。Haanio,2001)。 因此,为法律英语专门制作语料库将有助于在法律背景下学习正确使用英语,特别是对于非英语母语者。

虽然在其他类型的语言教室中使用语料库的好处已经有很好的记录(例如,Crosthwaite,2012; OKeeffe,McCarthy,&Carter,2007; Yoon&Hirvela,2004),使用语料库来协助法律英语学习并没有得到广泛的探索(Fan&Xunfeng,2002; Hafner&Candlin,2007; Hunston,2002)。对于这个项目,使用美国律师经常使用的公开的法庭裁决来创建一个语料库来研究法律问题。 本文还介绍了语言学习者如何使用一致性,搭配和分块来分析这种语料库来发现法律英语词汇。

文献回顾

词汇方法

这项工作是由刘易斯(1993)提出的词汇方法的原理所推动的,认为语言不仅仅是单词的随机组合,而是特定短语和成语的非随机组合,称为词典。 词汇由经常生成的语言组合组成,以产生一致的沟通(Lewis,1993)。 这个想法的核心是搭配,或者检查哪些词经常出现在其他单词附近。 这些重复的搭配块,例如“举证责任”或“谎报军情”,通常在真实的语言使用中发现,但通过检查单词不被直接理解。 理解和产生这些词汇块的能力对于语言学习至关重要。

语料库分析用于通过检查正确的文本来显示实际使用搜索词的片段,定位靠近的通常找到的单词并显示集合短语来促进词汇的学习。 刘易斯(1993)提出了真实的文本,因为它们包含自然的术语,词语关系和通常用于沟通而不是人工创作的固定短语。 通过语料库分析产生的信息对于语言学习者是有用的,因为这些词语关系对于非母语者来说并不直观。 计算机有时用于帮助分析大量文本集合来揭示这些关系。

语料库语言学利用计算机的力量分析大量真实文本的集合来定位语言块,因此刘易斯(1997)建议将其作为促进词汇方法实现的工具。因为分析大量的文本需要大量的计算机处理能力,所以使用语料库语言学进行外语学习的第一个重要尝试是1987年出版的柯林斯伯明翰大学国际语言数据库(通常被称为COBUILD)。目前,完整的COBUILD语料库包含45亿字(柯林斯,2013)。英语银行是一个涵盖6.5亿字的子集,是被广泛使用的参考工具,被认为是当前英语一般使用的代表性样本(Collins,2013)。专门用于学术用途的语料库的第一个主要尝试是学术词汇表,一个350万字的语料库,包括各种英语国家的期刊和教科书,涵盖各种学术科目(Coxhead,1998)。

用户创建语料库

除了上一节中描述的预制语料库之外,刘易斯(2001)还建议用户可以为其特定学术目的选择创建语料库。 然而,在构建语料库时,用户应该意识到,包括高质量的材料在语料库中比只符合最低标准的文本产生更好的结果(Hyland,1999; Reppen,2004)。有少量研究已经讨论了使用语料库来促进学习法律英语。 范和迅峰(2002)记录了使用双语语料库的中英文法律来协助香港学生翻译。 Hafner和Candlin(2007)通过一种旨在追踪使用的在线一致性工具,为法律写作学生提供了专门针对课程设计的语料库。

以特定学术目的创建的任何语料库的质量传统上都沿着两个方面进行了测量(Lewis,1997)。 第一个维度是衡量源文件是否是具有相关术语的正确文本。 第二个维度测量语料库是否包含足够的文档以产生有意义的搜索结果。 第二个要求确保语料库包含了包含目标术语的使用模式的丰富多样的例子,以便公开常见的短语,修饰语和动作词。 然而,为特定的学术目的而产生的语料库不一定要像COBUILD这样的庞然大物。 用于特定目的的语料库可能包含少于20个高质量的文档,并且仍然产生关键词和搭配的代表性例子(Lewis,2001)。 此外,刘易斯还建议不要以任何方式编辑源材料。

语料库语言学习的实用性可以被划分为三个层次(Keck&Kim,2014)。首先,“课下学习”是指使用语料库作为参考的课程和活动规划,学生与语料库的互动是可选的。使用语料库,可以在上课之前进行研究,以发现正在教授的词汇所共有的短语和搭配。然后可以在规划课堂活动时使用此信息。 “课下学习”方法对于学生尚未具备计算机技能的情况也是有用的。第二,语料库可以用作语言使用和词语关系的课堂演示工具。这可以通过屏幕上的演示完成,也可以让学生在个人电脑上独立运行软件。在考虑课堂使用时,教师或学习者缺乏必要的计算机技能总是令人担忧的。最后,语料库可能被用作语言学习的自学工具。

语料库的开发

设计

根据以前有关特定学术用途的用户语料库的研究(例如Charles,2014; Hafner&Candlin,2007)建议,该项目旨在构建法语英语语料库,以促进非母语人士的学习。为了解决刘易斯(1997)提出的语料质量的两个维度,用于开发语料库的文件需要包含真实的法律英语行话,并且数量足以产生有意义的结果。最初考虑了使用实际的律师 - 客户端沟通的法人创作。不幸的是,编译这些数据肯定会违反律师 - 客户机密规则。实际文件(包括姓名和其他机密个人信息)将可以轻松访问,以便在语料库中查看。编纂将是一个压倒性的任务,并将违反禁止编辑语料库材料(Lewis,1997)。因此,真实的客户端通信不包括在语料库中。或者,美国最高法院发表意见是构成法定英语语料库的理想选择。因为所有的法律问题都可能会出现在法庭上,所以法律和相关术语的每一个领域都应该在公开的判断中予以代表。出于严肃考虑,整个国家必须遵循美国最高法院的决定。从拉丁语来看,这个决定是“以待决定的方式”的。依照这一规定,法院就其他案件的事实以及先前的上级裁决作出以前的决定。因为每一个字都经过了严肃的考虑,美国最高法院的抄本或书面判决中并没有多余的言论,只是简洁的法律论证和分析。

此外,最高法院的书面判决提供了相似的质量,并扩大了语料库,以便在行话中增加地方差异。 选择夏威夷,纽约和佛罗里达州的上诉法院判决,因为他们的地方分歧,以及上诉法院裁决的可用性。 这种包含不仅在语料库中添加了大量高质量的真实文本,每个司法管辖区都有不同的词汇,用于具体的法律英语术语。 像美国最高法院一样,这些决定是高质量的,因为它们代表了管辖权中最高的法律,并经过了严肃考虑。 因此,国家上诉法律决定也是理想的,高质量的文本构成法语英语语料库。

作品

首先,选择一个名为AntConc的免费程序来协助分析创建的语料库。 AntConc,可用于Windows,OSX和Linux(Anthony,2014),可通过以下链接访问http://www.laurenceanthony.net/software/antconc/。 选择AntConc程序是因为它包含一个完整的功能集,并且可以免费使用。 而许多其他语料库分析程序只包含一个协调工具,AntConc还包含其他有用的检查工具,如搭配和分块。 涉及学术使用语料库的以前的研究也使用了AntConc(Charles,2014; Csomay&Petrović,2012)。

在选择AntConc之后,创建过程包括在线查找源文档,下载,然后转换成AntConc所需的正确格式。不幸的是,法庭在线发布他们的决定所使用的格式与AntConc不兼容。然而,AntConc的创建者还提供AntFileConverter进行批量文档转换(Anthony,2016)。

在美国最高法院之后,佛罗里达州,纽约州和夏威夷语料库最初于2015年10月建成,语料库包含了超过1400万个词汇。随着语料库越来越大,使用AntConc的许多搜索查询,特别是分块,开始花费更长的时间来使计算机处理。此外,正在为各种民法和刑法查询获得有意义的结果。因此,决定停止向语料库添加文件。完成的语料库包含4,697个附件A所示的1,600万个词标记的文件。为了增强选择选项和速度处理,这些文件被划分为区分司法管辖区和成绩单或书面判决的子语料库。因为AntConc软件能够同时打开多个语料库,这样可以让用户平衡速度和全面性。由于判决数量较少,佛罗里达和纽约被合并成一个子语料库。有关包含语料库的文件的详细细节,请参见附录A.

验证

最后,三位专家,曼谷主要大学教授博士。 对相关领域的学位进行了评估,为该项目创建了语料库。 一位专家目前正在教法语英语,另一位专家教授语料库语言学课程,另一位专家撰写了许多关于语料库语言学的杂志文章。 为了验证,开发了一个包含两个部分的问卷。 第一部分测量了Lewis(1997)提出的两个维度上创建的语料库的质量。 问卷的第二部分使用Keck和Kim(2014年)描述的三个方面来研究语料库对于这一具体学术目的的有用性。 此外,问卷还询问了基于计算机的语料库使用的固有技术要求是否超过了潜在的有用性。 在每个问题之后,提供了额外的意见或建议。

所有专家同意或十分同意,该语料库包含相关术语。所有专家也同意或十分同意,在进行法律英语研究时,语料库产生了有意义的结果。如上所述,这两个维度确定了为该项目创建的语料库的整体有效性,确认其包含足够多样的法律英语术语。

所有专家同意或十分同意,语料库将提供有关词汇关系的信息,这些信息可以整合到课程计划中。有人评论说:“教师可以搜索具体单词或术语的实例和实际用途,并使用这些示例为课堂创建文本或练习,而无需在课堂上与语料库进行实际交互。”但是,专家们对于熟悉软件首先要实现。例如,一位专家说:“我认为,用户需要有一个培训课程,在他们可以自信地使用这个工具之前,他们才能掌握这个工具。”最后,所有专家都认为语料库作为自我的有用性 - 学习者的研究工具,但认为它比低水平更适合高水平的学习者。一位专家对AntConc计划的泰语缺乏本地化或使用说明书感到遗憾。随后搜索可用的在线资源无法在泰语中找到具有泰语菜单或用户文档的AntConc版本。因此,使用AntConc进行语料库分析的最佳水平是英语水平的一个先决条件。

总而言之,所有三位专家都认为,为这个项目制作的语料库有助于促进法律英语学习。 因此,语料库被发现具有相关的质量尺度,被认为有助于学习法律英语。

剩余内容已隐藏,支付完成后下载完整资料


资料编号:[26504],资料为PDF文档或Word文档,PDF文档可免费转换为Word

您需要先支付 30元 才能查看全部内容!立即支付

课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。