附录B 外文原文
MAPREDUCE:SIMPLIFIED DATA PROCESSING ON LARGE CLUSTERS
Abstract
MapReduce is a programming model and an associated implementation for processing and generating large datasets that is amenable to a broad variety of real-world tasks.Users specify the computation in terms of a map and a reduce function,and the under-lying runtime system automatically parallelizes the computation across large-scale clusters of machines,handles machine failures,and schedules inter-machine communication to make effi-cient use of the network and disks.Programmers find the system easy to use:more than ten thousand distinct MapReduce programs have been implemented internally at Google over the past four years,and an average of one hundred thousand MapReduce jobs are executed on Googlersquo;s clusters every day,processing a total of more than twenty petabytes of data per day.
- Introduction
Prior to our development of MapReduce,the authors and many others at Google implemented hundreds of special-purpose computations that process large amounts of raw data,such as crawled documents,Web request logs,etc.,to compute various kinds of derived data,such as inverted indices,various representations of the graph structure of Web documents,summaries of the number of pages crawled per host,and the set of most frequent queries in a given day.Most such computa-tions are conceptually straightforward.However,the input data is usu-ally large and the computations have to be distributed across hundreds or thousands of machines in order to finish in a reasonable amount of time.The issues of how to parallelize the computation,distribute the data,and handle failures conspire to obscure the original simple com-putation with large amounts of complex code to deal with these issues.As a reaction to this complexity,we designed a new abstraction that allows us to express the simple computations we were trying to perform but hides the messy details of parallelization,fault tolerance,data distri-bution and load balancing in a library.Our abstraction is inspired by the map and reduce primitives present in Lisp and many other functional lan-guages.We realized that most of our computations involved applying a map operation to each logical recordrsquo;in our input in order to compute a set of intermediate key/value pairs,and then applying a reduce operation to all the values that shared the same key in order to combine the derived data appropriately.Our use of a functional model with user-specified map and reduce operations allows us to parallelize large computations easily
and to use reexecution as the primary mechanism for fault tolerance.
The major contributions of this work are a simple and powerful interface that enables automatic parallelization and distribution of large-scale computations,combined with an implementation of this interface that achieves high performance on large clusters of com-modity PCs.The programming model can also be used to parallelize computations across multiple cores of the same machine.
Section 2 describes the basic programming model and gives several examples.In Section 3,we describe an implementation of the MapReduce interface tailored towards our cluster-based computing environment.Section 4 describes several refinements of the programming model that we have found useful.Section 5 has performance measurements of our implementation for a variety of tasks.In Section 6,we explore the use of MapReduce within Google including our experiences in using it as the ba-sis for a rewrite of our production indexing system.Section 7 discusses re-lated and future work.
2、Programming Model
The computation takes a set of input key/value pairs,and produces a set of output key/value pairs.The user of the MapReduce library expresses the computation as two functions:map and reduce.
Map,written by the user,takes an input pair and produces a set of intermediate key/value pairs.The MapReduce library groups together all intermediate values associated with the same intermediate key I and passes them to the reduce function.
The reduce function,also written by the user,accepts an interme-diate key I and a set of values for that key.It merges these values together to form a possibly smaller set of values.Typically just zero or one output value is produced per reduce invocation.The intermediate values are supplied to the userrsquo;s reduce function via an iterator.This allows us to handle lists of values that are too large to fit in memory.
Programming languages are traditionally viewed as belonging to particular paradigms, however the notions of programming paradigms and orientation are imprecise. Unlike scientific paradigms, programming paradigmsare not necessarily incompatible, as demonstrated by the success of dual- and multi-paradigm languages such as Mozart/Oz(http://www.mozart-oz.org), Jason (http://jason.sf.net), and Scala (http://www.scala-lang.org). This paper attempts to identify, define, and organize the central concepts underlying the actor, agent, functional, object, and procedural programming styles, as they are realized in practical programming languages[1-4].
This paper has three central aims. Firstly, by mapping existing programming languages to a common feature model, it is hoped that ideas for new language features and new combinations of features will be generated. Secondly, it is hoped that the resulting feature model will serve as a basis for comparison and generalization in empirical studies of multiple programming languages. Finally, the number of programming languages is large and steadily increasing. This model and its associated empirical evidence should eventually become a useful tool to help software engineers in assessing the suitability of a language for a given development project or software architecture.
With these seco
剩余内容已隐藏,支付完成后下载完整资料
MapReduce:简化的数据处理在大型集群上
摘要
MapReduce是一个编程模型,也是一个处理和生成超大数据集的算法模型的相关实现。用户首先创建一个Map函数处理一个基于key/value pair的数据集合,输出中间的基于key/value pair的数据集合;然后再创建一个Reduce函数用来合并所有的具有相同中间key值的中间value值。现实世界中有很多满足上述处理模型的例子,本论文将详细描述这个模型。
MapReduce架构的程序能够在大量的普通配置的计算机上实现并行化处理。这个系统在运行时只关心:如何分割输入数据,在大量计算机组成的集群上的调度,集群中计算机的错误处理,管理集群中计算机之间必要的通信。采用MapReduce架构可以使那些没有并行计算和分布式处理系统开发经验的程序员有效利用分布式系统的丰富资源。
我们的MapReduce实现运行在规模可以灵活调整的由普通机器组成的集群上:一个典型的MapReduce计算往往由几千台机器组成、处理以TB计算的数据。程序员发现这个系统非常好用:已经实现了数以百计的MapReduce程序,在Google的集群上,每天都有1000多个MapReduce程序在执行。
1介绍
在过去的5年里,包括本文作者在内的Google的很多程序员,为了处理海量的原始数据,已经实现了数以百计的、专用的计算方法。这些计算方法用来处理大量的原始数据,比如,文档抓取(类似网络爬虫的程序)、Web请求日志等等;也为了计算处理各种类型的衍生数据,比如倒排索引、Web文档的图结构的各种表示形势、每台主机上网络爬虫抓取的页面数量的汇总、每天被请求的最多的查询的集合等等。大多数这样的数据处理运算在概念上很容易理解。然而由于输入的数据量巨大,因此要想在可接受的时间内完成运算,只有将这些计算分布在成百上千的主机上。如何处理并行计算、如何分发数据、如何处理错误?所有这些问题综合在一起,需要大量的代码处理,因此也使得原本简单的运算变得难以处理。
为了解决上述复杂的问题,我们设计一个新的抽象模型,使用这个抽象模型,我们只要表述我们想要执行的简单运算即可,而不必关心并行计算、容错、数据分布、负载均衡等复杂的细节,这些问题都被封装在了一个库里面。设计这个抽象模型的灵感来自Lisp和许多其他函数式语言的Map和Reduce的原语。我们意识到我们大多数的运算都包含这样的操作:在输入数据的“逻辑”记录上应用Map操作得出一个中间key/value pair集合,然后在所有具有相同key值的value值上应用Reduce操作,从而达到合并中间的数据,得到一个想要的结果的目的。使用MapReduce模型,再结合用户实现的Map和Reduce函数,我们就可以非常容易的实现大规模并行化计算;通过MapReduce模型自带的“再次执行”(re-execution)功能,也提供了初级的容灾实现方案。
这个工作(实现一个MapReduce框架模型)的主要贡献是通过简单的接口来实现自动的并行化和大规模的分布式计算,通过使用MapReduce模型接口实现在大量普通的PC机上高性能计算。
第二部分描述基本的编程模型和一些使用案例。第三部分描述了一个经过裁剪的、适合我们的基于集群的计算环境的MapReduce实现。第四部分描述我们认为在MapReduce编程模型中一些实用的技巧。第五部分对于各种不同的任务,测量我们MapReduce实现的性能。第六部分揭示了在Google内部如何使用MapReduce作为基础重写我们的索引系统产品,包括其它一些使用MapReduce的经验。第七部分讨论相关的和未来的工作
2编辑模型
MapReduce编程模型的原理是:利用一个输入key/value pair集合来产生一个输出的key/value pair集合。MapReduce库的用户用两个函数表达这个计算:Map和Reduce。
用户自定义的Map函数接受一个输入的key/value pair值,然后产生一个中间key/value pair值的集合。MapReduce库把所有具有相同中间key值I的中间value值集合在一起后传递给reduce函数。用户自定义的Reduce函数接受一个中间key的值I和相关的一个value值的集合。Reduce函数合并这些value值,形成一个较小的value值的集合。一般的,每次Reduce函数调用只产生0或1个输出value值。通常我们通过一个迭代器把中间value值提供给Reduce函数,这样我们就可以处理无法全部放入内存中的大量的value值的集合。
2.1例子
例如,计算一个大的文档集合中每个单词出现的次数,下面是伪代码段:
map(String key,String value):
//key:document name
//value:document contents
for each word w in value:
EmitIntermediate(w,
“1Prime;);reduce(String key,Iterator values):
//key:a word
//values:a list of counts
int result=0;
for each v in values:
result =ParseInt(v);
Emit(AsString(result));
Map函数输出文档中的每个词、以及这个词的出现次数(在这个简单的例子里就是1)。Reduce函数把Map函数产生的每一个特定的词的计数累加起来。
另外,用户编写代码,使用输入和输出文件的名字、可选的调节参数来完成一个符合MapReduce模型规范的对象,然后调用MapReduce函数,并把这个规范对象传递给它。用户的代码和MapReduce库链接在一起(用C 实现)。附录A包含了这个实例的全部程序代码。
2.2类型
尽管在前面例子的伪代码中使用了以字符串表示的输入输出值,但是在概念上,用户定义的Map和Reduce函数都有相关联的类型:
map(k1,v1)-gt;list(k2,v2)
reduce(k2,list(v2))-gt;list(v2)
比如,输入的key和value值与输出的key和value值在类型上推导的域不同。此外,中间key和value值与输出key和value值在类型上推导的域相同。我们的C 中使用字符串类型作为用户自定义函数的输入输出,用户在自己的代码中对字符串进行适当的类型转换。
2.3更多的例子
这里还有一些有趣的简单例子,可以很容易的使用MapReduce模型来表示:
分布式的Grep:Map函数输出匹配某个模式的一行,Reduce函数是一个恒等函数,即把中间数据复制到输出。
计算URL访问频率:Map函数处理日志中web页面请求的记录,然后输出(URL,1)。Reduce函数把相同URL的value值都累加起来,产生(URL,记录总数)结果。
倒转网络链接图:Map函数在源页面(source)中搜索所有的链接目标(target)并输出为(target,source)。Reduce函数把给定链接目标(target)的链接组合成一个列表,输出(target,list(source))。
每个主机的检索词向量:检索词向量用一个(词,频率)列表来概述出现在文档或文档集中的最重要的一些词。Map函数为每一个输入文档输出(主机名,检索词向量),其中主机名来自文档的URL。Reduce函数接收给定主机的所有文档的检索词向量,并把这些检索词向量加在一起,丢弃掉低频的检索词,输出一个最终的(主机名,检索词向量)。
倒排索引:Map函数分析每个文档输出一个(词,文档号)的列表,Reduce函数的输入是一个给定词的所有(词,文档号),排序所有的文档号,输出(词,list(文档号))。所有的输出集合形成一个简单的倒排索引,它以一种简单的算法跟踪词在文档中的位置。
分布式排序:Map函数从每个记录提取key,输出(key,record)。Reduce函数不改变任何的值。这个运算依赖分区机制(在4.1描述)和排序属性(在4.2描述)。
3实现
MapReduce模型可以有多种不同的实现方式。如何正确选择取决于具体的环境。例如,一种实现方式适用于小型的共享内存方式的机器,另外一种实现方式则适用于大型NUMA架构的多处理器的主机,而有的实现方式更适合大型的网络连接集群。本章节描述一个适用于Google内部广泛使用的运算环境的实现:用以太网交换机连接、由普通PC机组成的大型集群。在我们的环境里包括:1.x86架构、运行Linux操作系统、双处理器、2-4GB内存的机器。2.普通的网络硬件设备,每个机器的带宽为百兆或者千兆,但是远小于网络的平均带宽的一半。3.集群中包含成百上千的机器,因此,机器故障是常态。4.存储为廉价的内置IDE硬盘。一个内部分布式文件系统用来管理存储在这些磁盘上的数据。文件系统通过数据复制来在不可靠的硬件上保证数据的可靠性和有效性。5.用户提交工作(job)给调度系统。每个工作(job)都包含一系列的任务(task),调度系统将这些任务调度到集群中多台可用的机器上。
3.1执行概括
通过将Map调用的输入数据自动分割为M个数据片段的集合,Map调用被分布到多台机器上执行。输入的数据片段能够在不同的机器上并行处理。使用分区函数将Map调用产生的中间key值分成R个不同分区(例如,hash(key)mod R),Reduce调用也被分布到多台机器上执行。分区数量(R)和分区函数由用户来指定。图1展示了我们的MapReduce实现中操作的全部流程。当用户调用MapReduce函数时,将发生下面的一系列动作(下面的序号和图1中的序号一一对应):1.用户程序首先调用的MapReduce库将输入文件分成M个数据片度,每个数据片段的大小一般从16MB到64MB(可以通过可选的参数来控制每个数据片段的大小)。然后用户程序在机群中创建大量的程序副本。2.这些程序副本中的有一个特殊的程序–master。副本中其它的程序都是worker程序,由master分配任务。有M个Map任务和R个Reduce任务将被分配,master将一个Map任务或Reduce任务分配给一个空闲的worker。3.被分配了map任务的worker程序读取相关的输入数据片段,从输入的数据片段中解析出key/value pair,然后把key/valuepair传递给用户自定义的Map函数,由Map函数生成并输出的中间key/value pair,并缓存在内存中。4.缓存中的key/value pair通过分区函数分成R个区域,之后周期性的写入到本地磁盘上。缓存的key/value pair在本地磁盘上的存储位置将被回传给master,由master负责把这些存储位置再传送给Reduceworker。5.当Reduce worker程序接收到master程序发来的数据存储位置信息后,使用RPC从Map worker所在主机的磁盘上读取这些缓存数据。当Reduce worker读取了所有的中间数据后,通过对key进行排序后使得具有相同key值的数据聚合在一起。由于许多不同的key值会映射到相同的Reduce任务上,因此必须进行排序。如果中间数据太大无法在内存中完成排序,那么就要在外部进行排序。6.Reduce worker程序遍历排序后的中间数据,对于每一个唯一的中间key值,Reduceworker程序将这个key值和它相关的中间value值的集合传递给用户自定义的Reduce函数。Reduce函数的输出被追加到所属分区的输出文件。7.当所有的Map和Reduce任务都完成之后,master唤醒用户程序。在这个时候,在用户程序里的对MapReduce调用才返回。在成功完成任务之后,MapReduce的输出存放在R个输出文件中(对应每个Reduce任务产生一个输出文件,文件名由用户指定)。一般情况下,用户不需要将这R个输出文件合并成一个文件–他们经常把这些文件作为另外一个MapReduce的输入,或者在另外一个可以处理多个分割文件的分布式应用中使用。
3.2Master数据结构
Master持有一些数据结构,它存储每一个Map和Reduce任务的状态(空闲、工作中或完成),以及Worker机器(非空闲任务的机器)的标识。Master就像一个数据管道,中间文件存储区域的位置信息通过这个管道从Map传递到Reduce。因此,对于每个已经完成的Map任务,master存储了Map任务产生的R个中间文件存储区域的大小和位置。当Map任务完成时,Master接收到位置和大小的更新信息,这些信息被逐步递增的推送给那些正在工作的Reduce任务。
3.3容错
因为MapReduce库的设计初衷是使用由成百上千的机器组成的集群来处理超大规模的数据,所以,这个库必须要能很好的处理机器故障。
Worker故障
master周期性的ping每个worker。如果在一个约定的时间范围内没有收到worker返回的信息,master将把这个worker标记为失效。所有由这个失效的worker完成的Map任务被重设为初始的空闲状态,之后这些任务就可以被安排给其他的worker。同样的,worker失效时正在运行的Map或Reduce任务也将被重新置为空闲状态,等待重新调度。当worker故障时,由于已经完成的Map任务的输出存储在这台机器上,Map任务的输出已不可访问了,因此必须重新执行。而已经完成的Reduce任务的输出存储在全局文件系统上,因此不需要再次执行。当一个Map任务首先被worker A执行,之后由于work
剩余内容已隐藏,支付完成后下载完整资料
资料编号:[590186],资料为PDF文档或Word文档,PDF文档可免费转换为Word
课题毕业论文、外文翻译、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。