云计算和网格计算360度比较外文翻译资料

 2022-03-27 07:03

英语原文共 10 页,剩余内容已隐藏,支付完成后下载完整资料


云计算和网格计算360度比较

摘要——云计算已成为继web2.0之后的另一个流行语。但是对于云计算的不同定义有多达几十种,并且对于云到底是什么似乎并没有一个统一的意见。另一方面,云计算并不是一个全新的概念,它与那些相对较新但也已经建立了十三年的网格计算范例,以及其他相关技术,如通用计算、集群计算和分布式系统有着复杂的关系。 本文力求从多个角度比较和对比云计算与网格计算并给出有关两者基本特征的见解。

1.100英里概述

云计算预示着在未来我们不会在本地计算机上计算,而是在集中设备上由第三方计算和存储公用操作。我们相信不会错过套装软件的解开和安装。不用说,这不是一个新的想法。事实上,早在1961年,计算机的先驱约翰·麦卡锡曾预测“计算可能有一天会被组织成一个公共事业”并继续推测这如何发生。

在20世纪90年代中期,“网格”这个术语被创造出来描述允许消费者获得计算电力需求的技术。伊恩.福斯特和其他人提出标准化的协议用于计算能力的请求, 我们可以建立一个计算网格, 类似与电网的形式与效用。研究人员随后在许多令人振奋的方向发展了这些思想, 例如,大型联合制造系统(TeraGrid, Open Science Grid, caBIG, EGEE, Earth System Grid)不仅仅提供计算能力,同时提供数据和软件的需求。标准化组织(OGF, OASIS)定义相关的标准。 更简单地说,这个词也被行业作为集群的营销术语。但是并没有可行的商业网格计算供应商出现,直到最近。

那么,“云计算”只是网格的一个新名称吗?在信息技术领域中,在每五年里,技术按数量级排列,在此过程改变自己,并没有对这个问题有一个直接的回答。的确:目的是一致的,以减少计算成本,提高可靠性,增加灵活性通过从我们购买和操作自己的计算机到第三方操作的计算机的这样一个转变。

但也不是:现在与10年前有所不同,我们有一个新的需求就是要分析大量数据,这增加了计算的需求。现在我们已经意识到从大型机迁移到商品集群的好处,我们发现,这些集群的操作相当昂贵。我们具有低成本的虚拟化技术。而且,最重要的是,我们有多个公司比如亚马逊,谷歌和微软花了数十亿美元来创造包含数十万台计算机的真正的商业化的大型系统。我们只需要一张信用卡就可以按需访问包含分布在全世界的数十万台计算机的分布式数据资源并将其应用到解决大规模的,潜在的分布式数据的前景,这令人兴奋!因此,我们可以操作不同规模的,新的,可以根据需求从根本上通过不同的方法解决区问题。它还支持 - 实际上往往也只适用于-全新的问题。

然而,是的云计算和网格计算的大多数问题是相同的。它们有一个共同的需要能够管理大型设备;定义由客户发现的方法,请求,并使用设备中心提供的资源;实现高度并行计算执行这些资源。细节会有所不同,但这两个团体面临许多相同的问题。

1.1定义云计算

我们几乎没有达成任何共识来定义云。我们把另一个定义添加到已经饱和的云计算的定义列表: 大规模分布式计算模式,在互联网上规模经济驱动,抽象的,虚拟化,可动态伸缩的,管理的计算能力、存储、平台和服务,并通过网络传递给外部的有需求的客户。

该定义有几个关键点。首先,云计算是一种专门的分布式计算模式,它的不同之处在于 1)它是大规模可伸缩扩展的, 2)它可以被封装为一个抽象的实体,并提供不同层次的服务给云外部的客户,3 )它由规经济的规模驱动,4)这些服务可以动态配置(通过虚拟化或其他方法)和按需支付。

政府,研究机构和产业的领导者急于采用云计算,以解决他们在网络时代不断增长的计算和存储所产生的问题。这里有三个主要因素促成的云计算: 1)迅速下降硬件成本和提高计算能力和存储能力,以及多核架构和由数以十万计的核心组成现代超级计算机的发展; 科学仪器/模拟和因特网发布和归档中数据量的指数级增长; 3)广泛的采用的计算和 Web 2.0 应用程序。

1.2 云,网格和分布式系统

许多挑剔的读者会立即指出云计算的定义与许多现有技术有重叠的部分,如网格计算,效用计算技术,服务计算,分布式计算。我们认为,云计算不仅与网格计算有所重叠,云计算的确是有网格计算演化而来的,并依靠网格计算作为主干和基础设施的支持。这种演化是工作重点转移的结果,从提供基础设施,存储和计算资源(在网格的情况下)到一个是经济的,基于抽象的,旨在提供更多的资源和服务(在云的情况下)的情况。至于公用计算,它不是计算基础设施的新模式,相反,它是在这种计算资源下的一种新的商业模式,例如计算和存储,被打包为计量服务类似于物理公用事业,例如电力和公共交换电话网络。效用计算通常使用其他计算基础设施(如网格)实现,并提供额外的会计和监视服务。云基础设施可以由公司内部使用,也可以作为公用计算公开给公众。

网格计算旨在“在动态的、多机构的虚拟组织中实现资源共享和协调解决问题”。虚拟组织这一定义有几个关键的特点:首先,提供一个网格分布式计算模式或基础设施,分布式计算范式或基础设施,跨越多个虚拟组织,每个虚拟组织可以包括物理分布的机构或逻辑上相关项目/组。这种模式的目标是在动态分布式环境中实现联合资源共享。事实上标准实现的方法——Globus工具包,是通过定义标准的网络协议和提供中间件来从不同的资源构建统一的计算环境,调解对多种异构资源的访问。Globus解决了各种问题,如安全、资源发现、资源配置和管理、作业调度、监视和数据管理。

五年前,伊恩·福斯特提出了三点来帮助确定什么是,什么不是一个网格:1)坐标资源不受集中控制,2)使用标准的,开放的,通用的协议和接口, 3) 提供非常规的服务质量。虽然第三点指出真正的云计算的意义,但无论第一点还是第二点,对于当今的云计算的情况也不是明确的。云和网格的愿景是相似的,细节和技术使用可能有所不同, 但两者面临许多相同的问题。本文力图从不同的角度比较和对比云计算与网格计算,给出两者的本质特征的见解。什么样的云应用程序可以期待云的支持,在未来几年云可能会面临什么挑战为了获得动力和采用。我们希望这将有助于双方获得更深的理解的目标,假设,状态和方向,并提供更详细信息给查看这两种技术的一般读者。

2 从各个方面比较网格计算和云计算

本节旨在通过从不同的角度比较网格计算和云计算,包括安全模型,商业模式,规划模型,虚拟化,数据模型,计算模型,以种源和应用程序。我们也提出了网格计算和云计算带给研究人员和IT行业,最常见的两个,的很多挑战,但有些是特定给某一个或某一些的。

2.1 商业模式

传统商业模式的软件一直是一次性的支付无限制的使用软件。在以云为基础的商务模式中,客户将在消费基础上对供应商进行支付,这非常像公用事业公司对基本设施的收费,如电力,煤气,水,该模型依赖于经济的规模,以为用户来降低价格并未供应商谋取利益。今天,亚马逊基本上提供了一个集中组成的云包括计算云EC2和S3数据云。前者按实例类型消耗的每个实例每小时来收费,而后者按每个GB每个月份的存储费用收费。此外,数据传输是按TB /月数据传输来收费的,这取决于传输的来源和目标。在全球分布的数十个数据中心中,只需要一张信用卡就可以按需访问100000多个处理器,而这些资源被应用于海量、潜在分布数据的问题上,这是令人兴奋的!

商业模式网格(至少发现在学术界或政府实验室)的业务模型是以项目为导向的,由该方案所代表的用户或社区拥有一定数量的服务单元(即CPU时间)。比如,TeraGrid在这种趋向发展中,以这种方式运作,并且需要越来越复杂的提案来增加计算能力。TeraGrid使他们的已经超过12个网格网站托管在遍布的全国不同机构。是什么让一个机构想加入TeraGrid?当一个机构加入网络的一组资源,它知道社会上在这个社区中的其他人现在可以利用这些遍布全国各地的资源。它还承认,它获得了十几个其他网格站点的访问权。这一模式在全球许多电网中运作良好,使各机构有动力加入各种电网,以便为相应机构的所有用户获得额外资源。

这里也在致力于去构建一个网格计算经济,建立一个提供经济谈判,供应和资源分配的网格基础设施,基于服务水平的资源、风险和成本,以及用户的喜好;到目前为止,资源交换(如贸易仓储为计算周期),拍卖,基于博弈论的资源协调、虚拟货币、资源代理和中介机构,以及其他各种经济模型被提出并应用于实践。

2.3 资源管理

本节介绍,如计算模型,数据模型,虚拟化,监控和物源的网格和云中的资源管理。这些主题都是非常重要的,了解这两个网格和云今天面对的,并会在未来克服主要挑战。

计算模式:大多数网格使用批处理不定期计算模型,其中本地资源管理器(LRM ),例如PBS, Condor, SGE管理网格计算的站点资源,用户提交批处理作业(通过Gram)来请求一些资源的一段时间的使用权。许多网格都有执行这些批处理作业的策略,以确定该作业将根据会计和安全目的运行的用户和凭据、需要的处理器数量以及分配的持续时间。例如,一个作业可以说,在从URL到本地存储的输入数据中,运行在100个处理器上应用60分钟,并且逐步淘汰一些FTP服务器的结果。这项工作将在LRM的等待队列等待直到这100处理器可以使用60分钟,在这一点上的100个处理器将被分配并致力于工作中的应用。由于昂贵的调度决策,数据和分期,和排队时间可能很长,很多网格本身不支持交互式应用;虽然有网格社区努力使较低的延迟资源通过多级调度,让许多短运行任务的应用程序在网格的有效执行。云计算计算模型看起来非常不同,在同一时间内,所有用户可以共享云中的资源(与排队系统管理的专用资源形成对比)。这将允许延迟敏感的应用程序运行在本地云,虽然保证了良好的QoS级别不够被交付给最终用户,可能将云计算作为云的规模和用户数量不断增长的主要挑战之一。

数据模型:有些人大胆断言,未来的互联网计算将对云计算集中、存储、计算、和各种各样的其他资源将主要提供的云,我们设想,下一代互联网计算的三角形模型:互联网计算将集中在数据,云计算以及客户端计算之中。 云计算和客户端计算将携手共存和发展,而数据管理 (映射、分区、查询、运动、缓存、复制、等)将对云计算和客户端计算增加的数据密集型应用越来越重要。 云计算的关键作用不言而喻,但在客户端计算的重要性不能被忽视,对于如下几个原因:1)出于安全原因,人们未必愿意在云上运行关键任务和发送敏感数据到云上进行处理和储存; 2)用户希望自己的任务能够被处理,即使是互联网和云是关闭状态或网络通信很慢; 3)随着多核技术的进步,未来十年将可能有一个桌面超级计算机有100到1000硬件线程/核心。此外,许多终端用户将会有各种可视化的硬件驱动端的功能,如可视化、多媒体播放,这通常会在本地运行。

在过去的十年中,数据的重要性引起了网格计算组织的注意;数据网格专门设计用于处理网格环境中的数据密集型应用程序,虚拟数据的概念起着至关重要的作用。虚拟数据捕获的数据之间的关系、程序和计算与规定不同的抽象,数据网格可以提供位置透明性的数据,可以在本地请求而不考虑数据的位置,一个分布式元数据目录是从事追踪每个数据块的位置(连同其副本)至整个电网的网站,和隐私访问控制和强制;物化透明度:数据可以重新计算—根据计算数据的可用性和重新计算的成本,根据需要进行计算或转移。还有代表性透明性,即无论数据的实际物理格式和存储方式如何,数据都可以被消费和生产,数据被映射到一些抽象的结构表示中,并以这种方式进行操作。

数据局部性:随着CPU变得越来越便宜,并且数据集在规模上每年增加一倍,应用程序的有效伸缩所面临的主要挑战是数据相对于可用计算资源的位置——将数据反复移动到较远的CPU上正成为瓶颈。从本地磁盘存储到广域网的IO速度有很大的差异,这会极大地影响应用程序的性能。为了在云计算、网格及其应用程序的互联网规模上实现良好的可伸缩性,数据必须分布在多台计算机上,并进行计算。为了降低通信成本,必须转向最佳的执行位置。谷歌的MapReduce系统运行在谷歌文件系统之上,在这个系统中,数据被加载,被划分成块,每个块被复制。因此,数据处理与数据存储并置:当需要处理一个文件时,作业调度器参考存储元数据服务获取每个块的主机节点,然后在该节点上调度一个“map”进程,从而有效地利用数据局部性。在网格中,数据存储通常依赖于一个共享的文件系统(例如NFS,GPFS,PVFS,Luster),数据的位置,不能简单被应用。一种方法是提高调度程序的数据感知能力,并且能够在调度计算任务时利用数据局部性信息;这种方法显著提高了工作周转效率。

结合计算和数据管理:更关键的是计算和数据资源管理的结合,它利用访问模式中的数据局部性来最小化数据移动量,并提高终端应用程序的性能和可伸缩性。试图解决存储和计算问题的计算和存储资源之间的分别的数据的移动,这不是超大规模数据集和数以百万计的处理器,并将产生的原始资源明显不足。重要的是将计算任务安排在数据附近,并理解移动工作的成本,而不是移动数据。在实现良好的可伸缩性和性能方面,数据感知调度器和分散处理器的数据是至关重要的。最后,作为处理器内核的数量增加(最大的超级计算机,今天有超过200K的处理器,网格有着超越100k处理器),有高可持续调度和执行率高吞吐量计算支持不断增长的重点。我们相信,数据管理体系结构对于确保数据管理实现在文件、对象和数据集磁盘空间使用的数量上达到所需的数据集大小是很重要的,同时确保数据元素信息能够被快速有效地检索。网格在将计算和数据管理与数据感知调度器相结合方面取得了进展,但我们认为,在处理数据密集型应用程序方面,云将面临重大挑战,而不需要投入大量精力来

全文共5697字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[15062],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。