A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

© 王震阳老师 金牌黑马   /  2014-7-5 17:01  /  1563 人查看  /  5 人回复  /   1 人收藏 转载请遵从CC协议 禁止商业使用本文

Google停用MapReduce,发布Cloud Dataflow


摘要: Google已经停用自己研发的并部署在服务器上分析数据的开源系统MapReduce,转而支持一个新的超大规模云分析系统Cloud Dataflow。MapReduce一直是服务器集群上做并行分布式计算的一个非常受欢迎的基础架构和编程模型。 ...





Google已经停用自己研发的并部署在服务器上分析数据的开源系统MapReduce,转而支持一个新的超大规模云分析系统Cloud Dataflow。
MapReduce一直是服务器集群上做并行分布式计算的一个非常受欢迎的基础架构和编程模型。它是被广泛部署并已经成为很多公司商业产品的大数据基础架构平台Hadoop的基础。
但是近日,这项技术已经不能处理谷歌想要分析的大量数据。然而,技术基础设施部高级副总裁UrsHölzle表示,一旦数据规模达到数PB级字节,处理起来将变得非常困难。
“我们将不再使用MapReduce。”Hölzle在周三于旧金山举行的谷歌I/O大会上发表主题演讲时表示,公司已经在几年前停止使用这个系统,更多大会内容可点击2014谷歌I/O上的Google Cloud Platform和Cloud Dataflow
Cloud DataFlow,将作为一项服务提供给使用它们云服务的开发者,这些服务并没有MapReduce的扩展限制。
“Cloud Dataflow是这近十年分析经验的成果。”Hölzle说,它将会比现存的所有的系统运行的更快,更易扩展。
这是一个完全托管服务,它可以自动优化、部署、管理以及扩展。它使开发人员对批处理和流媒体服务能够使用统一编程轻松地创建复杂的管道,他表示。
所有这些特点,谷歌认为在MapReduce上无法完成:很难迅速获取数据,不能进行批处理和流处理,而且经常需要部署和运行MapReduce集群。
Hölzle在展示会上也宣布谷歌云平台上其他一些新的服务:

  • Cloud Save是一个API,它使应用程序能够在云中或其他地方保存单个用户的数据而不需要任何服务器端的编码。 提供App Engine的PaaS用户和提供Compute Engine的用户都可以利用这特征构建App。
  • Cloud Debugging 简化了筛选出部署在云端的多台服务器中的软件缺陷的过程。
  • Cloud Tracing 提供了不同群体(数据库服务调用,例如等待时间)的延时统计数据以及分析报告。
  • Cloud Monitoring 是一款与Stackdriver(谷歌5月份收购的一个云监控初创公司)集成的智能监控系统。该系统监控云基础设施资源,如磁盘和虚拟机,还有一些为谷歌提供服务的服务等级以及十几个非谷歌提供的开源软件包。




5 个回复

倒序浏览
刚准备开始学MapReduce,现在看这个还有用不,还是应该直接投入到新技术的学习中呢。
光看这个文章也不能完全理解Cloud Dataflow和MapReduce的区别额。。。
回复 使用道具 举报
谢谢分享
回复 使用道具 举报
照这么看的话,如果是为将来打算,现在的课程上云计算的课程还值得学吗?
回复 使用道具 举报
ye361571404 发表于 2014-9-22 10:10
照这么看的话,如果是为将来打算,现在的课程上云计算的课程还值得学吗? ...

国外最新的技术到中国等多少年要
回复 使用道具 举报
谢谢老师分享知识
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马