A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

端木起凌

初级黑马

  • 黑马币:

  • 帖子:

  • 精华:

© 端木起凌 初级黑马   /  2019-11-23 17:19  /  1086 人查看  /  0 人回复  /   0 人收藏 转载请遵从CC协议 禁止商业使用本文

大数据好啊,Lambda 架构是目前影响最深刻的大数据处理架构,它的核心思想是将不可变的数据以追加的方式并行写到批和流处理系统内,随后将相同的计算逻辑分别在流和批系统中实现,并且在查询阶段合并流和批的计算视图并展示给用户。Lambda的提出者 Nathan Marz 还假定了批处理相对简单不易出现错误,而流处理相对不太可靠,因此流处理器可以使用近似算法,快速产生对视图的近似更新,而批处理系统会采用较慢的精确算法,产生相同视图的校正版本。1所有的数据需要分别写入批处理层和流处理层;2批处理层两个职责:(i)管理 master dataset (存储不可变、追加写的全量数据),(ii)预计算batch view;3服务层对 batch view 建立索引,以支持低延迟、ad-hoc 方式查询 view;4流计算层作为速度层,对实时数据计算近似的 real-time view,作为高延迟batch view 的补偿快速视图;5所有的查询需要合并 batch view 和 real-time view;  

0 个回复

您需要登录后才可以回帖 登录 | 加入黑马