传智播客旗下技术交流社区北京校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

大数据硬核剖析三大运营商770x330.jpg

课程亮点:
1、系统的设计方法是采用面向对象的设计。本系统前端页面交互主要采用B/S的结构,采用MVC及流式数据的设计思路进行规划设计。
2、前端数展现使用Echarts技术。与地图相关的报表使用百度地图提供的API。
3、后端实时数据,实时接入mysql。为了不影响线上系统的正常使用,同时能够将数据发送到大数据平台,本项目使用Canal来解析实时数据,Flume收集数据并数据发送到实时计算业务流程和离线计算两个流程中。实时数据处理流程使用Canal+Flume+Kafka+SparkStreaming等技术。离线计算使用HDFS+Hive+Azkaban等技术。
4、设计过程中对系统的可靠性、可扩展性以及性能进行了充分考虑和研究分析,争取通过良好的设计,在实现系统功能的前提下,最大化的提高系统性能和扩展性,减少将来的维护代价和其他成本。

适用人群:

1、对大数据Spark感兴趣的在校生及应届毕业生。
2、对目前职业有进一步提升要求,希望从事大数据行业高薪工作的在职人员。
3、对大数据行业感兴趣的相关人员。

第一章 项目概述
1课程内容
1. 系统介绍
2. 模块介绍
3. 数据流程描述
4. 逻辑架构设计
5. 功能描述
6. 系统架构
第二章  离线数据入库
1. 数据上传
2. 创建数据表
3. 数据拆分
4. 数据表加载


第三章 离线数据整理
1. 业务SQL语句编写
2. 整理SQL语句生成结果表的结构及字段
3. 根据结果表所需的字段,在原始表中抽取该字段
4. 数据加工及入库
5. 创建索引

第四章 实时数据生成及计算
1. Mysql 数据写入
2. canal 解析mysql实时数据写入本地
3. Flume收集数据将数据上传至集群
4. SparkStreaming 实时计算
网盘资料链接已添加回帖可获取提取码
https://pan.baidu.com/s/1rjX3yOAOg6QUIF3fSczTGQ

网盘提取码如下回帖可见

游客,如果您要查看本帖隐藏内容请回复




分享至 : QQ空间
收藏

8 个回复

倒序浏览
aaa!!!!!!!!!!!!!!
回复 使用道具 举报
狠好狠啊哦
回复 使用道具 举报
https://pan.baidu.com/s/1rjX3yOAOg6QUIF3fSczTGQ
回复 使用道具 举报
源码笔记有吗
回复 使用道具 举报
我要下载,我要学习
回复 使用道具 举报
我要下载,我要学习
回复 使用道具 举报
我要下载,我要学习
回复 使用道具 举报

https://pan.baidu.com/s/1rjX3yOAOg6QUIF3fSczTGQ
回复 使用道具 举报
您需要登录后才可以回帖 登录 | 加入黑马