A股上市公司传智教育(股票代码 003032)旗下技术交流社区北京昌平校区

 找回密码
 加入黑马

QQ登录

只需一步,快速开始

猜猜猜007

初级黑马

  • 黑马币:

  • 帖子:

  • 精华:

© 猜猜猜007 初级黑马   /  2019-8-25 19:24  /  1078 人查看  /  0 人回复  /   0 人收藏 转载请遵从CC协议 禁止商业使用本文

云服务器租用3折起!

购买享优惠,热门云产品特惠3折起。腾讯云助力企业轻松跨入“互联网+”时代,本促销活动主要提供云服务器, MySQL、Redis数据库等产品, 价格优惠,购买立享!
初识大数据

大数据有什么特点? 大数据与传统的数据有什么关系? 大数据和我们有什么关系? 虽然很多书籍上直接说明了大数据的概念和特点,但是根据个人的体会,如果我们先了解数据的概念和特点,那么我们将会更加容易理解大数据。 关于数据的几个问题什么是数据? 狭义上讲数据就是数值,也就是我们通过观察、实验或计算得出的...
大数据 | SparkSQL连接查询中的谓词下推处理(二)
大数据 | SparkSQL连接查询中的谓词下推处理(二)

总结至此,左连接查询的四条规则分析完了。 可以看出,在sparksql中对于外连接查询时的过滤条件,并不能在所有情况下都用来进行数据源的过滤,如果使用得当会极大的提升查询性能,如果使用不当,则会产生错误的查询结果,而这种错误结果又不易发觉,所以使用时要格外小心。 下期预告:《存储引擎们都是如何完成高效...
大数据 | SparkSQL连接查询中的谓词下推处理(二)
大数据 | SparkSQL连接查询中的谓词下推处理(二)

总结至此,左连接查询的四条规则分析完了。 可以看出,在sparksql中对于外连接查询时的过滤条件,并不能在所有情况下都用来进行数据源的过滤,如果使用得当会极大的提升查询性能,如果使用不当,则会产生错误的查询结果,而这种错误结果又不易发觉,所以使用时要格外小心。 下期预告:《存储引擎们都是如何完成高效...
大数据入门-如何做数据分析01

自从我改行做数据分析,发现要学习的东西很多,转行并不是一件容易的事情。 空缺的知识特别多。 所以自己记录自己的一些学习和工作心得。 1、总得来说数据分析流程就3个基本步骤:输入-->计算-->输出所以在数据分析中不管是做架构设计还是算法设计这三个基本步骤是不可缺少的; 仿佛我们的计算机也是这个最基本的运行...
大数据分析流程
大数据分析流程

然后发现不清楚各种工具和模型的适用范围,也不知道数据报告需要包括哪些内容,面试的感觉就是一问三不知... 你是一个工作了一段时间的白领,你觉得现在这份工作不适合你,你下班以后去逛知乎,在上面看到很多人在说大数据代表未来,数据分析师是21世纪最性感的十大职业之一... 你激动了,你也要成为数据分析师,你...
BAT大数据分析师:如何规划大数据学习之路?

转行也并非一朝一夕的事情,你需要对这个行业有一定的了解,并匹配一下自己的知识和能力结构。 以下是一位在bat大数据领域打滚了n年后的分析师写下的一些总结和体会给想入行或是刚入行大数据的朋友借鉴学习! 成为数据分析师有哪些要求? 1. 理论知识要宽泛,涉及数学、市场和技术。 要求及对数据敏感,包括统计知识...
大数据概述----《大数据系列》

者配置可以使框架有效地安排任务在以前的数据在这个节点上,计算结果通过带宽整合到集群上。 mapreduce包含一个单主节点resourcemanager和一个从节点nodemanager ,按每一个应用都有的mrappmaster最低限度,应用需要输入和输出位置和提供map方法和reduce方法实现接口或者抽象方法。? mapreduce.png后面还有系列大数据...
刷算法题的一点心得
刷算法题的一点心得

这两天刷了很多蓝桥杯的算法题,因为比赛并且要给学弟学妹去讲题,自己是挺慌的,我没有系统的学习过算法和数据结构,一般是刷题的过程中去恶补相关知识,走了一条弯路去刷题。 今天的文章是怀着跟大家学习交流的心态分享一下自己刷题的心得,大家也可以在留言区分享自己刷算法的心得。 第一次刷题还是大二,同学之间...
大数据面试题分析

blog.csdn.netcsuwubingarticledetails79259749最近学习了hashtable的一点知识,发现可以用来解决大数据的一些问题。 我们这里讲的大数据分析事实上并不是分布式和数据挖掘这些高深的概念,而是针对从从一个大文件或者一堆数据(内存放不下)中找出具有某种特点的数,这也是近年来各大公司经常考的问题。 面试题1:给...
数据蒋堂 | 前半有序的大数据排序
数据蒋堂 | 前半有序的大数据排序

我们不能解决通用的大排序问题,但在特定场合下却能设计出好算法提高性能最近碰到这么一个案例,情况可以简化总结成这样:数据库中有表t,其中有两个重要的字段a和b,a是一个时间戳,精确到秒; b是用户号; 其它字段用来表示用户b在时刻a发生的事件属性。 现在任务是:把数据按a,b排序导出。 简单来讲,就是把select...
DAMA数据管理—数据治理
DAMA数据管理—数据治理

数据小兵认为数据治理活动中的每项活动,都有很多的内涵,都需要深入理解和补充,才能更好的消化和理解。 本书中仅仅是对相关活动进行了概要的简述,建议大家还需要对每项活动进一步学习。 后续,数据小兵针对相关活动主题进行单独详细的解读,这里就不详细说明了。 综述书中对指导原则(11)进行了列表说明、过程...
DAMA数据管理—数据管理概述
DAMA数据管理—数据管理概述

数据小兵认为,技术部分可以从数据管理的整体技术架构提出要求,目前基于大数据的技术架构已经比较成熟,大家可以参考相关新的技术支撑。 经验体会 通过本章的学习,数据小兵结合自身工作经验,谈一谈理解: 当前,企业对于数据战略的理解还比较模糊,很多企业还停留在对业务战略的支撑和保障意识的理解,如何发挥...
零基础学大数据编程需要哪些基础?

零基础学大数据编程需要哪些基础? 程序员薪酬高、工作环境好,是很多同学向往的职业,让很多非计算机专业的同学羡慕不已。 非计算机专业难道就不能成为程序员了吗? 一、零基础学大数据编程需要基础:1、数学基础从计算机发展和应用的历史来看计算机的数学模型和体系结构等都是有数学家提出的,最早的计算机也是为数值...
高考查分小程序开发心得
高考查分小程序开发心得

数据来源小程序后台共收录近 30w 条数据,包含 2008-2017 年所有重点高校的各个批次的文理分科录取分数线以及 2008-2018所有采用新课标一卷、新课标二卷、新课标三卷以及部分自主命题省份的从提前批到高职专科批的录取分数线,勉强称得上内容翔实。? 所有数据均采集自各大院校和各高考相关网站,由于数据量巨大,为...
干货 | 19款最好用的免费数据挖掘工具大汇总

想象一下,有数百万的数据点没有查询的技能。 这就是teradata所提供的。 它们提供数据仓库,大数据和分析以及市场营销应用程序方面的端到端解决方案和服务。 teradata还提供一系列的服务,包括实施,业务咨询,培训和支持。 5. framed data这是一个完全管理的解决方案,这意味着你不需要做任何事情,而是坐下来等待 ...
Apache Kudu 对频繁更新数据场景下的大数据实时分析最佳用例

apache kudu对频繁更新数据场景下的大数据实时分析最佳用例由于最近两次在大数据项目中使用apache kudu,写一篇文章谈谈对kudu的一些看法和使用心得。 一. 对大规模数据实时分析的商业价值几乎所有的企业都有随着时间推移贬值的资产。 直观地说,延长使用设备会降低设备的价值,如我们日常生活中的汽车、电子产品等。 ...
elastic-job-lite使用的一点心得和坑

也有了一些最佳实践,这篇文章写一下总结,但不是ejl的结尾,后续还会有ejl的文章,下面附上前几篇的链接:elastic-job-lite入门以及架构原理分析elastic-job-lite 既然去中心化,为何要选举主节点elastic-job-lite 数据结构分析使用心得ejl中有三种job作业类型,simple, dataflow, script,这三种任务类型都支持cron...
大数据不再是大数据,大数据依然是大数据--我的一篇严肃总结

这样一来,多少有据可查。 要说大数据领域到底怎么样,我们就得先定义一下大数据到底是什么东西? 一定要我坦诚的说,大数据并没有一个精准的定义,它就是...可是,既然它们现在可以支持很大规模的数据量,你说它们是不是大数据呢? 肯定是有人说是有人说不是。 如果一定要我给个总结的话,hadoop抄袭谷歌的时候...
大数据技术Spark学习
大数据技术Spark学习

第1章 spark sql 概述1.1 什么是 spark sql spark sql:http:spark.apache.orgsql ? spark sql 是 spark 用来处理结构化数据的一个模块,它提供了一个编程抽象叫做 dataframe,并且作为分布式 sql 查询引擎的作用。 我们已经学习了 hive,它是将 hive sql 转换成 mapreduce 然后提交到集群上执行,大大简化了编写 ...

0 个回复

您需要登录后才可以回帖 登录 | 加入黑马