黑马程序员技术交流社区

标题: 大数据面试经验分享——九索数据 [打印本页]

作者: 就业高冷派    时间: 2018-11-23 11:07
标题: 大数据面试经验分享——九索数据
本帖最后由 就业高冷派 于 2018-11-23 11:12 编辑

公司名称:西安九索数据技术股份有限公司
公司经营:2010年11月15日成立,城市精细化管理的研发,中国科学院西安光学精密机械研究所的大数据应用工程中心,陕西省信息化和工业化融合典型示范企业,并且为军民融合试点单位。
注册规模:50-150人
公司地址:高新区锦业一路西安软件园起步区D座
公司图片:


人事小姐姐先进来聊了几句,大概内容无非就是了解一下性格呀,就普通聊天,也问到上家公司的一些情况,涉及到业务内容的都简单带过,有问到离职原因,这个自己可以结合自己的情况说一个。
人事简单聊完,等了一会来了一个技术组长,有问到一些问题,简单整理如下:
1.spark sql怎么取数据的差集
    好像不支持
2.spark2.0的了解
    更简单:ANSI SQL与更合理的API
    速度更快:用Spark作为编译器
    更智能:Structured Streaming
3.spark集群运算的模式
    Spark 有很多种模式,最简单就是单机本地模式,还有单机伪分布式模式,复杂的则运行在集群中,目前能很好的运行在 Yarn和 Mesos 中,当然          Spark 还有自带的 Standalone 模式,对于大多数情况 Standalone 模式就足够了,如果企业已经有 Yarn 或者 Mesos 环境,也是很方便部署的。
    standalone(集群模式):典型的Mater/slave模式,不过也能看出Master是有单点故障的;Spark支持ZooKeeper来实现 HA
    on yarn(集群模式): 运行在 yarn 资源管理器框架之上,由 yarn 负责资源管理,Spark 负责任务调度和计算
    on mesos(集群模式): 运行在 mesos 资源管理器框架之上,由 mesos 负责资源管理,Spark 负责任务调度和计算
    on cloud(集群模式):比如 AWS 的 EC2,使用这个模式能很方便的访问 Amazon的 S3;Spark 支持多种分布式存储系统:HDFS 和 S3
4.Hadoop的核心配置是什么?
    Hadoop的核心配置通过两个xml文件来完成:
   ①.hadoop-default.xml;
   ②.hadoop-site.xml。
   这些文件都使用xml格式,因此每个xml中都有一些属性,包括名称和值,但是当下这些文件都已不复存在。
5.请列出你所知道的 hadoop 调度器,并简要说明其工作方法?
    ①.FIFO schedular:默认,先进先出的原则
    ②.Capacity schedular:计算能力调度器,选择占用最小,优先级高的先执行,以此类推。
    ③.Fair schedular:公平调度,所有的job具有相同的资源。
6.hadoop 的 namenode 宕机,怎么解决
      先分析宕机后的损失,宕机后直接导致client无法访问,内存中的元数据丢失,但是硬盘中的元数据应该还存在,如果只是节点挂了,重启即可,如果是机器挂了,重启机器后看节点是否能重启,不能重启就要找到原因修复了。但是最终的解决方案应该是在设计集群的初期就考虑到这个问题,做namenode的HA。
7.用mapreduce怎么处理数据倾斜问题?
      数据倾斜:map /reduce程序执行时,reduce节点大部分执行完毕,但是有一个或者几个reduce节点运行很慢,导致整个程序的处理时间很长,这是因为某一个key的条数比其他key多很多(有时是百倍或者千倍之多),这条key所在的reduce节点所处理的数据量比其他节点就大很多,从而导致某几个节点迟迟运行不完,此称之为数据倾斜。

用hadoop程序进行数据关联时,常碰到数据倾斜的情况,这里提供一种解决方法。
自己实现partition类,用key和value相加取hash值:
方式1:
源代码:
public int getPartition(K key, V value,
                          int numReduceTasks) {
    return (key.hashCode() & Integer.MAX_VALUE) % numReduceTasks;
  }
修改后
public int getPartition(K key, V value,
                          int numReduceTasks) {
    return (((key).hashCode()+value.hashCode()) & Integer.MAX_VALUE) % numReduceTasks;
  }

方式2:
public class HashPartitioner<K, V> extends Partitioner<K, V> {
private int aa= 0;
  /** Use {@link Object#hashCode()} to partition. */
  public int getPartition(K key, V value,
                          int numReduceTasks) {
    return (key.hashCode()+(aa++) & Integer.MAX_VALUE) % numReduceTasks;
  }






作者: py@py    时间: 2018-12-25 12:34
666666666666666666666666666666
作者: xiaoheizi    时间: 2018-12-25 12:39
6666666666666666666666
作者: 致橡树    时间: 2018-12-25 12:40
666666666666666666
作者: 曹阳茜    时间: 2018-12-25 12:58
圣诞快乐!!!!!
作者: ruoquan    时间: 2018-12-25 13:10
666666666666,很厉害。
作者: 小公举    时间: 2018-12-25 13:17
感谢楼主的分享   谢谢   辛苦了     
作者: duanshaobo    时间: 2018-12-25 13:19
好大的数据啊
作者: 仙人掌sandy    时间: 2018-12-25 13:21
好大的数据啊
作者: 专找bug    时间: 2018-12-25 13:21
66666666666666666
作者: ouweina    时间: 2018-12-25 13:21
感谢大佬分享
作者: 小伙啊    时间: 2018-12-25 13:28
666666666666666666666
作者: yy1134787753    时间: 2018-12-25 13:39
感谢分享
作者: 温柔一刀!喵!    时间: 2018-12-25 13:44

作者: 王航    时间: 2018-12-25 13:47
小舟从此逝,江海寄余生
作者: 兮兮哈哈    时间: 2018-12-25 13:51
6666666666666666
作者: 半个程序员    时间: 2018-12-25 13:59
圣诞快乐。2019冲鸭、
作者: 举个栗子    时间: 2018-12-25 14:04
6666666666666666666666666666666666666666
作者: 茶包哥    时间: 2018-12-25 14:10
学习到很多
作者: 从容微笑    时间: 2018-12-25 14:13

作者: 二郎显圣真君    时间: 2018-12-25 14:14
666666666666666666666666666666666
作者: lzp791697309    时间: 2018-12-25 14:25
好大的数据啊

作者: yangyifen    时间: 2018-12-25 14:29
666666666666666666666666666666666666666666666666666
作者: pcdate    时间: 2018-12-25 14:39
66666666666666666
作者: zhuyanting    时间: 2018-12-25 14:44
谢谢分享
作者: 梅优良    时间: 2018-12-25 14:49
6666666666666666666666
作者: 你不爱我    时间: 2018-12-25 18:42

作者: zhanghua342    时间: 2018-12-26 09:41
感谢大佬的分享~~~~~~~~~~~~~~
作者: 淡写薰衣草的香    时间: 2018-12-26 14:26

作者: 影@子~    时间: 2018-12-26 16:04
感谢分享
作者: 李娟玲老师    时间: 2018-12-26 16:11
6666666666666666666
作者: 多喝点热水~    时间: 2018-12-26 16:25
                  
作者: 同心筑梦1    时间: 2018-12-26 17:00
66666666666666666666666666666666666666
作者: yujq    时间: 2018-12-26 17:46
66666666666666666666666
作者: 黑马程序员啊    时间: 2018-12-26 17:52
谢谢楼主,辛苦了...........
作者: little_superman    时间: 2018-12-26 18:25
666666666666666666
作者: 耙丫丫    时间: 2018-12-26 19:37

作者: 殷凯老师    时间: 2018-12-26 20:13
感谢分享!!!!
作者: 18629541359    时间: 2018-12-26 20:28
很不错,谢谢分享!
作者: mydorling11    时间: 2018-12-26 21:03
6666666666666666666666666666
作者: fujiangbo    时间: 2018-12-26 22:08

作者: 谢先森    时间: 2018-12-26 22:49
6666666666666666666加油
作者: huochao    时间: 2018-12-26 22:56
6666666666666666666666666
作者: 零度☆黎明    时间: 2018-12-26 23:03
感谢分享....................
作者: superbaby    时间: 2018-12-26 23:26
棒棒哒 .....................
作者: json0314    时间: 2018-12-27 00:10
good~~~
作者: JavaEE风清扬    时间: 2018-12-27 10:53
6666666666666666666666
作者: zplxwl    时间: 2018-12-27 12:39

666666666666加油
作者: #风萧萧#    时间: 2018-12-27 13:53
不错不错加油.............
作者: #风萧萧#    时间: 2018-12-27 13:54
不错不错、、、、
作者: 1098018910    时间: 2018-12-27 14:06
小舟从此逝,江海寄余生
作者: 大智叔叔    时间: 2018-12-27 17:02
好工作等你来~
作者: daoqin    时间: 2018-12-27 17:28

你就是最棒的
作者: 独上兰舟    时间: 2018-12-27 17:35
感谢分享
作者: SharkSSB    时间: 2018-12-27 17:44
文章文采斐然,辞藻华美,语言朴实,文笔清新,情感丰富,人物形象饱满,条理清晰,结构层次分明,情节合理,跌宕起伏,描写生动,引人入胜,艺术感染力强,结尾画龙点睛,寓意深刻,发人深思,意味悠长。
作者: 哦嗨呦    时间: 2018-12-27 17:57
顶!!!!!!!!!!!
作者: kdhdjdj    时间: 2018-12-27 18:12
6666666666666666666666666
作者: 1098018910    时间: 2018-12-28 09:10
作者棒棒哒!!!
作者: 1098018910    时间: 2018-12-28 10:19
作者棒棒哒!!!
作者: 1098018910    时间: 2018-12-28 10:27
作者棒棒哒!!!
作者: 1098018910    时间: 2018-12-28 11:01
作者棒棒哒!!!
作者: 1098018910    时间: 2018-12-28 11:26
作者棒棒哒!!!
作者: 1098018910    时间: 2018-12-28 12:01
作者棒棒哒!!!
作者: 1098018910    时间: 2018-12-28 12:02
作者棒棒哒!!!
作者: SunYan    时间: 2018-12-29 18:38

作者: 1098018910    时间: 2019-1-2 20:58
作者棒棒哒!!!
作者: 就业高冷派    时间: 2019-1-3 15:52
py@py 发表于 2018-12-25 12:34
666666666666666666666666666666

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:52
xiaoheizi 发表于 2018-12-25 12:39
6666666666666666666666

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:52
致橡树 发表于 2018-12-25 12:40
666666666666666666

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:52
曹阳茜 发表于 2018-12-25 12:58
圣诞快乐!!!!!

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:52
ruoquan 发表于 2018-12-25 13:10
666666666666,很厉害。

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:53
小公举 发表于 2018-12-25 13:17
感谢楼主的分享   谢谢   辛苦了

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:53
duanshaobo 发表于 2018-12-25 13:19
好大的数据啊

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:53
duanshaobo 发表于 2018-12-25 13:19
好大的数据啊

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:53
仙人掌sandy 发表于 2018-12-25 13:21
好大的数据啊

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:53
专找bug 发表于 2018-12-25 13:21
66666666666666666

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:53
专找bug 发表于 2018-12-25 13:21
66666666666666666

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:53
ouweina 发表于 2018-12-25 13:21
感谢大佬分享

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:53
小伙啊 发表于 2018-12-25 13:28
666666666666666666666

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:54
yy1134787753 发表于 2018-12-25 13:39
感谢分享

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:54
yy1134787753 发表于 2018-12-25 13:39
感谢分享

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:54
温柔一刀!喵! 发表于 2018-12-25 13:44

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:54
王航 发表于 2018-12-25 13:47
小舟从此逝,江海寄余生

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:54
兮兮哈哈 发表于 2018-12-25 13:51
6666666666666666

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:54
半个程序员 发表于 2018-12-25 13:59
圣诞快乐。2019冲鸭、

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:55
举个栗子 发表于 2018-12-25 14:04
6666666666666666666666666666666666666666

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:55
茶包哥 发表于 2018-12-25 14:10
学习到很多

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:55
从容微笑 发表于 2018-12-25 14:13

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:55
二郎显圣真君 发表于 2018-12-25 14:14
666666666666666666666666666666666

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:55
lzp791697309 发表于 2018-12-25 14:25
好大的数据啊

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:56
yangyifen 发表于 2018-12-25 14:29
666666666666666666666666666666666666666666666666666

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:57
pcdate 发表于 2018-12-25 14:39
66666666666666666

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:58
zhuyanting 发表于 2018-12-25 14:44
谢谢分享

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:58
梅优良 发表于 2018-12-25 14:49
6666666666666666666666

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:58
你不爱我 发表于 2018-12-25 18:42

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 15:58
zhanghua342 发表于 2018-12-26 09:41
感谢大佬的分享~~~~~~~~~~~~~~

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 16:00
zhanghua342 发表于 2018-12-26 09:41
感谢大佬的分享~~~~~~~~~~~~~~

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 16:00
淡写薰衣草的香 发表于 2018-12-26 14:26

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 16:00
影@子~ 发表于 2018-12-26 16:04
感谢分享

应该的,努力奋斗~
作者: 就业高冷派    时间: 2019-1-3 16:00
李娟玲老师 发表于 2018-12-26 16:11
6666666666666666666

应该的,努力奋斗~




欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/) 黑马程序员IT技术论坛 X3.2