黑马程序员技术交流社区
标题:
惠普于志伟:大数据从5%突破 (1)
[打印本页]
作者:
朱神必
时间:
2014-2-26 18:44
标题:
惠普于志伟:大数据从5%突破 (1)
2013年,惠普发布了大数据解决方案平台HAVEn,这是一个能够处理所有数据类型,能够实时分析且安全的开放架构。目前,该平台在国内外的金融、电信、能源、互联网等行业中已经拥有了许多成功应用。惠普中国区副总裁、软件集团大中华区总经理于志伟表示,HAVEn的推出标志着惠普已经脱离了初始的数据汇集的阶段,步入了大数据应用的新阶段。
行业、能力、人才
于志伟认为,目前中国的大数据应用还处于起步阶段,而且由于行业需求、区域和人才储备等情况的差异,造成了大数据应用水平参差不齐的现象。在某些行业,用户对大数据的需求是十分迫切的,但是相当多的用户仍纠结于数据量“大”这个问题,还没有考虑结构化、半结构化和非结构化等不同类型的数据应该如何处理。
国外的大数据应用水平已经达到很高的程度。举例来说,在美国,一个区域内的所有医院的信息都会被搜集起来用于分析,据此可预测某种疾病的死亡率。“国外的大数据应用已经走入行业,可以挖掘出行业中真正有价值的东西。虽然国内的大数据应用还停留在初始阶段,但在某些行业,比如互联网,其大数据应用的复杂程度比国外更甚,发展水平也较高。”于志伟向记者表示。
大数据的应用要经历一个过程,不同的行业对大数据应用的需求是不同的。于志伟表示,企业在实施大数据应用时应注意以下几个问题:第一,注重大数据的行业应用价值;第二,企业要不断提升自身的能力去获得想要的信息;第三,大数据人才非常重要。“目前,我国大数据行业面临着人才严重匮乏的局面,从数据模型专家到通晓行业应用的复合型大数据人才都十分短缺,这会影响大数据应用的发展速度。”于志伟表示。
HAVEn是一种方向
今天,产品集成并不是难事,那么HAVEn是不是简单地将相关产品攒到了一起呢?于志伟澄清说,从HAVEn本身的标准架构来看,H代表Hadoop,表明HAVEn是一种分布式的架构,能够支持各种类型的数据,而且存储成本非常低廉;A代表Autonomy,表明HAVEn可以高效地处理非结构化信息,特别是机器语言;V代表Vertica,表明HAVEn可以实时处理和分析大量信息;E代表Enterprise Security,主要针对半结构化数据的处理;n代表的是各种在大数据平台上开发的应用。
HAVEn是一个平台,它可以处理所有类型的信息,而且能做到实时分析,同时具有安全性。那么,HAVEn能不能代表未来大数据方案的发展方向?于志伟并没有正面回答记者的问题,而是举了一个例子,全球最大的社交媒体公司,之前采用Hadoop架构对信息进行处理。但是在半年前,它们采购了Vertica。很多人认为,Hadoop代表了大数据主流的发展方向,那么这家企业为什么会转而选择Vertica呢?最主要的原因是,Vertica可以实现实时分析。对于以广告收入为主要来源的这家企业来说,实时推送精准的广告是至关重要的,而Vertica可以实现。这家企业用Hadoop处理非实时的数据业务,而用Vertica进行实时的业务分析。虽然相比Hadoop,Vertica的采购价格略贵,但这家企业还是一次性采购了20PB。还有一家美国的知名电信公司,一次性采购了25PB的 Vertica解决方案,用于4G业务。
“我们不去争论HAVEn是不是业界最先进的产品,但是综合上述这些已经使用了HAVEn的代表性企业的实践,HAVEn代表了一种发展方向。”于志伟分析说,“Hadoop将来会不会更全面,也能实时处理信息?有这种可能性,但需要时间。三年或五年以后,什么都可能发生,一种新技术甚至会消失。事实证明,我们的大数据平台能够解决用户的问题,而且很多用户都在使用。”
在中国,也有用户在使用HAVEn,比如一个运营商使用HAVEn中的Vertica,分析用户的上网行为,每天分析的记录达到几十亿条。以前,这样的分析工作很难在一天之内完成,而使用Vertica,分析速度提高了60倍。另外,国内某知名能源公司采用HAVEn中的Autonomy,支持其信息共享平台。
欢迎光临 黑马程序员技术交流社区 (http://bbs.itheima.com/)
黑马程序员IT技术论坛 X3.2