如今,越来越多的企业将其大数据业务迁移到公共云服务。而企业同时采用云计算和大数据技术将是一种完美的结合。行业分析师和企业it决策者对此表示认同,这并不奇怪:人们将在2018年看到大量的大数据项目涌入公共云。
调研机构forrester公司分析师brian hopkins在一篇题为“将大数据项目迁移到公共云中的报告”中指出:“如果企业不这样做,那么将无法跟上客户的步伐。”采用公共云是企业技术决策者对大数据投资的首要事项。
甲骨文和英特尔公司委托forrester公司进行的一项调查表明,在受访的431家企业中,有80%希望将其大数据和分析举措转移到云端。
据idc公司预测:“到2018年,新的云计算模式将出现在特定的分析工作负载上,与本地部署的分析解决方案相比,云计算支出的增长速度将会高出五倍。”
为什么突然涌向云端?
首先,大多数企业在最初的大型数据项目上都取得了成功。来自newvantage partners的2017年调查数据显示,接受调查的企业高管中有95%的人表示实施了大数据项目,80%的人表示在大数据项目方面获得成功。由于早期的成功,许多人希望扩大对大数据工具的使用。这意味着企业的大数据软件支出将会更多。idc公司预测,大数据分析软件市场将在未来五年内实现10.6%的复合年增长率,因为很多企业都增加了投资。
但是,企业对其内部部署进行的大数据分析的选择并不满意。大多数大数据项目都涉及hadoop,这是非常棘手的使用。根据gartner公司的说法,“整个hadoop堆栈的复杂性和可用性让许多组织重新考虑其在信息基础架构中的角色。与之相反,组织正在寻求日益竞争和更加方便的基于云计算的选项,按需定价并适合于目的数据处理选项。”
分析师表示,那些率先将大数据迁移到公共云的公司已经有了一些优势。hopkins说:“虽然大多数公司认为他们可以将业务迁移到公共云,但也有居心不良的公司或个人通过利用大数据云创新(如无服务器分析和人工智能)来窃取客户的资料。”他建议企业必须立即将其数据投资从本地部署的数据中心或混合部署转向公共云。
云计算和大数据:迁移的好处
基于云计算的大数据服务提供与其他公共云服务相关的所有优点。他们承诺提供更高的敏捷性和灵活性,能够从任何地方访问数据的能力,易于配置和管理以及成本效益。
此外,公共云特别适合大数据和分析工作负载,因为它们具有可伸缩性。基于云计算的大数据供应商qubole公司表示,“云计算与大数据真是一个完美的搭配,因为云计算所具备的动态扩充性与可负担性,可以满足大数据分析所需资源的庞大规模与突发性质的需求。”
同样,gartner公司指出:“基于云计算的大数据服务提供了令人印象深刻的功能,如快速配置、大规模可扩展性和简化管理。”
在甲骨文和英特尔提供赞助的调查报告中,forrester公司指出:“采用云计算进行大数据分析的企业可以实现更大的创新、更高的集成度和更高的安全性。”
随着软件即服务(saas)的日益普及,其趋势也使得基于云计算的大数据服务更具吸引力。 progress软件公司的2017年数据连接展望发现:“从2016年到2017年,saas采用率从62%上升到79%,其中超过50%的saas采用者使用两个或两个以上的saas数据源,超过35%的saas采用者采用的更多。”由于他们的大量数据已经驻留在云端,因此许多企业发现将数据保留在云端进行集成和分析是合理的,而不是将其转移到本地部署的数据中心。
如前所述,企业采用云计算也使得利用人工智能和机器学习等技术创新变得更加容易。hopkins表示:“到2020年,那些没有充分利用公共云进行大数据分析的公司将难以保持数字领导者的创新速度,这些行业领导者使用新兴技术进行创新比竞争对手更快。”
而云计算也可以提供长期的价格优势。hopkins说:“许多公司认为在公共云中存储大型数据集的5年或10年总体拥有成本(tco)与本地部署数据中心相比太高。但其价格在此期间将下降一半,而分析处理的能力每隔几年就会翻一番,成本急剧下降将使公共云的激励措施变得不可抗拒。”
他总结说:“企业架构师必须认识到,大数据和公共云的结合不仅仅是一种趋势,它也是数字恐龙的一个灭绝事件,数字化的先行者将利用大数据创新实现加速发展,获得更多的客户,而那些在这方面落后的企业终将被淘汰。”
将大数据迁移到云端的挑战
当然,企业将数tb或上pb的数据迁移到公共云也面临着巨大的挑战。
在调查中,49%的受访者表示,他们的数据在越来越多的数据源中传播,这将面临集成的挑战。41%的受访者表示将云数据与内部数据集成起来是困难的。
newvantage公司的调查突出了文化的作用。在接受调查的受访者中,52.5%的人指出组织的问题和阻力是他们实施大数据项目的最大障碍,29.5%表示他们的组织缺乏连贯的数据战略。
此外,企业也必须克服技术障碍。 forrester公司的调查发现,集成、安全和数据管理仍然是关键问题。
云端的大数据提示
那么组织如何克服这些挑战呢?专家提供了几条建议:
制定路线图。hopkins表示:“企业需要现在就停止投资本地部署的大数据功能。”他建议企业制定一个计划,最终将所有的大数据业务转移到公共云上,并且需要从提供最大潜在价值的项目开始。
不只是“提升和转移”。分析师和供应商都表示,如果企业只是将现有的大规模数据基础架构克隆到云服务中,那么不太可能获得组织希望实现的所有好处。相反,他们需要重新构建解决方案,以便他们能够利用公共云提供的独特优势和自动化功能。
确定saas、paas或iaas是否最适合企业的需求。企业对于大数据云服务有很多不同的选择,其中包括软件即服务(saas)、平台即服务(paas)和基础架构即服务(iaas)。组织的现有基础设施、大数据应用程序、遵从性需求和专业知识水平可能比其他组织更具吸引力。
尝试选择。大多数公共云供应商允许企业在有限的时间内以很少的成本或免费尝试他们的服务。专家建议,在承诺采用大规模大数据项目之前,企业应该充分利用这些试用机会。
考虑与合作伙伴合作。许多供应商(包括领先的公共云提供商)都提供旨在帮助简化将大数据从数据中心转移到云端的过程。企业可以与提供商合作,使用其提供的服务加快云迁移过程。
基于云端的大数据服务
实际上,数十家企业提供基于云端的大数据服务。其中包括一些众所周知的企业:
amazon web services
microsoft azure
google cloud platform
ibm cloud
oracle
tableau
teradata
datameer
tibco jaspersoft
hortonworks
cloudera altus
databricks
qubole
主要公共云供应商提供的大数据服务
在竞争激烈的云计算和大数据市场中,供应商的产品不断变化。为了获得最新的信息,企业需要经常访问这些页面: