Cloudera和Hortonworks合并,接下来应该做什么?

借助Hadoop,大数据分析获得了巨大的发展动力。它已成为每家处理大数据计算的大公司的主食。从成立之初到2017年,这十年间,Hadoop发展了很多。Hadoop版本3以几乎两倍的存储容量和更多功能出现。毫无疑问,在大数据技术领域,Hadoop拥有光明的未来。

对专门从事Hadoop发行的Hadoop专业人士的市场需求。大多数公司都将Cloudera或Hortonworks用作Hadoop分发平台。两者均基于Apache Hadoop构建。因此,Cloudera和Hortonworks都具有一些相似之处和不同之处。

Cloudera和Hortonworks之间的相似之处

  • 两者都是用于企业目的的Hadoop发行版。
  • 它们是稳定且安全的分发。
  • Cloudera和Hadoop具有活跃的社区来帮助解决问题。
  • 两者都为想要成为认证Hadoop专业人士的专业人士提供强大的培训平台。
  • Cloudera和Hortonworks均基于无共享架构。
  • 明智的分布是基于主从结构。
  • 两者都支持MapReduce和YARN。

Cloudera和Hortonworks 之间的区别

Cloudera和Hortonworks都基于相同的Apache Hadoop。但是,它们有很多差异。

  • Cloudera主要用于商业目的,并且拥有商业许可证。另一方面,Hortonworks拥有开源许可证。因此,他们的业务增长策略完全不同。
  • 由于Hortonworks发行版是开源的,因此它是完全免费的,而Cloudera提供付费服务。尽管他们提供了有限的免费试用期。
  • Hortonworks和Cloudera遵循两种不同的技术策略。例如,Hortonworks使用Ambari代替任何专有软件进行管理。它更喜欢像Stinger和Apache Solr这样的开源工具进行数据处理。另一方面,Cloudera有自己的Cloudera管理器。
  • Cloudera遵循传统软件的道路,因此遵循更积极的业务战略。但是,Hortonworks依赖于某种程度上面向销售的开源产品。
  • Hortonworks发行版在Windows服务器上作为本机组件工作。另一方面,Cloudera CDH可以在Windows服务器上运行,但是它不是本机组件。

Hadoop开源框架是大数据分析公司中最喜欢的有效存储数据以供分析的工具之一。Hadoop本身是大数据的同义词。多年来,AWS,Microsoft Azure等公共云平台因其内部部署的云基础架构而越来越受欢迎。这些平台中的大多数都带有完全集成的Hadoop / Spark服务,与Cloudera这样的Hadoop发行版相比,其扩展规模要便宜得多。

除此之外,公共云服务还引入了更好的文件系统,可以消除Hadoop存储所需的高存储成本。最重要的是,像BigQuery这样的新服务开始发挥作用,可以完全消除对Hadoop或Spark软件的需求。

这导致这些分销商的市场份额大幅下降,这可能是Cloudera和Hortonworks合并的原因。

经过数年的努力,Cloudera和Hortonworks于2019年合作,将开源Apache Hadoop大数据软件商业化,公司将其用于存储和处理许多不同种类的业务信息。但是他们俩都无法将Hadoop的普及转化为利润,并且面对资金充裕的云竞争对手(如Amazon Web Services Inc.)日益严峻的挑战,两家公司最终决定结盟是前进的道路。

Cloudera和Hortonworks宣布合并,这让很多人感到惊讶。尽管时机出乎意料,但开源技术在行业中的整合并没有使所有人感到震惊。毕竟,今天有多少著名的Linux商业供应商?市场很难为任何东西维持多个开源平台。因此,市场上是否有合并Hadoop / Spark供应商的问题实际上不是问题,而是时间问题。

而且,不管您是否喜欢这项合并的想法,除非受到监管部门的干预,否则它都会发生。此时更相关的问题是:

  • 如果我选择Hortonworks堆栈并将其替换为Cloudera,反之亦然会产生什么影响?我有危险吗?
  • 对于想要实施现代数据分析平台的组织来说,这如何使事情变得更好或更轻松?

好消息是,Cloudera / Hortonworks已经宣布将支持当前的HDP和CDH平台三年以上。以当前的创新步伐,数据分析空间已经存在了两个生命周期。此外,他们还表示将提供某种融合的路线图,最终将这两个平台整合在一起。我还可以想象,他们将在这段时间内提供专业服务,以将不同技术的领域迁移,例如将Atlas迁移到Navigator或将Navigator迁移到Atlas。

在临时首席执行官马蒂·科尔(Marty Cole)的领导下,Cloudera经历了短暂的复苏。在为期六个月的任期内,该公司启动了备受期待的Cloudera数据平台,该平台是基于云的合并后继产品,成为合并前的Cloudera和Hortonworks产品的继任者。

此外,合并后的组织现在的收入超过7亿美元,最终将拥有更大的合并后的开发组织。对于用户群而言,这可能是个好消息,因为这种合并不会为元数据存储库,安全性等提供两种不同的技术,而是将围绕一致的基本功能集提供更多的关注。从我们作为在Hortonworks和Cloudera之上运行的自动化敏捷数据工程平台的开发人员的角度来看,对基础技术的整合无疑将使像我们这样的应用程序开发人员的工作变得更加轻松。


分享到:


相關文章: