加入收藏 | 设为首页 | 会员中心 | 我要投稿 衡阳站长网 (https://www.0734zz.cn/)- 数据集成、设备管理、备份、数据加密、智能搜索!
当前位置: 首页 > 站长资讯 > 传媒 > 正文

被仰望和遗忘过的Cloudera是否能王者归来?

发布时间:2020-04-15 15:17:13 所属栏目:传媒 来源:站长网
导读:副标题#e# 先想象这样一个场景 你家有个天台,上面什么都没有。 你一筐筐的把土背上去,铺了一小块地,然后又挑水施肥,种了几垄黄瓜、几棵西红柿和一小簇青菜。 你照顾的很用心,他们长势也很不错,红红绿绿,晨曦中沾满露水,散发出泥土的气息。 然后等到

于是一个魔幻的现象出现了,一边是Hadoop已死,独立供应商要完,一边各大云厂商却在拿Hadoop疯狂赚钱。据分析师测算,2018年单AWS的EMR就产生了2.5亿美金的营收,而该产品介绍就是“Hosted Hadoop framework“。而这并不是孤例,除AWS的EMR外,谷歌云有Dataproc,Azure有HDInsight,阿里云有E-MapReduce,云计算四巨头,全都把托管Hadoop放到了自己大数据产品的首页,这显然不是已死的技术该享受的待遇。

Cloudera的心情,大概就像开头说的种一年菜最后都被鸟收割了一样。

它当然解释过,但没什么效果。另外其实它很早就开始淡化自己是Hadoop供应商的概念了,比如和O'Reilly合办的Strata大会,以前叫Strata+Hadoop,2017年之后便把Hadoop字眼拿掉,改叫了Strata Data Conference。

只不过这一切几乎没有人听,就像自己已经被大家遗忘掉一样。

当然,Cloudera无论如何肯定面临着一些问题,而且远比技术问题复杂。

在合并之前,Cloudera和Hortonworks有各自不同的产品线,有各自不同的思路,Cloudera主打开源引擎加商业周边,Hortonworks主打全开源。所以合并后的第一个问题便是产品线怎么整合,原有客户怎么迁移。它Q1的财报里提到不少客户推迟了续费,主要就是这个原因,大家都在等。

但这个问题最多只算近忧,Cloudera真正的远虑,则是前面提到的公共云厂商。

云在吞噬一切,包括大数据,它们不止有托管的Hadoop,还有自研的替代产品。所以逻辑会变成这样,它们会用托管Hadoop鲸吞开源市场,然后用自研替代品蚕食Hadoop。比如AWS里的Redshift,从场景上基本可以看成是Hadoop+Hive的替代方案,但2018年营收约4亿美金,远超Cloudera。而且这个逻辑对所有开源厂商都成立,几乎成了开源软件的公地悲剧。2018年,在怒斥云厂商为吸血鬼而收效甚微之后,Redis和Mongo两家公司直接修改了开源协议,不再允许云厂商提供托管服务。

不过Hadoop用的是Apache协议,修改起来比较困难。但针对近忧远虑,Cloudera也给出了自己的答案。

那就是CDP。

03 王者归来

CDP,全称Cloudera Data Platform,是Cloudera和Hortonworks合并后的统一产品线,做了诸多技术升级,更重要的是其部署形态发生了根本性改变——CDP是基于云的,而且是混合云。

有人戏称,Cloudera终于迎来了Cloud Era。

并且,Cloudera还宣布2022年后停止对原来两条老产品线的支持,全统一到CDP上。很显然,这种大刀阔斧的革新,表明Cloudera孤注一掷想借CDP王者归来。它说CDP是一种新的数据方法,是世界上第一个企业数据云产品,对应的市场规模高达260亿美金,并将在三年后翻倍。

能行吗?

我们一层一层来看。

技术上,首先被大家诟病已久的Mapreduce在Cloudera的产品里早有了很多替代品,比如Spark和Flink;其次,CDP整合了云存储,这意味着HDFS的争议也能得到解决;最后,CDP在调度上对接了K8S,先不说可能性很小,哪怕最后K8S完全替换了YARN,CDP也能做到几乎不受影响。

所以技术层面,按照Cloudera CPO的说法,这叫“Hadoop已死,Hadoop万岁“。Hadoop里几十个项目,是一个生态,甚至一种哲学,早就超越了十几年前Mapreduce的范畴,正波浪式的向前蓬勃发展。

商业上,Cloudera一方面在2019年7月宣布所有代码全部开源,向红帽的商业模式靠拢。另一方面又在部署形态上做了大幅调整,改成了混合云。

这又可以分两层来说。

先说第一层,为什么要学习红帽。

实际上业界一直有一种说法,那就是开源软件的商业公司里,真正称得上成功的只有一家,那就是红帽。红帽自Linux起家,营收一度高达30多亿美金,而且长期盈利,直到2019年以340亿美金的天价卖给了IBM。

所以Cloudera学习红帽的商业模式很容易理解,而且红帽商业模式里的三个要点,Cloudera也基本都能满足。

  • 深度参与开源社区——Cloudera有一百多位Apache committer,在大数据方面的技术实力无可争议。
  • 代码全部开源,社区版激进,企业版稳定——全部开源是Cloudera发表的《我们对开源的承诺》一文的主要内容。
  • 靠企业版订阅产生营收,并提供咨询、支持等服务——CDP,也包括CDH和HDP。

红帽基于Linux,Linux和Hadoop都是基础软件。虽然层次不同,但按照红帽CEO的说法,他们的商业模式比较适合于“复杂、流行、社区驱动的基础软件上“。而大家对Hadoop最大的指责就是太复杂,所以,没准这种复杂性恰好有其商业价值,毕竟太简单的也没必要找个商业公司来兜底。

然而,学习红帽是否就够了呢?

红帽成立于1993年,那会可没有云计算的威胁。

这就说到了商业上的第二层,也就是CDP所指的混合云。

云在吞噬一切,只不过这种吞噬是从互联网创业的增量市场开始的,但随着网络应用的逐渐饱和,这部分市场越来越小,于是云巨头不得不把眼光放到传统IT的存量市场中去。但这些企业跟要么增长要么死亡的互联网创业公司不同,他们更关心稳定性、更关心数据安全,他们有自己的机房,拒绝被云厂商锁定。

于是混合云应运而生。

所谓混合云,就是搭建在自建机房和不同云厂商资源之上的云平台,这种情况下,不管是自建机房还是云厂商,提供的仅仅是底层计算资源,可以根据使用者的意愿随便切换,就像水和电一样,即插即用。

嗯,至少理论上是这样。

但实际上混合云市场还处在混战之中,参战者至少有三类:一类是公共云厂商,如AWS的Outposts、Azure的Azure Stack和谷歌的Anthos等,他们的混合云往往为了线下资源,终点在云,不在混合;另一类是独立混合云供应商,如红帽的Openshift,他们试图在各大公共云厂商基础上搭建一个通用混合云平台,终点在混合,不在云;还有一类,就是各开源应用厂商自己搭建的混合云,如Confluent的Confluent Cloud、Cloudera的CDP、Elastic的Elasticsearch Service等,他们的目标也是混合,但更纯粹,就是要反过来屏蔽云厂商提供的特定开源托管产品。

现在讨论混合云的最终格局显得有点太不自量力,我们不妨把问题稍微缩小一点,那就是在这种混合云的状态下,Cloudera的混合“企业数据云“,是否能做成?

(编辑:衡阳站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读