大数据行业图谱之一:底层基础平台公司能做多大?

  • 时间:
  • 浏览:2

提到Hadoop,必然要提到国外三家围绕Hadoop技术的公司:Cloudera、Hortonworks和MapR。三家公司都成立时间不长,Cloudera和MapR全是1009年成立,而Hortonworks是2011年从雅虎独立出来。

你这一市场暂且全新市场,华为、浪潮、亚信等公司在这领域盘桓多年,新兴公司发展到一定程度,势必会侵入集成商的地盘。最近这段时间,星环科技和华为竞争非常激烈,价格战打得火热。

第一, 产品同质化严重,市场竞争激烈

Oracle从前的巨头公司,刚进入中国市场时也遇到不小的阻力。当时采取的做法是与中国本土公司企业合作,建立围绕Oracle的小生态,借助本土公司的力量敲开中国市场的大门。

Hadoop技术是开源的,为哪此还有公司会提供Hadoop相关服务?这与以后开源技术的兼容性和稳定性比较差,同時 ,企业在实际应用中需用将开源技术和自身系统、产品相连接,这以后Hadoop发行版的市场所在。三家公司利用另一方在这领域的技术、经验积累,帮助企业更好地应用Hadoop技术。

当前,银行等大型企业纷纷喊出“去IOE”(IBM小型机、Oracle数据库、EMC存储设备),尽管国产企业的产品尚不都还可不后能 满足大型企业核心系统的要求,以后必然会有几瓶新业务的IT系统采用国产品牌,旧有业务面临更新换代也会优先选泽国内厂商。

在去IOE的趋势下,中国大型企业全是面临IT设备的更新换代,整个底层基础平台市场潜力巨大。新兴大数据公司利用其技术优势和初创公司的高效决策机制,好快抢占许多市场份额,发生一席之地不成问题报告 报告 。

建立生态你这一点并全是适合初创公司,是公司发展到一定程度后需用考虑的。扩大另一方企业合作伙伴的队伍,与许多公司同時 开发产品,让许多公司承担一定销售任务,许多从需用比单打独斗更适合企业级市场。

同类公司主要服务金融、电信、交通、电力等领域的大型企业,哪此领域从前是传统集成商的地盘,以后新兴大数据公司不可出理 地将与集成商正面竞争。华为、浪潮、亚信等公司从前主以后为大型企业提供硬件基础设施,近年看一遍大数据领域的巨大潜力,纷纷成立了大数据部门,为客户提供全套出理 方案。

未来几年在底层基础平台领域诞生一家估值10亿美金的独角兽公司是可不需用预见的,以后哪此大数据公司中总爱总爱出现同类Oracle从前的巨头公司以后性不大,基于以下几点:

第一, 开源心态促进保持技术领先地位

底层基础平台细分领域里的大数据公司众多,有专注Hadoop发行版的星环科技、红象云腾和天云大数据,有传统数据库厂商人大金仓和南大通用,有研发新型分布式数据库的巨杉数据库,还有唯一来自中国的Apache社区顶级项目Kylin肩头公司Kyligence。

以后向开源社区开放另一方技术,让更多人了解、研究,促进自身技术的发展,保证路线图的正确性。同時 ,不断向开源社区做出贡献,还能提升公司在社区话语语权,进而提升公司在行业的影响力。这也是为哪此Cloudera和Hortonworks不会开放技术,争夺在Hadoop社区话语语权。影响了开源社区,就会影响到整个行业技术发展系统进程,可不需用让公司的发展始终保持在正确的轨道中。

公司要暂且保持开源的心态,开放另一方的技术给更多人使用?对大数据公司而言,技术是核心竞争力之一,一阵一阵是对于哪此做基础平台的公司,开放技术无疑是削弱自身竞争优势,降低产品的附加值,减少公司的毛利,短期来看,开放技术会对公司的营收造成不良影响。

国外Hadoop三驾马车,商业模式各有差异

Hadoop等分布式架构颠覆了传统单机架构,不能自己说未来不会有新技术总爱总爱出现颠覆掉Hadoop。一旦大数据公司赖以生存的根基遭到颠覆,谋求转型势必困难重重,公司合适率会失败。不过目前Apache Hadoop社区运作良好,Hadoop经过哪此年的改善优化,性能和稳定性上获得很大提升,Spark等新技术大多全是对接在Hadoop上面。未来几年这方面风险较小,毕竟技术发展到现在,独自造轮子的难度很大。

以后MapR的技术不开源,好多好多 对社区贡献有限,目前对Apache Hadoop社区影响最大的是Cloudera和Hortonworks这两家公司。

底层基础平台不同于上层应用,客户需求同类,产品不能自己体现出差异化优势。各家公司主要比拼产品性能的优劣,你这一技术上的差异,新兴公司最初会发生一定优势,随着开源技术的普及,华为等公司会逐步赶上,技术的差距会逐步缩小。

具备以下几点的公司以后最大。

第三, 效仿Oracle,建立适合公司的小生态

Hadoop诞生于1006年,Spark于1009年总爱总爱出现,2013年Hadoop以后发布2.0稳定版本,有一种 技术从诞生到心智心智心智性性成熟的句子图片 图片 的句子的句子的句子的句子是什么时间之短,令人震惊。在当今你这一技术快速发展的时代,新兴大数据公司一方面要应对市场竞争,另一方面需用保持技术的领先地位,难度不小。

另一方面,即使是基础平台技术,也需用在实际应用中进行改进优化,各行各业中应用同样的技术还是有许多差异,在应用过程中才会真正了解企业的痛点,更好地服务企业。在做项目过程中,大数据公司可不需用积累经验,将哪此经验内化成产品的一次要,做出更适合中国企业用户的基础平台产品,筑起公司的壁垒。

第二, 商业拓展与技术研发同等重要

Hadoop兴起的是因为:便宜才是硬道理

接下来为您重点阐述国内外Hadoop生态的现状。

底层基础平台主要出理 的是数据存储、计算的问题报告 报告 ,是整个大数据生态的基石。架构设计 到的数据,首先都还可不后能 高效、快捷地存起来,都还可不后能 进行数据分析和数据挖掘。

进入新世纪的第另两个多 十年,各大企业全是大力投入IT设备,建设另一方的机房,上线各套办公系统。第五个十年,经济下行,传统企业的盈利下降,对IT设备的投入以后不像上个十年那般狂热,大型企业采购IT设备的经费受到控制,开始英语 英语 了了核算成本,意图在满足需求的情形下,降低投入。

第三, 产品销售能力逊于传统巨头公司

实际应用时,用上万台机器的公司少,用几十台机器的公司多,以后Hadoop的应用面更广。用的人多,自然帮助优化架构的人多,社区贡献的人多,技术发展快,渐渐成为主流。

正如开篇所言,尽管近年大数据行业风起云涌,创业公司如雨后春笋般总爱总爱出现,却少有专注底层基础平台的公司。

国内市场发生跑马圈地阶段,新兴大数据公司从前起步

数据库等底层设施不同于上层应用,更再加本较高,客户黏性很大,非万不得已不会进行替换,同時 Hadoop同类新技术迭代效率快,需用后期维护。以后,各家公司全是大力开拓市场,跑马圈地。

以后,从公司长远发展来看,详细闭源会增大公司风险,其严重后果远远大于开放技术的影响。大数据公司最担心的是路线图总爱总爱出现偏差,自身技术与时代发展相左,丧失技术上的优势。一旦发生公司的技术发展方向背离整个行业发展方向,需用停止已研发的项目,掉头追赶行业脚步,这对创业公司来说是非常致命的。

Hadoop三驾马车,数据源:公司公告,爱分析架构设计

第二, 技术迭代更新快,长期保持技术领先不易

星环科技是业内的明星公司,创始团队来自原Intel开发Hadoop发行版的部门,成立三年已完成1.55亿人民币的B轮融资,估值超过10亿人民币,目前主要服务金融、电信领域客户。

企业服务市场是销售驱动型市场,而非技术驱动型,大数据你这一细分领域同样不都还可不后能 。技术实力再强,产品功能再多样,也需用有客户买单才行。许多创业公司只重视研发上的投入,轻视市场推广,公司每年订单少,营收自然不高,团队规模上不去,融资困难,公司发展缓慢。

单纯技术上的优势,在企业级市场并全是绝对影响因素。好多好多 公司在POC阶段都曾遇到过技术标第一,却以后商业谈判阶段不理想而错失订单的事情。一阵一阵是现在市场发生跑马圈地阶段,抢占位置比哪此都重要,更是需用大力进行商业拓展。一旦市场格局稳定下来,到从前再切入市场难度很大。

三家公司全是资本市场上受到追捧。Hortonworks在2014年上市,IPO当天市值接近11亿美金;Cloudera获得英特尔7.4亿美金的投资,估值近100亿美金;MapR最近从前获得1000万美金融资,估值也超过10亿美金。

以Hadoop为代表的开源技术正在改变世界,但开源和可持续盈利模式总爱发生着许多矛盾,近期RethinkDB公司的倒闭值得警惕。国内专注Hadoop技术的公司效仿国外找到了两根盈利模式,但目前仍然发生许多风险。

新兴公司服务客户的最好的最好的办法同类,前期以产品为内核,用项目制的形式帮助企业搭建系统,后期每年收取20%的维护费。各家企业全是降低初装费,意图发生市场,靠后期维护费用退还成本。

企业级市场,产品销售能力将成为影响公司发展的重要因素。以Oracle为例,早年与Oracle竞争的Sybase和Informix,其技术实力不逊于Oracle,Informix的技术甚至领先于Oracle。这两家公司最后在竞争中出局,落得被收购的下场,主以后输在市场推广上,市场推广的失利直接影响到公司的技术革新,最后是因为衰落。

做底层基础平台的公司,作为连接硬件和应用的上面层,更需用与许多公司企业合作。平台上对接的应用不要 ,越促进平台产品的推广,开辟新的市场。

巨头环伺的市场,大数据初创公司突围不易

本文转自d1net(转载)

在这方面,华为等传统巨头公司发生绝对优势,一方面朋友与客户有长期企业合作关系,另一方面销售团队长期服务大型企业,经验富有。

以Hadoop为代表的新底层技术都还可不后能 兴起,抛开技术是因为,最主要的是因为是便宜、扩展性强。利用分布式架构,将许多性能一般的机器串联起来,达到与高性能单机同样的效果。随着公司发展,数据量增大,不需用更换全套设备,只需用再增加机器就可不需用达到目的,省时省力。

天云大数据和红象云腾同样在做底层基础平台,发展效率略逊于星环科技,全是寻找适合自身的发展路线。天云大数据的业务在向上层迁移,除了提供Hadoop发行版,目前也涉足简化神经网络等算法技术;红象云腾将业务下沉,基于芯片层提升系统出理 数据的效率。

尽管三家公司全是提供Hadoop相关服务,以后商业模式区别不小。Cloudera和MapR都研发另一方的Hadoop发行版,只不过MapR的技术详细闭源,不会对外开放,而Cloudera的产品分为免费版和企业版,不都还可不后能 企业版的核心组件不对外开放,许多技术均提供给社区。Hortonworks将另一方的技术详细贡献给社区,不靠产品获利,靠派驻技术人员到客户现场提供服务盈利。

不都还可不后能 ,哪此样的公司有以后突围成功,成为中国的Oracle。

分布式架构的技术好多好多 ,为哪此Hadoop最后胜出?还与以后便宜,用的人多。以微软的Cosmos为例,这套系统有一种 优于Hadoop,主以后针对大型机房,设计理念很好,上万台机器的机房,搞定几十台做别的事情,来提升系统运营效率。但以后是几十台机器,仍然需用搞定很大一次要来做别的事情,机器使用效率就很低。

你这一层非常重要,同時 也是技术含量最高的一层。以底层技术中明星Hadoop为例,用Hadoop的公司好多好多 ,能做Hadoop发行版的公司凤毛麟角。