分享互联网行业资讯,探寻网站建设新风向
日期:2015-09-22
注:大数据不仅仅是一个营销词汇,在这篇干货满满的文章里,作者用数据告诉我们,究竟什么是大数据,大数据行业的创业机会如何,未来的创业方向又有哪些。
接触大数据,了解这个行业已经有两年多了,每天都在阅读大量的关于大数据的文献资料和技术文章。如果你要问我什么是大数据?以前可能我会和你说,大数据是一种思维,一种技术,标志的是大数据的4V特点:
Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。大数据带来的是一种变革,打破了原有的随机分析(抽样调查)方法,采用所有全量的数据来进行分析,分析的数据更加复杂,有结构化数据、半结构化数据和非结构化数据,分析结构更加注重相关性而不是因果。
可是,普通人和大众用户他们听得懂吗?现在我会举例子告诉你。
比如说,采野蘑菇/野山参这样的事情,野蘑菇和野山参的分布地点都是随机的,经验告诉我,它们会分布在哪片山林,但是我们不知道具体位置,得一个一个的找。大数据可以解决这个难题。
我们可以把山林用数据可视化表现出来,然后让采野蘑菇的人根据自己的实战经验标出蘑菇分布的地点,并且把这些地点数据常年积累起来。然后结合野蘑菇的习性,收集每片山林的降雨量、灌木丛分布数据、土壤数据、温度数据以及山林里采蘑菇的人流量数据等等,来准确的预测出野蘑菇的分布地点。
这就是大数据力量。
一言以蔽之,大数据最直接的意义就是让“随机性”的事情变得可提前预测,从而提高效率和行动价值。
同样的思路,森林防火防贼、环境保护、旅游景点客流预测等等,都可以引入大数据思维。大数据同时也可以为我们工作、学习和生活中一些重大决策作为依据。
今天主要说的是大数据领域的创业思考,大数据只有和生活、学习、工作以及商业等场景结合才能产生价值。推动技术发展的从来都不是技术本身,而是消费者(用户)的需求。用户不需要知道也没兴趣知道你处理大数据是用Hadoop还是Spark、原理是什么、架构是什么,用户最关心的是大数据到底怎么用,用了能为自己带来什么好处。
今天我们将从“外部大环境”、“行业内部环境”、“创业风险”和“大数据创业机会和方向"四个点来阐述主题,聪明的朋友也许已经知道了,我们的思路就是大数据领域创业的SWOT分析。
大数据市场现状(外部环境)
根据贵阳大数据交易所5月28日发布的《2015年中国大数据交易白皮书》显示:2014年中国大数据市场规模达到767亿元,同比增长27.83%。预计到2020年,中国大数据产业市场规模将达到8228.81亿元。
一、大数据市场规模巨大
首先,中国大数据市场环比增长率较大。根据易观智库7月30号发布的中国大数据应用行业的报告显示,2015-2018年中国大数据市场营销规模达到258.6亿人民币。环比增长率为37.2%。
其次,大数据在全球范围内的市场规模同样巨大,根据idC发布最新研究结果,预测到2018年全球大数据技术和服务市场的2018年的复合年增长率将达到26.4%,规模达到415亿美元,是整个IT市场增幅的6倍。
无论是从国内还全球的市场规模和增长率来看,我们都可以得出这样一个结论,无论你是什么样的公司,或者说你未来创业要做什么样的服务,大数据都是兵家必争之地。大数据本身就是一种无形的资产,如果你的公司还没有部署大数据,那么在未来的市场上会失去核心竞争力。就好比你走在中关村创业大街上,你能收到的100份融资BP里,可能有99份都是APP和O2O项目,但99家里90%以上会重视大数据。
二、政策好,政府支持力度大
根据gov.cn9月6日消息,国务院公开发布《国务院关于印发促进大数据发展行动纲要的通知》,纲要里明确的说明,中国将在2018年会建成政府的大数据平台。相比之下,我们敬爱的习大大和李克强总理也经常为大数据站台,为中国的大数据发展点赞。看政府对大数据的重视,你抬头看看前两天的北京的蓝天,就会对政府有信心了。政府真正要干一件事,执行力大的超出你的预期。
据我们的观察,大数据领域的创业环境只会越来越好。目前,很多一线城市乃至二三线城市的科技园区,都出台了相关的扶持大数据产业的政策。如果你真的想在这个行业创业,可选择扶持力度大、人才较多的城市作为大本营,当然了,北京肯定是首选。
三、资本关注热
上图是我们(36大数据,编者注)对大数据垂直领域2015年资本投资事件的不完全统计。其实你仔细来看图会发现,大数据行业的资本关注热度是远远高于其他行业的。这个可以从投资金额可以看出来。今年上半年O2O项目非常热,也是投资重点关注的行业,但是投资的资本里,普遍都是人民币几百万和几千万这样的量级。而大数据行业的投资,更多的资本量级都是上亿的,而且资本多源于顶级投资机构。
大数据行业现状(内部环境)
“大数据就像十几岁少年眼中的性行为,每个人都在谈论它,但没人真正知道怎么做。每个人都以为除了自己之外的每个人都在使用它,所以每个人都装作自己很了解它。”
TED的创始人Dan Ariely是这样调侃大数据的。虽然是句玩笑话,但也确实说出了大数据的行业现状。
现状一、市场尚未饱和,竞争并不激烈
1、尚未出现垄断性行业巨头
前面我们分析了大数据整个大环境的状况,我们知道大数据行业市场潜力巨大,未来的增长率将达37%左右。但是在中国,目前尚未出现一家如Palantir、FICO这样的垄断性质的大数据企业。也许百分点和Talkingdata都在布局上市,但是距离挂牌还有一段时间和距离。新创的大数据企业中,还没有一家在美股、港股和深交所上市。
这是一个机会。创业你做电子商务也好,做游戏也好,都有好几家有钱有用户的巨头公司和你争抢市场份额,但是大数据行业不一样,大数据行业没有那么大的竞争压力,而且真正的战争尚未开始。
2、现有大数据企业扎推北京
根据数据堂统计的数据来看,新创的大数据企业中,57%的公司都在北京,上海占了15%的份额。大数据需要和实际的业务场景结合才能产生价值,工业、农业、制造、交通和能源等传统行业仍然拥有巨大的潜力,北上广深和二三线城市的大数据力量还没有完全被挖掘出来,这同样也是一个优势。
3、大数据在生活、商业渗透性较弱
笔者做大数据两年了,天天都听到或看到大数据的各种消息,但是生活并没有因为大数据的到来变得更智能一些。它没有让大龄光棍女青年更快更精准的找到结婚对象,也没用让隔壁老王炒股赚到更多的钱,更没有让北京的交通不再拥堵……大数据有用是不假,但是和生活场景结合得还是较弱。并没有看到可以称之为“变革”的现象。
4、没有直接的变现模式
互联网上最赚钱的两大行业分别是电子商务和网络游戏,这两个行业的变现模式都是非常清晰和直接的,但是大数据的变现模式需要绕一个弯子,需要和实际业务场景结合起来才能产生价值,不直接的路定然不好走。
有人曾经把大数据比作石油,可是,目前的情况看来,大数据行业还需要像发动机一样可以将数据转化成动力的载体。一如2010年以前一样,大家都知道手机游戏是未来的一个趋势,可是没有iphone等智能移动设备的出现,手机游戏的市场份额就非常小,用户体量也很有限。
现状二、大数据行业人才紧缺
根据中国商业联合会数据分析专业委员会统计,未来中国基础性数据分析人才缺口将达到1400万,而在BAT企业招聘的职位里,60%以上都在招大数据人才。2015年-2016年是大数据人才最为匮乏的两年,因为已开了大数据专业的高等院校,第一批大数据人才还为毕业;已有的人才里,复合型的人才较少,都是术有专攻。
全球的大数据人才情况也不容乐观,据Gartner预测,到2016年,25%的全球大型企业将部署大数据分析系统;到2015年,圈球大数据人才需求将达到440万人;调查结果表明,全球64%的企业已经开始向大数据项目注资,或者打算在2015年6月之前将计划付诸实践。
大数据创业,人才就是核心,所有的公司都在抢大数据人才,创业公司想要招到相应的大数据人才非常困难。
现状三、数据量增长超快
这里和大家分享三个数字。49亿、250亿和 39ZB。
49亿物联网设备:咨询公司 Gartner 预测今明两年互联物品的涨幅将达30%。分析师在指出,截止到2015年,全球物联网设备数量将从38亿飙升至49亿。
250亿智能装置传感器:分析师预测,传感器的普及将大大加速智能设备的开发、生产进度。到2020年,将会有大约250亿部智能装置出现在全球市场。
39ZB数据存储量:在 2014 年年底,国内网络上集中存储的数据已经达到 1ZB,到 2020 年时,当年的新增数据量将会达到 15.45ZB,整体的网络上数据存储量将会达到 39ZB,未来 6 年的年复合增长率达到了 84%。
预测到 2020 年, 平均每个中国人每年产生的数据约为 4.1GB。
现状四:行业目前存在问题
1、炒作过剩,实际落地产品较少;很多产品都是打擦边球;把大数据玩坏了。现在你和大家说大数据,很多人都认为你在骗人。行业想要持续稳定的发展,企业必须有自律。
2、群众基础差,关注的人群多为三高人才,高学历高收入和高技术。从百度指数可以看出,关注大数据的人群中,53%比例的人群年龄分布为30-39岁,而20-29岁人群占的比例为28%;另外,关注大数据的男女比例里,男性占到了80%以上。这样的数字直接告诉我们的问题就是,“大数据”的话题传播性其实并不好。预计超过90%的大众用户不知道大数据是个什么东西。
3、大数据只解决了部分2B的问题,2C产品较少。现在大家都觉得大数据的方向就是2B,我们不这么认为。打个比方说,你做2B的产品,每家企业平均给你200万,新创大数据企业你撑死了一年做上20家企业,那么营收预计在4000万左右。但是如果你做2C的大数据产品,一个用户给你200块,当你做到20万付费用户的时候,你的营收就会超过4000万。为什么呢,因为用户的数据本身就是钱。从深远的角度来说,未来的创业,你必须学会讨好大众,服务好90后,这才是种子用户。
4、懂技术的人不懂业务,懂业务的人不懂商业。这一点不想做详细的说明,打击面太广了。笔者参加了众多大数据行业内的峰会大会小会,人人都在说大数据,可是问到你的业务如何赚钱的时候,很多人都是三缄其口。纯技术是无法赚钱的,必须和实际的业务结合起来产生商业价值,才能获益。
5、市面上存在的大数据工具上手门槛较高。又一个槽点出来了。前面也说了,任何的新技术,都是需求推动其发展。需求来自用户。任何的新技术,只有拥抱大众用户才能得到更好的发展,接地气非常重要。现有的大数据处理工具非常复杂,需要你懂这个那个会这个那个才能使用,大众根本接触不到。现有的大数据工具也不够亲民,无论是2B也好,2C也好,你需要给别人的是一个简单动动手就能用的工具,里面有功能按钮,而不是一堆代码,最起码应该满足目前Office工作人员使用。上手门槛较高意味着很大一部分用户被你挡在了门外。将大数据处理工具产品化势在必行。
但有,些事情是“大数据”不擅长的:
数据不懂社交。大脑在数学方面很差劲(不信请迅速心算一下437的平方根是多少),但是大脑懂得社会认知。人们擅长反射彼此的情绪状态,擅长侦测出不合作的行为,擅长用情绪为事物赋予价值。
计算机数据分析擅长的是测量社会交往的“量”而非“质”。网络科学家可以测量出你在76%的时间里与6名同事的社交互动情况,但是他们不可能捕捉到你心底对于那些一年才见2次的儿时玩伴的感情,更不必说但丁对于仅有两面之缘的贝阿特丽斯的感情了。因此,在社交关系的决策中,不要愚蠢到放弃头脑中那台充满魔力的机器,而去相信你办工作上的那台机器。
数据不懂背景。人类的决策不是离散的事件,而是镶嵌在时间序列和背景之中的。经过数百万年的演化,人脑已经变得善于处理这样的现实。人们擅长讲述交织了多重原因和多重背景的故事。数据分析则不懂得如何叙事,也不懂得思维的浮现过程。即便是一部普普通通的小说,数据分析也无法解释其中的思路。
数据会制造出更大的“干草垛”。这一观点是由纳西姆•塔勒布(Nassim Taleb,著名商业思想家,著有《黑天鹅:如何应对不可知的未来》等书作)提出的。随着我们掌握的数据越来越多,可以发现的统计上显著的相关关系也就越来越多。这些相关关系中,有很多都是没有实际意义的,在真正解决问题时很可能将人引入歧途。这种欺骗性会随着数据的增多而指数级地增长。在这个庞大的“干草垛”里,我们要找的那根针被越埋越深。大数据时代的特征之一就是,“重大”发现的数量被数据扩张带来的噪音所淹没。
大数据无法解决大问题。如果你只想分析哪些邮件可以带来最多的竞选资金赞助,你可以做一个随机控制实验。但假设目标是刺激衰退期的经济形势,你就不可能找到一个平行世界中的社会来当对照组。最佳的经济刺激手段到底是什么?人们对此争论不休,尽管数据像海浪一般涌来,就我所知,这场辩论中尚未有哪位主要“辩手”因为参考了数据分析而改变立场的。
数据偏爱潮流,忽视杰作。当大量个体对某种文化产品迅速产生兴趣时,数据分析可以敏锐地侦测到这种趋势。但是,一些重要的(也是有收益的)产品在一开始就被数据摈弃了,仅仅因为它们的特异之处不为人所熟知。
数据掩盖了价值观念。我最近读到一本有着精彩标题的学术专著——《‘原始数据’只是一种修辞》。书中的要点之一就是,数据从来都不可能是“原始”的,数据总是依照某人的倾向和价值观念而被构建出来的。数据分析的结果看似客观公正,但其实价值选择贯穿了从构建到解读的全过程。