我本身是做技术出身的,做投资之前,在百度和阿里巴巴做了12年的技术,在百度做网页搜索,在阿里巴巴做商品数据的收集和处理,都是和大数据息息相关的。因此我对数据的获取、加工、处理以及最后的应用,有一些切身体会。
九合创投投资经理谢振亮
大数据产业链的三部分
大数据的产业链分成三个部分,第一部分是数据源,第二部分是数据的加工和处理,第三部分是数据的应用,我会从这三个角度分享下每个部分的一些创业机会和我的看法。
1、数据源
数据源是大数据的生产要素,是很重要的环节,不管来源是自己的还是抓取的,首先需要根据自己的应用场景来收集数据,传统的搜索引擎,第一步就是抓取的工作。因此现在有很多基于数据源的创业公司,同时也有像聚合数据、数据堂这样做基础的数据交易的。我认为基础数据的交易只是第一个环节或者说是产业链中最基础的环节,且数据跟商品不一样,数据SKU比商品少很多很多,整个数据交易市场没有电商那么大。另外数据本身并不是大数据的核心,大数据的核心还是基于数据的洞察。
2、数据的加工和处理
数据加工处理我分为两部分来分析,第一部分是算法和模型,第二个是基础框架。
(1)算法和模型,我认为是大数据的核心,有了原材料后怎么加工和处理,怎么跟具体的应用场景来结合,最后怎么能达成数据效用。比如前一段时间很火的AlphaGo,它是如何通过棋谱的大数据来学习出自己下棋的模型的,这里有最核心的算法。如何根据历史数据预测未来走向、如何基于数据发现价值,都是算法的事。
(2)基础框架部分,主要是分布式计算和分布式存储。目前开源框架比较多,不管是大厂还是创业公司,从技术层面上看,没有更多核心的东西。无非是谁做的早,谁在资源上投入的多,在时间上有一定的先发优势。
3、数据的应用
数据应用是数据价值的体现,基本上可以用数据+行业的概念来套,像大数据+医疗,大数据+天气,大数据+金融,大数据+保险。
更看好数据源和数据应用环节
从三个环节来看,我个人比较看好第一和第三个环节,即数据源和数据应用。
1、数据源方面
不可替代性强的、高质量的数据源,对于基于这个数据源的大数据应用来说是必不可少的独一份的,所以这个价值是有不可替代性的。因此我们也看到很多团队在做这些事情,包括企业数据、医疗数据、IP数据和天气数据的一些加工处理,我觉得都是非常好的方向,这个角度也有很多很多切入点。随着长时间数据量的不断积累和数据质量的不断改进,后面做的人是很难赶得上的。
从数据应用角度往回推,我们会发现有很多数据源整理方面的创业的机会,但是一定要找到不可替代性比较强的一些数据。因为不可替代性越强,数据价值就越高,比如个人消费数据,医疗数据等等。
2、数据应用方面
在数据应用方向,目前大数据应用还处于起步阶段,大数据在各个行业的应用还处于摸索当中,这里面其实机会有很多。比如最普通的天气数据,其实跟很多行业是可以结合的,比如保险、农业、出行、快递,都可以结合起来。
但是这块对行业理解要求比较高,光光只是数据处理的人才是不够的,需要有专门的对行业有深刻理解的人,才知道这个行业需要哪些数据,以及哪些数据对这个行业这个产品是有意义的。可以研究一下palantir和everstring这两个大数据标杆企业。
所以我个人比较看好数据源和数据应用两个方向。
以下为现场部分Q&A内容
1、您可以介绍下咱们在大数据这块的投资案例么,以及看好这家公司的逻辑?
我投了所问数据,做销售预测的,核心技术在预测算法,两个海归博士做的。对电商及传统企业来说,库存是个很大的成本负担,因此通过历史数据及国家经济数据预测未来的销量,对改进库存效率是非常有价值的。国外有个forcasepro 也是做这事的。另外我们还投了一家叫摩比万思的公司,做精准营销的。
2、九合创投下一步准备在大数据领域布局哪方面的公司?
① 数据源这块,有价值的数据整理
② 大数据+各个行业的应用
我个人对 webbi 和数据可视化这块并不看好,因为本身只是工具类的价值。
3、您认为数据源整理这块目前发展到什么阶段了?另外您觉得数据交易的创业机会还多吗?
各个方向都处于起步阶段,基本都在A轮及以前。做交易没什么门槛,我不看好,可能是笔生意,但天花板不高。
4、大公司掌握了高品质流量的入口,加上长时间经营可谓实力雄厚。我觉得可能创业团队在优质数据源获取上很难,需要投入甚至耗费大量的精力,需要一个长时间的坚持,没有一个好的市场切入点生存很难,您认为呢?
我觉得没有想象的那么难,需要那么长时间。现在很多公司基于工商注册信息的加工都能做到盈利。
5、您好,我有3个小问题:① 阿里现在的很多业务战略似乎都和数据有关,您觉得阿里未来在数据上会成为一家怎样的公司?② SaaS应用未来更有价值的发展方向是数据吗?③ 如果数据现在还处在初级阶段,真正爆发可能在几年后?
① 阿里自己的目标是做大数据公司,但是阿里本身能收集的数据也是有限的。只是他掌握了最核心的,最有价值的用户消费数据,应用场景很多,应用价值也很大,比如征信。
② 要看哪一类SaaS,本身SaaS有汇聚数据的优势。
③ 我的预测是3年。
6、如何有效找到市场里的数据痛点呢?比如目前大家急需什么样的数据呢?
这个不能算痛点,就像iphone出来前,你说不出需要iphone。更多的是你如何从数据中洞察价值,而这个价值往往是未被认知的。这其实是大数据行业的关键点,所以需要很多数据科学家的角色。
7、您好,对一些创业公司来讲并不像BAT拥有大量第一方数据,做大数据应用靠谱么?比如大数据广告平台?
靠不靠谱取决于你能获得什么数据,以及是否有能力基于这些数据做出优质的产品。
8、围绕线下实体零售的大数据应用,您怎么看?
零售+大数据也是很有前途的。比如销售预测,人流预测。
9、现在很多公司,基于工商注册信息,加工都能做到盈利。这类公司很多吗?如果要问技术上是否有核心的东西,这类算是有核心东西吗?
企查查,启信宝、天眼等等。核心是数据获取能力,数据清理及挖掘的能力。
10、(接上一问题)这些能力技术难度大吗?这个算时间领先还是技术领先?
应该说还好,抓取方面开源框架很多。简单结构化整理,算法要求不高。
11、您觉得数据科学家这个人群可能会来自哪些渠道?从高校毕业进入职场的新人,传统CIO等技术人转型,业务人员转型?这个人群未来会很庞大吗?
我觉得原来的Bi部门是很接近的,还有数据分析师,现在需求量很大。