扫盲 | 统计数据≠大数据

2016-06-16 09:06 来源:开运联合
浏览量: 收藏:0 分享

统计数据;大数据;数据库

  百度百科对大数据的定义是这样的:大数据或称巨量资料,指的是所涉及的资料量规模巨大到无法透过目前主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。

  Gartner给出了这样的定义:“大数据”是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

  大数据是一种商业资本,在挖掘利用后为企业创造价值。

  而关于统计数据,百度百科的定义是:统计工作活动过程中所取得的反映国民经济和社会现象的数字资料以及与之相联系的其他资料的总称。

  相比较而言,大数据和统计数据虽有联系,但有着本质的不同。

  1、由于海量的数据,需要更高效的存储和处理技术,复杂的数据库成为了大数据时代的标志。例如开运联合开发的Moa非结构化数据库是国内唯一一款非结构化数据库软件,可以存储几乎任何比较复杂的数据类型。

  2、如果认为大数据就等于数据库,那就大错特错了。数据库只是大数据时代的一个必要条件,大数据还有一个明显的标志是数据挖掘和人工智能的紧密结合。

  3、统计数据是基于已有数据的归类,而大数据是基于对已有海量数据的处理,并且做出预测和推荐。统计数据的任务已经完结,而大数据的预测有多种可能,使命才刚开始。

  一个经典的案例是沃尔玛曾经做过的“啤酒”和“尿布”调研:沃尔玛在研究中发现,一类顾客经常在购买尿布的同时也购 买啤酒。尿布跟啤酒自然是毫无关联的两个品类的商品,根本想不到二者的联系。后来发现,这是一类社会现象所导致的。美国有很多年轻夫妇,尿布用完后,女主人在家带孩子,而男主人就去超市买尿布。买完尿布之后,男主人通常会顺带买些啤酒。

  基于人工智能下的大数据,就是可以使人们“变懒”的一个手段。基于你的历史行为,判断出你可能的喜好,乃至需求,将最佳结果,推荐给你。这就是大数据。

  目前市场上有许多宣称大数据的公司,其业务核心却是旧的统计数据的一套,或是无数据的提取,或是无挖掘利用,更不可能有预测。读完此文,不应再受欺骗。

标签:

责任编辑:admin
在线客服