互联网思维与基金投资的融合,引发了2015年以来大数据投资产品的火热行情。
想必很多投资者都会疑惑,大数据是什么?大数据如何运用于股票投资?
除了数据,大数据更是信息资产
“大数据”不仅仅是数据集合,更是一种信息资产。具备大量、高速、多样、价值、真实五大特征。
大数据是一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。
——麦肯锡全球研究所
大数据的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。
网络上存在大量对投资有指导意义的大数据
搜索数据
如百度、360等,从关键词或访问量中提取热门股票的信息
财经数据
如新浪财经、同花顺、东方财富网等,从访问量中提取个人关注度或板块关注度的信息
行业数据
如淘宝、京东等电商网站中的消费数据,可以提取出大消费行业的景气度数据
社交数据
如腾讯、雪球等社区中的社交数据,可以提取一些大散、牛散的观点,或者是大众的预期变化等信息
从目前来看,我们能够从这些信息源中提取出来的,大多是跟投资者情绪或投资者行为相关的选股因子,主要从行为金融学的角度去解释这些选股因子的有效性。
目前学术界中有大量关于大数据与金融市场之间联系的研究成果,很多成果也已经被应用在实际的投资中。
大数据产品本质上是因子更丰富的量化产品
大数据产品本质上其实是量化产品。这是因为大数据的海量数据量级非常大,不可能通过人工或手工来处理,必须要借助计算机程序来运算。
1、依托量化模型
大数据产品与普通量化产品都依托特定的模型进行投资,减少主动决策的环节。一般来说,大数据产品大都依托多因子选股模型。如果把投资比喻成做菜的话,选股因子就是我们需要的原材料,大数据因子只是作为其中的一个“原料”存在。
2、定期调仓
大数据产和普通量化产品都采取定期调仓。一般是月度调仓,有些会是周度调仓,每次调仓都有可能换掉60%-70%的成分股,因此换手率是较高的。
3、等权重编制
大数据产品和普通量化产品一样,经常采用等权重编制,容易在风格上偏向小盘股,表现出来的特征就是弹性大,波动性也大。
4、数据源异质性较高
大数据产品与普通量化产品最大的不同点在于数据源。
普通量化基金用的数据,通常就是基本面的财务数据、公司估值数据、股票价量数据、分析师一致预期和评级等。
而大数据基金通常会使用一些比较另类的数据源。有可能是比较难获取的数据源,有可能是比较难处理的数据源,然后再从中挖掘信息,这些信息跟上面提到的那些信息之间的异质性比较高,或者说相关性会更低,更有利于丰富我们的“原料”。
从海外经验来看,互联网大数据可以很好地捕捉市场热点及投资者情绪。例如,2011年美国印第安纳大学研究发现:每周的GOOGLE金融搜索数据能够预测股票市场变化,Twitter投资者情绪指标甚至能够预测未来一到两天的股市收益率。
大数据产品如何选择?看准优质数据+量化能力
哪里有好数据——新浪大数据!
作为全球华人第一财经门户网站,拥有1000万以上的活跃用户,覆盖七分之一华人投资者,日均3万条以上财经资讯,40万条新闻评论,100万条财经博文,每天超过100万优质媒体及意见领袖贡献内容。
除此之外,新浪微博注册用户超过5亿人,用户每日平均在线时长超过90分钟,超过5万应用和网站可以使用微博帐号直接登录,所有这些用户每时每刻都在产生海量的行为数据。
从数据维度上,新浪按照数据源将数据主要划分为六个维度:新闻、行情、用户、微博、搜索、股吧。新浪财经不断积累新闻、行情、用户属性、用户行为等海量数据,为大数据产品提供源源不断的“原料”。
哪家量化强——广发证券!
广发证券对大数据产品开发高度重视。
由广发证券战略发展部牵头,集合公司近年来引进的华尔街量化投资博士团队,联合新浪数据中心和中科院大学的专家教授,进行了针对大数据策略的深入研究与开发工作。
然后由广发资产管理资深量化产品投资经理亲自带队,与广发资管量化团队共同打造基于大数据的量化产品。