“大数据”是文艺“智慧”之源

2016-03-22 10:03 来源:南京文艺生活
浏览量: 收藏:0 分享

  近年来在与地方文联的文艺工作者做信息化建设交流中,发现全国文联系统在《中国文联关于进一步加强信息化建设工作的意见》推出后,信息化建设热情高涨。随着“互联网+”的理念普及和源于互联网的大数据上升为国家战略,敏锐的文联人也很快嗅到了发展机遇,意识到“互联网+”时代下文艺资源信息化建设离不开大数据。不过,尽管不少人对信息化建设、大数据战略多多少少有一些接触和认知,但真正落实到文联和文艺工作中时,却也在不断产生各种困惑和问题。这里,笔者结合自身工作实践谈点个人认识。

  说到大数据,中国工程院院士、中国互联网协会理事长邬贺铨认为,大数据是伴随互联网出现而出现,数据来源于物理世界、互联网和社会,而这些物理数据、互联网数据、社会数据又都是和人相关的数据。当下,大数据的应用极为广泛,互联网企业利用互联网用户数据聚集人气获得广告,利用大数据分析人的倾向、人的追求,精准定位广告对象;公安部门利用大数据改进治安与交通管理;电信、银行等行业领域可以利用大数据优化管理流程和服务等。国务院印发的《促进大数据发展行动纲要》强调加快政府数据开放共享,推进产业数据资源应用,更是点出了关键。因为只有能开放利用、可创新利用的广泛数据才是“大数据” ,如果数据没有创新利用、不能释放数据红利、打造不出数据优势,放在一边也只是没有多大价值的“库存”数据。那么,我们文艺信息、文艺资源与大数据的交集到底在哪?

  从基本定义出发,“大数据”指无法在可承受的时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能发挥更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。大数据有4个特点,分别是Volume、 Variety、 Velocity、 Value,简称4V(也有的地方加上Veracity称5V特征) 。Volume,即为体量巨大; Variety,说的是丰富多样; Velocity,则指快速高效; Value,有官方解读为价值密度低,但最终能称之为大数据,必然还得说数据聚合挖掘应用所产生的巨大价值效应,因此这里这一特征可直接理解为有价值的、有用的。中国文联现在建立文艺资源中心,构建文艺资源库和资源应用平台,其实是与大数据密不可分的。大数据的基础和核心毋容置疑是可处理和创新应用的海量信息资产,这恰好对应到文艺信息化建设、文艺资源应用的对象——行业数据和领域资源。

  首先是大数据的“量”大,怎么来?那就需要广大用户,包括文联、协会、高校、院团等文艺机构、组织,艺术家、文艺工作者、文艺爱好者,文化市场主体、文化产业生产者、消费者等来产生数据、共建共享数据,形成规模效应之后才会有真正让数据发挥效力的基础。目前中国文联文艺资源中心构建的资源库系统、资源库采集与应用平台很大程度上就是先解决数据或资源的存储和入口问题。在建设过程中始终强调共建共享,这是因为文联系统若分散独立建设数据库、资源库,势必会产生局域性和局限性,使得信息孤立形成信息孤岛,无法真正发挥文艺资源和行业数据的最大威力;而且还很容易造成更新不及时,诸多跨界艺术信息的信息内容不一致、不对等现象。中国文联文艺资源中心近年来全力建设中华文艺资源数据库,构建数据交换共享平台,主要目的就是力求解决数据来源、数据保存、数据体量问题。

  其次说到数据的丰富性、多样性,这点文联系统是有得天独厚的优势的。从业务角度来看,中国文联文艺资源中心的数据有人才数据、作品数据、活动数据、奖项数据、新闻数据、典籍和刊物数据等;从艺术门类来看,涵盖了戏剧、电影、音乐、美术、曲艺等等几乎所有传统艺术门类;从资源类型来看,有数据库中存储的结构化数据,有新闻、网页的半结构化数据,有文本、图片、音频、视频等非结构化数据。

  至于数据的高速、高效,笔者认为主要是讲对海量数据、天量数据的处理能力。这里面主要包含对大量数据的存储能力和计算能力两方面。存储能力即能在容量方面满足不断有数据进入所需的空间资源,另外就是有对不同类型的资源和数据进行分层存储或分布式存储以保证最高效的数据存取。对计算能力的要求也很明显,面对大量的数据必须有在尽量少的时间段内将数据处理完成的能力。这一点当然就依赖于符合现实业务的计算架构和高效算法来实现。目前,业内提云计算、提Hadoop等都主要指数据处理方式和能力。中国文联文艺资源中心已经构建起文艺云平台,可以很方便地分配计算资源,这为后续大数据处理打下了良好的基础,后续再构建起符合业务实际的完善的高性能计算集群和大数据处理平台,或结合市面上成熟的计算架构、计算处理平台都能很好地解决数据的高效性问题。

  最后说大数据的价值特性。现在国家大力发展实施大数据战略,当然是追求通过实施此战略释放数据红利充分发挥出它的价值,宏观层面来讲就是靠大数据提升创新创业活力,改造升级传统产业,以此来推动经济社会发展。笔者所理解大数据中的Value也恰与此相一致,就是数据得有用、数据得可用,而且确信数据确实能产生巨大价值。回归到文艺行业的信息化建设上,我们有了前面3个方面的积累后,从文艺领域本身的数据特点,我们就可以绘制出用户(文艺)画像;从人的方面,我们通过分析数据,知道用户行为,知道用户喜好、用户习惯,关注重点;从作品方面,我们可以知道什么才是群众喜闻乐见的作品、大众支持的作品、大众爱消费的作品;从活动、奖节方面,我们也能知道什么样的活动更受关注更被喜爱,什么样的奖节更受大众认可;从文艺行业生态来说,我们最终也能知道某一个时代或当下的艺术潮流、创作方向,可以剖析出哪个地区创作能力强、哪个领域更利于创作出优秀的、更容易受到广泛关注的作品。

  总之,通过大数据,可以为我们提供很多预测、判断和参考,使我们对文艺创作、文艺市场、文艺产业、文艺趋势等各方面的把握更准确更深刻。想让文艺更“智慧” ,那就努力来紧紧抓住“大数据”吧。


标签:

责任编辑:admin
在线客服