数据资产管理:大数据时代的必修课

2018-03-26 09:32 来源:大数据头号
浏览量: 收藏:0 分享

  党的十九大报告提出要“推动互联网、大数据、人工智能和实体经济深度融合”,中共中央政治局就实施国家大数据战略进行了集体学习,这都进一步突出了大数据作为国家基础性战略资源的重要地位。掌握丰富的高价值数据,对于各国来说都是抢占未来发展主动权的前提和保障。随着人工智能等技术热点牵引着数据规模、数据范畴、数据质量及其价值评估体系的发展,数据资产管理的重要性愈加凸显。数据资产管理旨在提升数据的质量和价值,保障数据的安全及合规性,为大数据内部应用或外部运营打下夯实的基础,是实现智慧城市、数字孪生城市的重要前提和保障。当“数据资产是企业核心资产”的概念深入人心之后,企业对于数据资产管理便有了更清晰的界定,将数据资产管理能力作为企业核心竞争力。数据管理方式的持续发展、战略规划与数据资产运用,正在成为企业工作的重心。数据资产的管理效果也在直接影响企业的财务表现,数据资产竞争力所占比重与日俱增。

  据IDC预计,到2021年时至少50%的全球GDP将会是数字化的,而中国数字经济的比重有望达到55%。可以说,全球已经进入了数字经济时代,而中国更是如此。在这样的时代背景下,数据的产生规模和速度大幅度提升。据预测,全球结构化数据将以每年40%的速度增长,包括结构化数据和非结构化数据在内的所有类型的数据的每年增长速度约为80%。到2020年,机器产生的数据将增加15倍,全球数据量将达到惊人的40ZB,有效的数据资产管理能够促使数据增量略有减慢,但仍处于高速增长态势。在这样的数据增长背景下,数据资产管理的重要性不言而喻。

  一、数据资产管理直面企业痛点

  企业日常经营活动中积累的大量数据,除了支持业务流程运转之外,越来越多地被用于帮助企业提升管理决策效率、实现价值挖掘和业务创新。企业日常经营决策过程的背后,实质是数据的生产、传递和利用的过程,风险控制、产品定价、绩效考核等管理决策过程需要大量高质量数据支撑。提升数据质量、降低成本已经成为行业企业热点关注话题。如果不能对数据进行有效梳理及精细化管理,其价值就得不到很好体现,严重影响数据价值发挥,甚至会给运营管理带来负面作用。此外,日益全面、严格的监管措施和信息披露要求,也对企业数据提出了前所未有的挑战。这些痛点反映了数据资产管理的重要性,主要体现在以下几个方面:

  痛点之一是缺乏统一数据标准。数据登记盘点流程缺乏统一的数据标准,无法有效避免数据混乱冲突、一数多源、多样多类等问题。统一标准是解决数据的关联能力,保障信息交互、数据流通、系统访问功能顺畅的必要前提。

  痛点之二是数据周期规划混乱。对于部分企业来说,其内部数据的采集、传输、存储、应用、开放共享等全生命周期流程的各个环节的规划存在不合理现象。如收集数据时数据源用户处于不知情/非同意状态、违约超范围加工或未做到加工信息隔离、未经内部同意对外提供数据等。

  痛点之三是难以统筹业务管理。数据的增删、修改、使用等权限管理混乱,难以建立全面、准确、完整地反映企业运营状况的单一数据视图。数据需求、数据质量、数据应用等问题的管理和解决分散在不同业务和技术部门,没有一个清晰的协调机制和统一的数据管理渠道,业务不能及时、按需获得数据支持。

  痛点之四是数据处理效率低下。数据采集、预处理等工作的周期较长,方法不够便捷,处理效率低下,无法快速挖掘整理出完善优质的数据属性供分析应用,需要提升开发及治理效率。

  痛点之五是数据质量参差不齐。数据冗余、数据缺值、数据冲突等数据质量问题不能被及时发现和有效解决。需要建立规范的数据治理流程和考核机制等途径加以完善。

  痛点之六是数据垃圾亟待解决。大量的历史留存冷数据无法被有效识别及处理,形成数据“包袱”。这些数据“包袱”很难变成数据“金矿”,又占用存储空间,浪费成本,造成损失。痛点之六是数据垃圾亟待解决。大量的历史留存冷数据无法被有效识别及处理,形成数据“包袱”。这些数据“包袱”很难变成数据“金矿”,又占用存储空间,浪费成本,造成损失。

  痛点之七是安全监管势在必行。缺乏有效的数据安全管理机制,对敏感信息、隐私信息、保密信息的访问缺乏有效控制使其脱敏脱密合规,甚至对企业形成潜在的声誉和法律风险等。建立一个可靠的“数据加密保险箱”势在必行。

  痛点之八是数据价值难以评估。数据评价体系以及数据资产化目前处于初级阶段,数据增值保值以及数据估值衡量问题亟待解决,可以说数据资产变现任重而道远。

  数据作为越来越重要的生产要素,将成为比土地、石油、煤矿、劳动力等更为核心的生产材料,但是,实现数据资源向数据资本的转变还需要面对一系列的问题和挑战,数据资产管理正在成为企业赋能商业创新的具有影响力和战斗力的核心竞争领域。

  二、数据资产管理“管”什么

  目前,数据资产管理已经形成了一套科学的管理架构体系,其体系架构如下图所示,主要包含9个活动职能和2个保障措施,9个活动职能指的是数据标准管理、数据模型管理、元数据管理、主数据管理、数据质量管理、数据生命周期管理、数据安全管理、数据资产价值评估和数据资产运营流通,2个保障措施包括组织架构和制度体系。

blob.png

图 1 数据资产管理体系架构

  管理要点之一:自动智能化的管理活动职能。为了有效满足数字化转型所带来的大量数据治理需求,机器学习、自然语言处理等将成为数据资产管理中主数据管理、元数据管理。数据质量管理、数据标准管理等活动职能中的重要支撑型技术。主数据管理通过对主数据值进行控制,使得企业可以跨系统的使用一致的和共享的主数据。通过元数据管理活动,可以使企业数据信息的描述和分类实现格式统一,为机器处理创造了可能,有助于理解数据的真实含义。数据质量管理可以有效避免数据仓库变成“数据坟墓”。确定或执行数据资产管理标准、规则和政策的数据标准管理将成为打通“数据孤岛”的重要内容。

  管理要点之二:“防丢防爬”的数据安全管理。随着云计算、物联网、区块链等技术的完善成熟,数据安全管理将成为数据资产管理重中之重的活动职能。数据安全管理的价值正在变得更加不可估量,包括灾备计划、加密解密、分类分级、权限管理、监督告警在内的数据保护需求日益提升,追踪“黑暗数据”将成为最重要的安全优先事宜,DRaaS(灾难恢复即服务)将成为最重要的安全管理方案。

  管理要点之三:科学有效的数据资产管理组织架构。越来越多的企业正在成立数据资产管理委员会。数据资产管理委员会的职责包括评估数据资产、数据内部部署和外部运营流通等,组织定义内部数据质量与治理的关键驱动因素,为有效管理数据质量制定框架目标和政策,为实施数据资产管理设计业务与技术相对齐的策略等。通过这些环环相扣、循环往复的过程,可以有效保障企业在数据战场上具有持久的竞争力。

  三、我国数据资产管理的现状

  我国数据资产管理市场发展的主要推动来自政府和大型互联网公司。在国家层面上,正在以政务信息和政府数据管理为切入口,由上至下地推动数据资产管理。在这样的政策环境的影响下,数据资产管理的市场有望于2018年呈现爆发式增长态势。另一方面,大型互联网公司产生的数据无论从总量还是价值上来说,都具有举足轻重的影响。越来越多的大型互联网公司正在呈现数据驱动的状态,通过与各类行业数据交叉融合产生新价值。预计到2020年,90%的大型互联网企业将从原始数据加工处理、衍生指标分析应用、数据流通共享开放、营销推荐数据服务中获得不菲的收入。

  从行业领域角度分析,金融、医疗、政务、电信等领域仍是数据资产管理的领先领域,技术架构和管理方案相对较为成熟。工业制造业、交通、教育、农业紧随其后。

  从应用场景角度分析,风险风控、舆情监控、互联网电子商务、健康医疗、城镇化智慧城市、精准营销广告领域等仍是热点。“大数据”与“智能化”即将全面渗透到几乎每一个行业及业务场景,这意味着数据质量等数据资产管理活动职能日益重要。

  四、数据资产管理的发展趋势

  随着数据资产管理生态系统的不断发展,现有的实践体系也在迅速发展,可以从数据对象、数据采集、处理架构、组织职能、管理手段和应用范围六个方面来预测其发展趋势。

  数据对象纷繁复杂。目前,企业数据管理的主要数据对象仍然是结构化的文本数据。未来,随着网络爬虫、视频处理、语音识别、自然语言处理、图像处理、人脸识别等相关技术逐渐成熟并被产业界进一步深度应用,城市数据、视频数据、语音数据、图形图像数据等将被越来越多的进行管理和应用。预计到2020年,66%的企业将采用高级分类处理方案来采集、保存并处理非结构化的数据,以提高分析效率。

  数据采集途径丰富。随着传感器、5G及NB-IoT的发展,数据采集及传输途径也将得以扩充。由社交媒体和机器人过程自动化(RPA)等转型技术创建的新数据通道将为数据治理和数据质量组织带来机遇和挑战。这些渠道的数据,其规模、数量、速度和变化(SVVV)等特征与主数据管理和数据治理的传统领域的特征显著不同。数据采集的变化和传统数据管理架构产生了“差异”,这样的“差异”要求管理组织采用不同的方法来管理数据质量和标准,以满足相关数字业务流程所要求的灵活性。

  处理架构更新换代。由于越来越多的文件、文本、日志等半结构化、非结构化数据加入形成“数据湖”,数据的处理架构也在发生变化。支持主流大数据分析平台的处理架构以及批处理、流计算等技术正在被应用于数据资产管理。预计到2020年,主流的分析架构都将包含基于目标进行优化的解决方案,其中三分之一的产品会将关系型及非关系型数据的处理结合在一起。数据处理的底层架构将全面采取包括分布式文件系统、MPP数据库、传统数仓、流计算引擎、交互式计算引擎、离线计算引擎在内的“计算&存储混搭架构”,并逐渐由传统的“ETL”数据集成过程向“ELT”转变。以Hadoop、Spark等分布式技术和组件为核心的数据处理架构,能够支持批量和实时的数据加载以及灵活的业务需求,将是持续焦点。

  组织职能升级变迁。当前主流管理制度体系中,数据管理职能由IT部门来负责,业务部门配合IT部门执行数据管理并提出需求。未来,随着数据分析与业务融合越来越深入,业务部门将成为数据应用的主角,在数据资产管理中扮演越来越重要的角色。据Gartner预测,未来50%的全球性组织将聘用首席数据官(CDO,Chief Data Officer),在数据高度监管的银行金融或医疗健康领域,此类人才需求量更大。这些人员将全面负责实施和监督各级严格的数据治理和质量监管政策。

  管理手段自动智能。依靠“手工人力”的电子表格数据治理模式即将被“自动智能”的“专业工具”取代,越来越多的数据管理员、业务分析师和数据领导者采用“平台工具”来获取数据价值。随着机器学习、深度学习技术的成熟,相关专项解决方案和平台工具系统的技术局限性如效率低、差错率高、扩展性差等将被一一攻破,能够有效地解放人力,提高效率和精度。

  应用范围不断扩大。数据的应用范围将由传统的内部应用为主发展为支撑内部和服务外部并重。数据资产的意义价值也从对内强化能力扩展到了对外合作开放上,从而实现数据资产保值到增值的跨越。内部应用一般包括管理优化、研判决策、风险规避、业务拓展、管控成本等。由原来的只应用于领导决策场景扩展到全员业务分析使用。外部运营包括智能推荐、精准营销、分析报告以及风险防控等。

  五、总结与展望

  总的来说,数据成为资产,已经是行业共识,然而现实中,数据资产的管理和应用还处于摸索阶段,仍然面临诸多挑战。如缺乏统一数据标准、数据周期规划混乱、难以统筹业务管理、数据处理效率低下、数据质量参差不齐、数据垃圾亟待解决、安全监管尚不完善、数据价值难以评估等。数据资产管理可以从活动职能及保障措施入手,开展管理工作,人工手工的管理方案逐渐被自动智能的管理策略所取代,鼓励数据生产价值和保护敏感数据安全的双重压力促使数据安全管理不断发展及应用,最重要的管理要点是重视组织管理的作用,将责权利清晰化,逐步建立健全包括管理型人才和技术性人才的适应数据发展的人才结构,减少工作推进阻碍。数据资产管理的完备可以有效支撑“人工智能”、“数据科学”、“数字孪生”等概念的实现。数据资产管理将从“理论”走向“实践”,将影响数据的存量和增量,提升数据的质量和价值,保障数据的安全,为大数据应用及人们未来的便捷生活打下夯实的基础。全面的数据资产管理的重要性将在未来以“实践”来证明。

标签:

责任编辑:zhangxiuqin
在线客服