姚期智:下一代数据网让人工智能应用效率倍增

2018-06-27 14:11 来源:中新网
浏览量: 收藏:0 分享

  2018年6月21号,南京图灵人工智能研究院内,一场主题为“下一代数据网加速器平台成立大会”的发布会低调举行,会上提出“软件定义数据,数据驱动网络”的大数据基础设施建设主张,让与会的风投机构和企业家们看到互联网时代的突破和智能时代的基础。

  就在前一天的6月20号,由南京图灵人工智能研究院主办的首届交叉智能前沿峰会在南京紫金山庄重磅举行,包含图灵奖唯一的华人获得者姚期智院士在内的三位图灵奖和两位院士在内的人工智能大咖带来的人工智能论坛和演讲,让南京成为了人工智能的明星城市。

  在峰会上,姚期智院士发布了十二个图灵人工智能研究院在孵项目,“下一代数据网加速器”项目作为其中之一。姚期智院士说:“研究院与企业共建了下一代数据网加速器,构建数据驱动的网络核心技术和基础设施。”

blob.png

  下一代数据网由清华大数据基础设施研究中心在2017年8月份的大数据基础设施认知RONG论坛上首次正式提出;2018年4月,在图灵人工智能研究院首批项目中成为签约项目。

  那么,什么是下一代数据网呢?它所提倡的大数据基础设施的影响在哪里?清华大学数据科学研究院大数据基础设施研究中心媒体中心Teada,对下一代数据网加速器CEO曾光,清华大学数据科学研究院大数据基础设施研究中心副主任赵强,清华大学交叉信息研究院助理院长、南京图灵人工智能研究院常务副院长徐葳进行了深度专访。以下是采访实录第一篇。

  Teada:什么是下一代数据网?这个名称有什么特殊的来历吗?

  赵强:下一代数据网是数据驱动的IT基础设施,包括软件定义数据(SDD),数据驱动网络(DDN)两部分含义。

  所谓软件定义数据(SDD)是针对目前典型的应用场景,安全,医疗,金融,物联网,游戏等等,在其语义域内抽象其数据特征并范畴化,使得该语义域内的数据范畴能够在应用层、计算层、存储层、网络层和网络安全定义中具有一致性和通用性,从而可以灵活调度、提高资源效率。

  所谓数据驱动网络(DDN)是打通IT工程师和电信工程师的知识壁垒,让应用能直接驱动数据传输方式,保证传输质量,降低资源成本,提高应用体验。

  通俗地说,以大数据视角看问题,对通信网络、公有云、数据中心等IT基础设施进行优化和改造,以便快速、方便地解决数据确权、数据QoS、安全控制等问题,实现更高效率的数据处理、数据存储和数据传输功能。

  Teada:为什么会提出下一代数据网这个概念?这个概念或者说技术的发展历程是怎样的?

  徐葳:我是研究网络的,在研究网络和面对大数据产业的发展时,我发现传统网络架构无法适应大数据传输的需求,因为大数据的出现意味着对网络的两个新需求:一是传输大量低价值密度的数据,这导致的是成本增加,而为了节省成本可以牺牲实时性,也就是会延迟。二是不同的应用产生了不同的负载,比如在物联网领域存在大量小包的负载。所以,下一代网络技术面临的挑战就是数据带来的挑战,下一代数据网是支持数据的网络,因为数据无处不在,技术必须支持数据驱动的视角。还要满足安全性和低成本。

  曾光:数据驱动是随着大数据产业的兴起,IT产业逐步发展形成的一种趋势和视角。对于信息系统,我们往往会从效率、成本、安全、合规等角度考虑其是否合理和高效。伴随着大数据在全球范围内的兴起,尤其是公共管理的数字化、人工智能技术突破,数据迅速地发展成为一种公共资源。数据驱动的需求应运而生。缺乏数据视角,忽视大数据基础设施,意味着每一家人工智能或大数据企业都需要从数据清洗、数据分类、数据标注等基础工作做起,业界就“数据”概念难以达成共识和标准,创新难以广泛应用。

  更为严重的是,随着数据安全、数据权利的深入人心,在社会规则、法律体系中的任何变革,都会导致当下的人工智能和数据应用花费巨大的成本进行合规性处理。欧洲的GDPR法案颁布,数据权利作为基本权利,正式写入法律,起到了保护消费者的数据资产和个人隐私的示范作用。建立数据视角的服务与机制,利用大数据基础设施,及时调整适应法律和社会环境,是企业未来持续生存能力的大问题。

  赵强:下一代数据网技术与其他大数据的技术相类似,并不是独立的、单一的技术突破点,而是一组先进的技术在数据驱动视角下的应用与组合。与数据网类似的,思科提出的基于意图的网络(IBN),也是将策略应用于网络的方式。IBN的理念是基于意图的网络,试图对于意图的理解穿插到网络的生命周期中,智能软件(如SDN控制器)将决定如何把意图转化为针对特定基础设施的配置手段,从而使网络以期望的方式行事。

  研究下一代数据网技术,促进IT基础设施提供商形成了数据视角,将云网技术、软件定义网络等技术应用起来形成解决方案,可以找到更多的创新领域,助力传统企业转型,帮大数据和人工智能的应用实现效率倍增。

  Teada:那下一代数据网在业内的发展在什么阶段,国外相关的技术的发展如何?

  赵强:软件定义网络是网络领域的前沿技术。采用定制化通信底层协议以后,原本开销极高的数据流能够提高十倍百倍的传输速率。类似的技术北美已经形成了运营服务能力,下一代数据网也将融合该技术路线,解决中国各地区智慧城市的数据中心之间数据的高速传输问题,让“数据在广域网(WAN)传输起来如同局域网(LAN)”一样迅捷、快速、安全与经济。

  Teada:现在最火的是人工智能,那么在大数据、人工智能时代,下一代数据网扮演一个什么样的角色?

  曾光:下一代数据网是IT基础设施,给创新产业赋能,帮助传统企业转型,是光纤打造的大数据和人工智能产业的基座。

  就像房地产开发先要有水、电、气的一样,人工智能也需要数据基础设施。随着下一代数据网建设和应用的展开,数据资源更容易获得,成本更经济,并且在下一代数据网周围聚集了大量成熟的数据应用和服务。在下一代数据网的助力下,人工智能所描绘的美好前景将加速到来。

  Teada:既然成立加速器,自然会很重视落地,那下一代数据网技术目前有落地应用的场景了吗?

  曾光:我们讲一个医疗影像的场景。图灵人工智能研究院透彻医疗影像研发中心,用机器学习的方式为医院提供人工智能读病理X光片的服务。使用机器学习的办法,三分钟可以在一个病例X片上找到可疑的病灶点,并自动给出检验科的结论。

  产业化的过程中发现,数据中心建设在远离医院的另外一个城市,使用互联网传输数据成本高昂无法接受。如果每家医院都采用光纤直联,基础设施投资和时间周期无法接受。

  采用下一代数据网的技术,由NDN负责基础设施建设,同时采用SDN技术给透彻医疗提供一张覆盖全国的虚拟医疗数据专网。透彻医疗自己可以定制自己的服务,包括QoS、带宽大小,而且闲时可以释放带宽节约费用。NDN汇集多家医疗公司的服务需求,在网络层实现安全隔离,针对不同的场景实现不同的网络特点。因为资源共享,经济性也可以得到保证。

  除了医疗大数据场景,还有很多由于数据的爆发性增长、安全问题、质量问题产生的痛点需求。下一代数据网在金融、安全、零售、交通等领域正在建立成功案例。

  Teada:未来下一代数据网技术成熟,有哪些可能大放光彩的领域,或是颠覆性的构想?

  曾光:从使用方式上,大数据基础设施支持企业的数据消费就像自来水一样,随需而动,弹性计费。除了建立数据“管道”以外,我们还希望聚合大量的大数据应用和配套产业资源。

  从行业来看,医疗数据网是我们的重点领域,很快会有成功案例发布。我们已经和数据院一起部署连接多家医院的医疗数据网,未来可以提供医疗科研数据服务、手术视频服务等。

  Teada:刚才说到的让我们很期待,下一代数据网面临怎样的问题?怎么去解决?

  赵强:像任何一项创新技术一样,下一代数据网目前最大的挑战是形成共识。尽管业界已经有很多有益的尝试,数据视角尚未形成。

  在人类社会交流的全领域,不存在统一的语言意义,因此人们采用知识图谱来解决小范围内的语义问题,以便行成区域的共识。这就像是各个地区都有自己的“方言”。

  数据是机器沟通的语言,与人类社会相类似的,网络中也不存在完全统一的相同的“数据”概念。科学家说的“数据”和测试工人说的“数据”含义完全不同。特别是在信息产业的几十年的发展,通信工程师、应用工程师各自不同专业对于数据的含义理解已经形成了固化的规则,有自己的“数据”知识体系。

  下一代数据网将致力于打破知识壁垒,把信息领域划分出不同的子领域,以保证在单一子领域中,“数据”保持相同的含义。同时依托数据网和软件定义网络技术,在基础设施层形成有效的机器对话机制。

  另一方面,新技术仍然面对组织、资金、团队等产业化方面的挑战。组建下一代数据网加速器也是为了更加有效地动员全社会资源,推进共识的达成。清华数据院、图灵研究院和龙腾佳讯公司协同产、学、研、政的各方资源,合力将创新技术在医疗数据网、安全运营和金融监管等领域建立运营模式。加速器将逐步整合资源,为整个产业赋能,让更多的同仁们看到实践产生的巨大效果,从而加入到这个事业中。

  Teada:下一代数据网目前有哪些竞争对手?它的优势在哪里?

  曾光:电信网络也在升级,现在业界提出了下一代互联网,可以说这是沿用了传统的通信视角,希望继续采用一统天下的方式解决所有问题。5G网络是电信运营商推出的新技术群,以无线技术为依托,5G也沿用了多场景混合数据的模式。

  下一代数据网是以数据资源、数据服务、数据安全为核心诉求展开的产业集群,是大数据与人工智能生态的一部分。我们相信,与竞争技术和产业圈的交流,会碰撞出火花,星星之火最终会燎原。

标签:

责任编辑:bozhihua
在线客服