邓寿鹏:大数据产业与京津冀发展

2016-08-09 15:08 来源:赛迪网
浏览量: 收藏:0 分享

大数据,演讲实录,邓寿鹏

  8月4日,备受瞩目的“2016中国大数据大会暨大数据中国行系列活动——大数据+京津冀峰会”在中国国际展览中心盛大开幕。

  国务院发展中心局长、国家信息化办公室专家委员会副主任、国家软科学研究指导委员会委员邓寿鹏、赛迪网总裁、《互联网经济》杂志总编刘兴波、中央财经大学中国创业与企业发展研究中心主任胡宗良、浪潮集团数据服务事业部总经理徐宏伟、IBM中国开发中心大数据与分析业务拓展总经理顾世山、中国电子信息产业发展研究院、电子信息产业研究所所长安晖及众多大数据专家、学者和行业领军企业代表共同参与了本次活动。

  开幕式上,邓寿鹏做了以“大数据产业与京津冀发展”为主题的精彩演讲。强调京津冀未来会成为区域发展的协同体。明确了京津冀城市群定位四位一体:开放创新型、智慧生态型、宜居宜业型、人才集聚型。未来主导产业是高新科技引领的现代制造业、高端生产支撑的现代服务业等。在“京津冀一体化”进程中,挖掘大数据应用正在成为区域创新创业、产业转型升级的最佳路径。

  以下为演讲实录:

  邓寿鹏:各位领导、各位企业老总,在座的女士们、先生们早上好!我今天根据大会的主题,我准备讲一下大数据产业和京津冀发展,听说在座的来自京津冀的同志很多,我特别就这方面准备了一些材料。

  我们首先看一下,中国经济的新常态,这是我们面临的时代背景,我们今天做任何事情,离不开新常态的一切。“中国经济呈现新常态”,“新常态给中国带来新的发展机遇”,这句话很简单,实际上告诉我们目前我们机遇还是非常多的,问题是你能不能抓住这些机遇。

  本世纪以来,从2000年到2014年,中国的经济发展非常迅猛,在短短的十多年,我们已经成为世界的第二大经济体。在2000年的时候我们首次GDP突破了一万亿,这是一个新的起点。然后2005年我们突破了两万亿,超过意大利,世界上排名第六位;2006年超过英国,我们第四位;2007年超过德国,第三位;2010年超过日本,第二位;2014年我们规模超过十万亿美元,稳居世界第二大经济体。我特别强调是“稳居”,我们看不出来有任何国家可以来代替我们。

  下面我们来看一看全球去年GDP总量排名,美国是17.97亿,中国10.87亿,红色,日本只有4.12,跟我们差得远了。所以第三位和我们第二位相差一半以上,我刚才说在可预见的将来,我们是稳居第二,当然“稳居”我们也没法变成世界第一大经济体,因为和美国还差七万亿。我们这个老二的位置现在还看不出来有人能抢占,十万亿以后,四万亿、三万亿、两万亿,一直到开奥运会只有一点八万亿,是我们1/10。

  我下面出了前十位,特别把平常关系多的韩国是十一位,俄罗斯十三位,我们的台湾地区、香港地区分别是二十二位和三十四位,但是香港地区和台湾地区加起来也不到一万亿。再把澳门地区加上去也不到一万亿,因为澳门地区很小,好多数据不参加收集。这点放心吧,中国稳居老二,现在还看不出来哪个国家在可预见的时间程度里面他们会超过我们,日本四万亿,我们十万亿,他得翻番。

  今天我们要说的是经济正在换档,实际上中国、日本、韩国都有换档期,我们的换档期是2011年一直到去年,我们GDP平均增速7.8,日本、韩国1993年到1997年是7.4,任何一个国家都有增速的换档期。会开车的知道,得根据路况该换档的换档。去年中国人均GDP已经到了8280美元,我们有十个省超过一万美元,按照购买力评价就是PPP,人均大约是1.1万亿国际元。

  这里看得出来,我们在持续增长,今天也在增长,红色的箭头,那个方图是表明我们增长的态势,蓝线我们的增速在下行。从2010年4.6到去年6.9,下行和增长是并行的,这就是今天的现状。中国没有停顿,增长也是很可观的,但是我们换档了,不可能再保持原来的增速。

  所以我们把我们走过的历史经济增速回顾一下,1978-2013年平均增速是9.8%,2011-2015年降到7.8%,今年到2020年这是中央国务院的预期6.5%。

  去年全球的普通出口下降,中国下降2.8%,美国下降了6.8%,日本下降了9.4%,德国11.2%,印度17.5%。现在有一个有趣的现象,2014年的时候,中国出口额占世界市场份额是12.4%。去年,我们的份额上升了,上升按到13.4%,可以预见大家都在降,我们降得少,自然我们在全球的份额就增加了。所以请大家放心,中国的出口能力还有所上升。你看,我们2.8%印度17.5%,这是几个主要的出口国数据如此。

  今天经济是全球化,我们增速下降对全球产生影响,世界影响很快,中国减速1%世界要减速0.5%。具体来讲,新兴市场经济体要减速6.58%,欧元区要减速0.35%,发达经济体要减速0.27%。这可以看到我们减速影响最深重的是新兴市场经济体,我们对发达经济体的影响还是不够大,只占到0.27%。但是中国经济减速全世界要平均减速一倍,我们减一他要减零点五。全球经济一体化,中国在世界经济里举足轻重。

  未来怎么样?国际组织和金融机构对全球的增速有个预测,这张表是我个人把世界银行货币基金组织联合国OECD、欧盟委员会和各国知名银行分别做出的预测值,经过综合整理。全世界今年增速是3.1%,明年增速是3.3%;印度今年的增速是7.5%,明年还会增速7.7%;中国今年是6.5%,明年是6.2%;美国2.3、2.5,欧元区1.7、1.8;日本1.1、0.5。这不是我说的,这是国外说的,这里边没有中国人的数据,都是老外说的,都是权利机构和知名的银行做出的。我看这些机构都有非常优秀的专家,这个数据八九不离十,预测不可能那么准确,而且预测也可以修正,他看见全球的经济变化,数据也可以上下浮动,总之,格局就是这样。这就看得出来,中国6.5、6.2仍然高于那些发达经济体,高于美国、欧元区、日本,但是低于印度。印度这几年经济发展势头很好,我们会想:他会不会超过中国?我的回答是:不可能。

  这是65年中国和印度经济的比较,我80年代第一次访问印度的时候,我和印度的官员学者讨论过。我说我们几乎是同样的时间起点,你们执行所谓的完全资本主义,我们执行社会主义,看两个国家发展的结果怎么样。65年过去了,中国和印度的经济就是这样一个成绩单。我们的建国时间1949年10月1号,印度建国时间1950年1月26号,几乎是同时出生的;我们2014年人口13.68亿印度13.26亿,这点印度追得很快,很快会追上中国了,因为印度无法实现计划生育。中国现在二胎放开也没有那么剧烈,唯一可以预见的是印度的人口总数会超过中国。

  讲GDP总量,去年中国10.39亿,印度只有2.18亿;2000年时中国人均GDP是949,印度只有451,差了一倍;2010年,我们是四千多,他是一千四百多;到了2014年,因为我们有印度2015年的数据,我们都用2014年来统计,中国是7575美元,印度是1631美元,差得远了。中印人均是4.6:1,所以不可能。因为差4.6倍,短期内能赶上吗?所以我坚信中国在这点上,比印度发展得更快。

  印度是资本主义,中国是中国特色社会主义,哪个制度好呢?这个成绩单都看到了。我说我们应该给社会主义点赞!

  讲第二个大数据的产业创新。

  今天互联网数字流动量很大、速度也很快,互联网的数字流动是恒定的、光速的,每秒30万封。讲流动的量来讲,每天产生的数字内容可以刻满1.6亿张光盘,每天发出2940万封电子邮件,这些邮件相当于美国两年的纸制邮件,每天要上传200万社区帖子,相当于《时代》杂志770年的文字量。

  2013年,百度每天面对8.77亿次请求,用户搜索“大数据”一词,可获得1亿条相关信息。

  现在全球每天可以卖出37.8万部手机,已经超过全球每天出生的37.1万婴儿数。这个数据很有趣,今天生产手机比产出的婴儿稍微多一点。

  根据全球产生的数据量在持续增长,2008年到2011年,原来是0.49个吉字节,比特,到2012年已经翻了一番。

  大数据在构建国家综合实力。1024GB=1TB、1024TB=1PB、1024PB=1EB,下面我要解释一下GB、TB、EB。现在观测每天产生的数据量是一个TB,人类全部印刷材料,全部若干年大概200PB,人类说过的所有话包括我刚才废话大约只有5EB,就是这样的量级。要按照大数据来讲,这些是已经实验的数据量并不太多,我们还可以容纳海量数据。一个国家拥有的数据规模、数据的活性、数据解析和运用的能力,是该国综合实力的有机组成部分。我们要讲到活性、解析和运用,否则数据意义不大。

  可以这么说国家对数据的战略和掌控,与对陆地、海洋空间的掌控同等重要,所以大数据是构建一个国家的综合实力的不可缺的。

  说了半天,天天都在讲大数据,大数据的含义与界定。大数据是指数据量超过传统尺度,一般软件工具难以捕获、存储、管理和分析的数据群。

  不同行业、不同企业、不同时期,大数据的规模不尽相同,也无需也无法统一。

  目前,大体上,数据量达到太字节(TB)TB是2的40次方,你把2连成40次绝对算不下去,不要用工具,拿张纸来算,所以太字节今天可以称作大数据。诸位你们现在也没有使用到TB级的,但是数据中心他可能有这么大的存储容量,因此对于你们来说那个存储容量是海量的。

  这里展示的数据存储量纲的演进及含义,我们讲数据的单位是“字节”英文是“Bit”。在计算机上的一个字母是一1B(8比特),KB、MB、GB是我们常用的,然后是TB、PB、EB,下面还有ZB、YB现在待开发,还没有拥有那么高的数据量,或者作为一个单位来讲不可能到泽字节,不可能到尧字节。

  什么叫太字节?美国国会图书馆网络备份大约260TB;什么是拍字节,谷歌每小时处理数据大约1PB,随着技术进步,随着硬件软件不断地丰富,我们能存储的数据加大,而且存储成本在不断降低。为我们的数据库云架构奠定了基础,如果太贵谁也存不起,现在存储数据成本很低。今天一个优盘100元以下可以买到,存储量太大了,而且很便宜。

  归纳起来,大数据有五个基本特征,对应的五个特征,这是我的表述。大数据是海量的,但是是可以细分的;大数据是动态的,但是是可以扩展的;大数据是实时的,但是是可以追溯的;大数据是沉淀下来的,但是是可以挖掘的;大数据是专属的,也是可以共享的。这就是我对大数据一个特征的表述。大数据五个基本特征就是这个。

  光有数据没有用,要进行数据挖掘。数据挖掘是为了揭示规律、预测趋势,数据挖掘就是两个分支:一个是描述性的分析,就是针对过去,揭示规律,所谓的外推,有很多数据推到外面去,也可能预示着未来;另外是预见性推论,这是面向未来的,刚才我们讲金融机构对全球经济的预测,就是预见性推论,他有很多数据,并且他有话语权,他认为未来增长大概是多少,这是我前面讲的一些数据。

  数据挖掘的价值。所谓数据挖掘,是通过特定的数据模型和算法,对大量的数据进行自动分析、揭示数据之间隐藏的关系、模式和趋势,为决策提供新的知识。

  数据挖掘啊可以看作是:“基于数据库的知识发现”,要从数据库里发现出很多知识,来发挥它潜在的价值。

  我们来看看数据、信息、知识的递进与转化。我们举例45.5亿就是一个数,45.5亿是什么?是人?是财富?还是时间?如果我们加上量说45.5亿年,很清楚这是讲时间长度,这个数很大。45.5亿年有了这个信息你还没有知识,如果说45.5亿年前地球诞生了,这是个知识,这个结论是若干科学家辛苦一生做出来的。你不相信你给我提一下地球什么时候诞生,你还得相信这是专业的科学家,他们经过很多考古,经过同位数,经过对天体的一些观察,最后说45.5亿年前地球诞生了,这就是知识。就这一句话就够我们科学家忙一辈子,甚至忙几代人才能做出来的判断。所以你只有数据、只有信息不等于知识。

  大数据的使用对我们各行各业的产出能产生提升的影响。这里有个数据,不同的行业数据使用率每提高10%,人均产出会增长多少。零售业能增长49%,汽车业能增长19%,电信业能增长17%如此等等,总之数据的使用对产出绝对产生一个提升的作用。

  我们是不是简单地来解释一下大数据系统的处理流程。从下往上必须有数据源,这个数据源来自互联网、来自云设施,来自数据中心,我们要把这些数据导入、采集、提取、转换,要加以存储,无论结构化、非结构化的数据都可以处理,可以并行或串行的计算,而且可以交互地进行分析,最后要挖掘,要建立数据仓库、数据解析以及业务智能,最后可以让数据呈现就是数据可视化,你看见这张图就是数据的可视化呈现。它也是很多数据经过计算机,通过计算机0101的转换最后出现了汉字,我们要看见的是汉字的呈现,最后提供给用户。实际上呈现可以有多种形式,可以文字、可以音频、可以图像。用户需要什么,我们就按照你的需要来加以呈现。

  大数据是一个技术群,他的应用领域大概是这样的关系。我们有移动互联网支持手机,有数据仓库,有联机分析,还有数据可视化。这一切都基于大数据,通过数据挖掘可以产生各种智慧或智能的信息,最重要的两个应用:一个是商务智能一个是政务智能,这样大数据技术群以及它的应用在这个图上就一目了然了。

  这是2012-2017年这个区间大数据产业预测就是这个图像,这个是Wikibon它做出的预测。从2012-2017年年均增速是58%增速很快。

  今天我们在座的来自京津冀的同志很多,也利用这个机会给大家交流一些信息和看法,京津冀地区的国土与它的负载与产出。2014年,京津冀地区国土面积不足全国面积的2.25%,土地面积还是蛮小的,只占2.25%。但是创造了6.6万亿GDP,占全国的10.4%,它单位面积GDP产出是全国平均的2.62倍,贡献不少,地方不大,就全国来讲,所以我们的单位面积产值是高出了全国的2.62倍。

  但是高耗能产业的集聚,使京津冀地区每年耗煤4亿吨,占全国1/10。再加上山东省的耗煤,山东不属于京津冀,总共是10亿吨,占全国的1/4。所以你会看见河北包括京津地区还有山东,是变成了雾霾严重的地区。

  今年河北省去产能的任务很重,钢铁炼铁要去1000万吨,炼钢要去800万吨,水泥要去150万吨。这么多产能要去,意味着多少人失业,所以河北肩负着非常沉重的任务,这是为了京津冀发展必须去产能,否则我们的天空、大地就难以生存。

  我们把京津冀基本资源做一个比较,人口来讲北京是2151.6万,天津1516.81万,河北七千多万,因为它国土大,所以存在着七千多万人口,量级也是河北大。讲大数,河北是18、天津1.19,北京1.64讲的万平方米。

  地区的总产值跟土地跟人口有关,河北是最高的,12.9万亿元,天津1.57万亿元,北京2.53万亿元,河北小多了。从结构来讲,北京的一产农业只有0.82,1%都不到,天津1.3,河北12.4,俨然是一个农业比的大国,很多人在土地上劳作,河北的工业是52.1,天津是50,北京只有22.3。北京主要在三产76.9,天津48.1,河北35.5;三甲医院北京54个天津45个,河北27个;211高校北京26所,天津3所,整个河北2所。很不平衡,所以京津冀必须协同发展,怎么让北京、天津把河北带起来?这是中央的判断,一定要搞京津冀的协同发展。

  我们看一看过去几年2013-2015年京津冀GDP增速。北京从2013年的7.7,2014年的7.3,2015年的6.9在减速;天津也在减速,从12.5到10到去年的9.3;河北也在减速,从8.2、6.5很好去年还翻上了一点是6.8,这就说明京津冀协同发展还有中央的一些政策支持,河北的增速还是在慢慢回升。这是好现象,这是中央国务院所期盼的,也是我们河北人民需要的。

  我们再看看中央对河北的支持。所谓的河北对地方的支持是通过中央财政资金对地方进行补贴,通俗地讲叫中央补贴。河北去年中央补贴是2416.96亿,北京459.46亿,天津426.86亿,中央对河北补贴了2400亿,对北京、天津分别补贴不到500亿,所以河北中央能做的都在做,我们自己也要加把劲。

  今年一季度最新的数据,天津增长9.1,北京增长6.7,河北增长6.5,不过6.5是国家预期的目标,还算及格。

  河北,你们来自不同的地方自己对对号。河北唐山人均GDP1.7万,石家庄0.98、保定0.56、沧州0.89、邯郸0.66、廊坊1.09,从增速来看唐山增速不高,唐山在去产能快不起来,但其他都不错,沧州、邯郸、廊坊都在0.65以上最高是廊坊,河北正在奋勇追赶。我们认为京津冀协同发展以后,河北的前景很乐观。

  我个人认为京津冀将来的特征,应该是21世纪的区域发展的协同体。我们京津冀城市群的定位是四个,开放创新型、智慧生态型、宜居宜业型、人才集聚型。主导产业不是一切产业,主导的产业京津冀是高新科技引领的现代制造业、高端生产支撑的现代服务业等。

  结束语:国家发展达到中等收入阶段,必然伴随经济增速换档期,我国面临经济新常态。大数据技术和产业的兴起,为“互联网+”提供了坚实的基础和无限可能性。在“京津冀一体化”进程中,挖掘大数据应用是区域创新创业、产业转型升级的最佳路径。谢谢!

标签:

责任编辑:admin
在线客服