政府数据开放的潜在风险与对策研究——以上海市为例

2017-09-14 13:42 来源:电子政务杂志
浏览量: 收藏:0 分享

  摘 要:政府数据开放工作已经得到各级政府的普遍关注,不少政府尝试通过法规政策、数据大赛等多种手段促进政府数据开放工作的进程。然而,由于政府数据开放中的潜在风险,政府部门及其工作人员在数据开放中存在担忧,导致当前各级政府的数据开放工作进展缓慢。以上海市为例,通过对部分委办局展开深度调研,分析政府数据开放中的潜在风险并提出对策,以期为中国政府的数据开放工作提供一定的借鉴。

  关键词:政府数据;数据开放;数据再利用

  DOI:10.16582/j.cnki.dzzw.2017.09.003

  一、引言

  政府数据开放是提升政府透明度、提高行政管理与社会治理能力、增进民众福祉、促进社会创新的重要途径。当前,国内外政府都开始了政府数据开放的探索,并已经取得了一定的成果。在2017年5月的贵阳数博会上,由复旦大学和提升政府治理能力大数据应用技术国家工程实验室联合发布的《2017中国地方政府开放数据指数报告》显示,尽管部分地方政府已经陆续上线了一批政府数据开放的平台,但中国政府数据开放工作才刚刚起步,开放数据生态体系尚处于萌芽阶段。

  受既有法规政策、管理体制机制、技术等多方面因素的限制,政府数据开放工作困难重重。一方面,从国家法律法规层面来说,当前缺乏对数据开放及隐私保护的专门法规政策,导致数据开放无明确的标准依据可以参照;另一方面,从管理体制机制上来说,在政府数据开放中由于数据资源并未做统一管理,部门之间职权交叉、权责不明确,导致当前管理机构缺乏、积极性不高、执行力度不够等问题,制约了开放数据的进程;同时,在数据层面,数据开放将数据汇聚集中,容易导致数据泄漏或关联使用,进而带来风险。本文旨在通过对上海市各委办局的实证调研,分析当前政府数据开放中的潜在风险,探寻掣肘政府数据开放进程缓慢的内在原因,并为上海市乃至全国的政府数据开放工作提出意见与建议。

  二、文献综述:政府数据开放潜在风险梳理

  安全是大数据的生命线,只有更好的保护,才能更好地开放[1]。在政府数据开放中,国家秘密、商业秘密和个人隐私泄露,数据质量差、关联数据融合都可能带来巨大风险。当前,政府数据开放的风险已经得到学界的关注,从总体上来看,政府数据开放中风险的产生主要来自于法律层、管理层、数据层方面的问题。

  (一)法规政策层面

  从总体上来看,当前关于数据开放、隐私保护、数据保密、数据交易与再利用方面的法律欠缺,导致政府数据开放、数据流通、数据利用与安全隐私保护无相应制度保障。

  首先,当前政府数据开放缺乏专门的政策法规,技术标准的建设较为滞后,而政府大数据的开发利用涉及到的数据采集、处理、保存、挖掘和分析利用等各个环节均需要相应的法规制度和技术标准作为依据。在已有的政策法规中,除《政府信息公开条例》及其实施细则之外,尚未出台针对政府数据开放和开发利用的政策法规,这在一定程度上制约了政府数据的开放和开发利用步伐。[2]然而,由于数据开放与信息公开的差异性,《政府信息公开条例》及其实施细则仅可以对政府数据开放起到指导性作用而无法律的约束效力。[3]

  其次,在隐私保护方面,中国还没有专门的法律来界定用户隐私,处理隐私问题一般采用其他相关法规条例来解释。[4]而《政府信息公开条例》中现有关于个人隐私和商业秘密例外的规定过于笼统,造成实践中的适用困难,结果使得信息公开倾向于保密,这阻碍了政府信息的最大化公开[5],也阻碍了政府数据开放的进程。

  第三,关于数据交易和再利用方面,潘永花指出,由于数据产权的归属,数据的拥有权与使用权的关系依然不够明确,使得数据资产评估成为难题,从而使得数据在二次利用和售卖方面出现问题。[6]同时,在数据使用中,对已经公开的政府信息,也可能由于缺乏描述性的元数据、缺乏专家参考框架以及缺乏具体分析技能而造成错误解读。[7]

  (二)管理层面

  在管理层面,由于当前政府部门的风险防范意识缺乏、风险管理的体制机制缺乏、技术人员欠缺、部门之间职能交叉等,可能导致数据产权归属纠纷或不同部门开放的数据被关联分析后触发数据风险问题。

  第一,政府部门开放数据的管理意识不高。周军杰指出,由于小部门主义思维的存在,政府部门习惯于将数据限制在本部门之内,认为数据开放工作会影响本部门利益,从而导致一些部门或人员的消极对待,降低数据开放工作的优先度;同时,政府数据开放工作一般无法带来直接的商业效益,一些人员可能认为数据开放工作是出力不讨好的额外工作,从而被动应付。[8]长期以来,由于缺少必要的法规,政府公务员对保守政府工作秘密高度重视,但对私密保护严重忽视,隐私权保护、企业商密的保护难度更大。[9]

  第二,在组织机构建设中,我国数据开放受到既有体制的限制而导致组织机构混杂,尚未形成统一的组织管理架构和运转体系。在科层制治理体系下,分部门专业化治理是我国行政管理的一贯做法和常态,由于缺乏一套行之有效的跨部门治理新体制,使得现有的各种数据分布在不同部门内部,总体上呈现数据割据、信息孤岛的状态,给数据开放带来诸多体制上的限制和阻碍。[10]这种“九龙治水”的政府信息资源组织管理架构导致数据管理工作政出多门、职能交叉,关于数据开放与利用的具体制度规则缺失。[11]

  第三,数据开放流程缺乏规范。Kshetri分析了在数据的收集、存储、分享以及获取过程中可能会出现的安全和隐私问题,并指出随着数据集的规模、多样性以及复杂性的增加,安全风险系数也随之增加。[12]政府数据开放工作是一个复杂的过程,从前期的数据标准、数据集成到数据处理等,任何一个环节出错都有可能导致数据质量问题。如果政府的数据开放平台中出现了不可靠的数据,不仅会降低政府的公信力,还有可能对公民和企业的利益造成损害[13],从而带来潜在的风险。

  第四,数据开放后的风险追责困难,造成责任盲点。当前学界在此问题上也存在争论,一种观点认为,政府需要对他人使用其数据所造成的损害承担责任,确保对公众的保护;[14]另一种观点认为,政府应该免责,因为数据开放在我,但如何应用在你,应用出错责任不在我。[15]在政府数据开放中,对政府部门开放了“不该”“不宜”的数据应该如何问责,涉及到对政府数据开放的权利义务关系的梳理和规整[16],从而从根本上厘清政府数据开放中的责任追究。

  (三)技术与数据层

  在技术与数据层,由于技术的局限性与数据本身的问题,可能导致数据质量差、数据重复、数据泄漏、数据过度关联分析等潜在风险。

  第一,开放的数据质量差,导致基于低质量数据所产生的衍生品带来负面效果。王今、马海群认为,数据质量的好坏直接关系到政府开放数据的实际价值,不完全、不及时和不清楚的数据往往会降低人们对政府的信赖。[17]黄思棉、秦凤微指出,开放的数据必须要有可靠的来源和更高的质量才能满足社会公众种类繁多的利用和分析。不可靠的、劣质的数据极易产生应用差错,引起用户不满和质疑,甚至会引起纠纷。[18]JohnCarlo Bertot表示,数据的质量、可靠性和权威性是政府、科研群体、非政府组织以及私营部门最关注的问题。未经确认或验证的数据,或用错误方法采集到的低质量数据可能会导致错误的研究发现,进而严重影响一系列的决策和政策制定。[14]郑磊指出,低质量或错误的数据还可能导致错误的结果,进而严重影响商业决策和政策制定的质量。[19]

  第二,数据高度集中和融合,给数据安全带来更大挑战。黑客攻击数据聚集的运营商,不可避免地加大了用户隐私泄露的风险[1]。

  第三,数据冲突带来数据使用者的困惑。不同部门开放了相同主题的数据集,但内容不一致,可能导致部门间的冲突,也会给使用者带来困惑。郑磊指出,数据分散在各个部门,相互间可能存在冲突,如对于某一企业的数据在不同部门有截然不同的结果,这样的数据开放可能会给社会带来各种各样的问题,这也是政府在开放数据过程中遇到的一个非常现实的问题。[19]

  第四,数据关联分析,导致国家秘密、商业秘密和个人隐私的泄漏。王茜茹指出,伴随着数据挖掘、多种个人数据利用方式的出现,大数据更大的危险在于“个人行为被预测”,人们可通过精密系统进行预测,分析出更为精准详细的个人数据。于是,这种更具危险力的网络攻击就给个人信息安全带来了前所未有的安全风险。[1]

  第五,不当数据的开放也容易带来风险。如基础设施数据的开放如果被其他国家获取并进行大数据分析,将会对国家安全、社会安全以及个人信息安全产生巨大危害。[20]

  三、研究方法

  (一)案例研究法

  为深入了解政府数据资源开放过程中涉及的风险问题,了解各部门推进政府数据资源开放工作的困惑与担忧,本研究选取上海市作为案例进行深度研究。选择上海市作为案例的原因在于,上海是中国开放政府数据的先行者,据《2017中国地方政府开放数据指数报告》显示,上海市整体的数据开放水平居全国第一,其在政府数据开放中已经进行了多年的探索,现在遇到的问题与潜在风险的解决,对推动中国的政府数据开放具有重要的指导意义。

  上海市早在2011年便开始了相应的可行性调研、政策制定和平台建设。在平台与数据层面,2012年,上海在国内率先开展政府数据开放工作,建设了国内首个地方数据开放网站——“上海政府数据服务网”(一期)(www.datashanghai.gov.cn),提供了212项数据集、30项数据产品可下载,涵盖地理位置、道路交通、公共服务、经济统计、资格资质、行政管理等六大领域。2015年,上海市研究并制定了开放数据未来三年规划,进一步推动政府数据开放的进程。同时,为鼓励社会以企业和公众需求为导向,更多地利用数据,上海市还举办了开放数据创新应用大赛(SODA),通过对数据的深度理解、增值开发和创新应用,来解决城市中的问题,服务于城市规划与建设。截至2017年8月1日,上海政府数据服务网累计共开放数据集1268个,已覆盖经济建设、资源环境、教育科技、道路交通、社会发展、公共安全、文化休闲、卫生健康、民生服务、机构团体、城市建设、信用服务等12大领域。

  (二)数据采集

  本研究主要采取访谈法进行数据采集,调研了上海市工商局、审计局、人力资源与社会保障局、食品药品监督管理局、农业委员会、卫生和计划生育委员会、统计局、规划和国土资源管理局等部门,访谈对象为其数据开放工作的具体推进人员及相关业务部门工作人员,每场访谈历时2-3个小时不等,涉及到部门数据资源管理、数据资源开放中的问题,对政府数据开放的担忧等内容。

  (三)数据分析

  对收集回来的访谈资料运用Atlas.TI软件进行质性分析,从法规政策层、管理层、技术与数据层分别梳理当前制约上海市政府数据资源开放过程的潜在风险。

  四、政府数据开放的风险分析:基于上海市的实证调研

  基于对上海市八个部门的实证调研发现,政府部门工作人员在法规政策层、管理层、技术与数据层均存在不同程度的担忧,这些方面的欠缺或者不完备给政府数据开放带来了进一步的风险。

  (一)法规政策层面

  ⒈数据安全与隐私保护的法律法规不健全

  数据安全与隐私保护是政府数据开放工作的前提。然而,由于当前在国家层面缺乏专门的数据安全与隐私保护方面的法律法规,地方政府也尚未制定相关的政策予以保障,导致政府数据开放举步维艰。调研发现,部分部门担心政府数据工作会涉及到个人隐私,如调研中有部门提到,“目前资源开放出来比较困难,因为法律法规毕竟还不是很完善,包括隐私保护这一块,这个数据流出去后有什么后果的话没什么感知……可能产生消极的后果”,“根据社保法的要求,有关个人缴费的信息是属于不对外开放的……可能对个人隐私也不太好”。也有部门担心开放的数据过于敏感,比如“药品的不良反应和药品实验数据,都是不能向社会开放的”,“有些数据是很敏感的,比如平均工资,这个数据放出去后,舆情很快就上来了”。

  ⒉数据开放的法律与标准体系不完备

  从总体上来看,我国政府数据开放的法律与标准体系不完备,虽然国家层面相继出台文件以促进大数据、信息资源共享与增值利用等工作的开展,但是对数据开放的标准、边界和范围等均没有做出明确规定。有被访谈者提到,“当前数据开放主要参考信息公开条例,没有专门的数据开放法,没有依据我们很难做”。在缺乏相关法规政策的引导下,可能会产生数据本身并不违法、涉密或涉及隐私,但是不恰当的开放可能产生消极的社会影响,甚至导致公众对政府产生消极态度。

  ⒊数据再利用缺乏法律约束与政策引导,从而导致数据可能被误读

  当前,数据再利用方面缺乏法规政策的引导,导致即使数据本身没有问题,数据开放工作也符合法律法规的要求,但是公众可以对数据从不同角度解读,刻意或不刻意的数据误读都可能产生负面效应。有访谈部门提到,“开放者与受众,信息是不对称的……不对称的情况下会产生很多对数据理解的歧义。事先把数据的口径来源讲清楚……再讲开放的事。”甚至有部门提到,“我们不可能对每个使用者进行培训。原始数据开放出来之后,我们真的不知道,是不是会有别有用心的人,拿着原始数据库给你搞出一个什么结果出来,对这种还是要管控的。”

  (二)管理层面

  数据开放工作中的风险还源自于政府部门内部缺乏相应的风险管理战略、未设置专门的管理部门、管理制度和流程不规范、数据权属与问责机制不清等。

  ⒈缺乏开放数据风险管理战略

  从上海市乃至全国的开放政府数据实践来看,当前各地数据开放工作协调部门的工作重心在于如何实现政府数据开放工作的推进,却对在此过程中应制定的开放数据风险管理战略重视程度不够。调研发现,对各提供数据资源的委办局而言,即使他们已经认识到数据有很大的潜在价值,但仍然倾向于采取保守策略。

  ⒉开放数据风险管理部门机制不健全

  当前,开放数据管理机制不健全。调研数据显示,部分部门缺乏专门负责数据开放的办公室或工作人员,数据开放工作主要由之前负责信息公开或信息服务的办公室来承担,还没有设立专门负责开放数据风险管理的相应机构。

  ⒊缺乏系统科学的开放数据制度与流程

  政府数据开放牵扯到很多工作,应当有整套制度设计和工作流程的规范。调研中有部门提到,“(数据开放工作)不能仅有原则性的指导,应该研究设计一套系列、规范、普适性的制度模板,比如说审核制度、发布制度、质量控制制度、责任机制等,让每个单位去套。”同时,当前缺乏数据开放的管理流程,“流程上,从数据采集过来,自己先看好,一般要有个(部门或人员)再比较看一下,最后要由签发者审定。”

  ⒋数据归属与权责不清,问责困难

  数据开放后,要注意权责清晰。有被访谈者提到,“不能光讲方便,安全和便捷本来就是矛盾的,要找到契合点,需要制度设计进行控制,权利义务设置清楚”。有部门进一步提到,作为数据提供部门想知道自己的数据被哪些机构或者人员使用,否则“数据与数据的碰撞,产生了情报,可能会给本部门套上枷锁”。如果在政府部门业务开展过程中使用的其他部门共享或者开放的数据存在偏差,导致本部门数据开放后产生了错误的结果,应该如何进行问责,这也是访谈中有部门所担忧的问题。

  (三)数据层面

  在数据层,一方面要对数据本身的质量进行管理,避免因为数据质量低、数据重叠等带来的风险;另一方面,要通过技术的运用,对数据开放后可能产生的风险进行预测。

  ⒈数据管理方面的风险

  首先,数据处理是一个复杂的过程,从数据标准制定、数据采集、数据加工、数据开放等各个环节都容易带来风险。当前,在数据标准制定方面,缺乏统一、权威、公认的数据标准,调研中有部门指出,“我们没有标准,或者说我们的标准是没有经过认可的”。在数据采集的过程中,“网络采集有一个风险的问题”。在数据开放中,有部门提出,“先摸底,下一步主要看数据质量”。

  其次,开放数据质量低下,容易带来延伸风险。数据开放工作要保障数据的准确性,否则可能带来风险,有部门提到,“如果公布出去的数据是有问题的,这个风险很大”。因此,数据开放工作应注意数据本身的质量,若质量低下容易带来风险。在访谈中有部门已经意识到自身采集的数据存在问题,尽管当前已经尝试用部门内部的数据管理平台来进行数据质量控制工作,但是“主要给领导做决策用,参考可以,开放的话还不是很成熟”。

  最后,由于部门之间职能交叉也容易带来数据重叠或数据打架,进一步产生风险。在数据开放的实践中,不同部门开放了相同话题的数据集,但内容不一致,可能导致部门间的冲突,也会给使用者带来困惑。有部门提到,“开放还遇到一个问题,各家单位不同的渠道提供的同一数据会打架”;甚至也会发生,“同样的数据库,但是模型不一样,汇总方法不一样,参数不一样,出来的数据大相径庭”。

  ⒉数据开放后的风险

  在数据开放后,也容易产生风险。一方面,可能会产生数据滥用或者不合法使用,让不法分子有机可乘,比如访谈中有部门提到,“就像新浪微博一样,它一旦出来,就会有很多的那种大数据公司在半个小时内把数据扒下来,很快就会有一个山寨的工商局,拥有所有的相同数据……老百姓该信哪个?老百姓用错了数据或者被欺骗了应该怎么办?”

  另一方面,数据关联分析也容易带来潜在风险,导致国家秘密、商业秘密及个人隐私的泄漏,这也是访谈中很多部门担忧的问题,有部门指出,“数据交叉分析,万一涉及国家安全,出了问题,委办局需要承担责任。……其中的关联,有时候是政府没有办法控制的。现在要能找到各部门能做的,还要有必要的技术。”但同时也有部门对技术处理存在疑虑,“不要以为做了技术处理就判断不出某些具体单位的具体信息了,关联分析就可以得出,通过数据的量和特性很容易判断出来具体单位。”

  五、风险视域下政府数据开放的对策

  受上述潜在风险的影响,当前政府部门普遍存在数据开放的积极性欠缺、对政府数据开放规划的执行力度低,进一步造成政府数据开放的数据量少、范围窄,即使已经开放的数据,也存在数据更新慢、格式比较单一等问题。因此,在实践中,应多渠道、多层面、多视角探索政府数据开放的路径。

  第一,应不断完善数据开放的相关法律法规。国家层面应加强立法,制定关于数据安全和隐私保护的专门法律,完善既有的法律框架。对地方政府而言,应在国家现有法律法规的框架内,探索制定地方性的关于数据开放、数据再利用、数据安全与隐私保护等方面的法律规范,明确政府、企业、社会团体、个人在数据收集、存储、再利用过程中的权利和义务,以配套开放数据的规划,促进数据开放。

  第二,在数据管理的标准规范上,应制定并遵守包括政府数据分级分类、政府数据脱敏、开放平台技术规范、数据安全管理规范等方面的数据质量标准,规范数据资源管理体系,提升数据质量,防止因错误数据而带来的风险。

  第三,建立数据分级分类的风险防范与评估机制,并以此指导数据开放范围和开放方式的界定,即应综合权衡数据价值与风险之间的关系,建立数据价值密度与风险系数二维评估指标,并针对不同的数据类型选择恰当的开放方式(参见图1)。针对图1中所指出的各种不同的数据类型,数据资源的开放方式存在四种:①针对价值高、风险低的数据,应当选择普遍开放的方式,通过数据开放平台向社会普遍开放。②针对价值高、风险高的数据,应采取授权开放的方式,选取合适的数据利用主体,通过协议约束数据使用主体的权责,既可以追溯到数据利用主体对数据的利用情况,同时也强化了数据利用主体的安全与风险意识,规避了可能的风险。③针对价值低、风险低的数据,采取按需开放的方式,价值的高低存在不同的判断标准,政府部门自身认为价值低的数据,可能也会得到少数数据利用群体的青睐,因此仍然建议采取按需开放的方式;若多机构对同一数据资源提出需求时,转而采取普遍开放的方式。④针对价值低且风险高的数据采取暂不开放的策略,但如若有数据利用主体提出对这些数据也存在需求,应创造条件进行授权开放。

风险.jpg  

图1 基于数据价值与风险二维划分的数据开放方式选择

  第四,在对开放数据的管理机构上,应建立或指定专门的数据主管部门,负责政府数据的收集整理、监督、审查、开放、用户意见征集反馈及风险管理,可以考虑借鉴西方国家或企业的经验,设置首席数据官制度,负责执行数据管理与数据开放的战略、标准和制度,预知并防范数据风险。在政府部门内部,应建立防范数据开放风险的工作小组,在数据开放之前进行充分研究并讨论,做好部门内部监督与把控。

  第五,在数据利用中,加大对数据开放及使用主体的评估、监管、许可与审核措施,建立数据使用主体的信用评价制度。通过对数据利用主体的评估,对承担政府数据存储、管理和分析的第三方主体,通过多种方式来评估其政府数据安全防护能力。对于没有达到相应安全能力的机构,应该要求其进行整改,或者停止其政府数据服务业务,从而降低政府数据被滥用或者隐私被泄露的风险。同时,数据开放后,政府应加强对数据使用者的评估、监管、许可或审核,借助第三方组织评估开放数据的二次利用价值与个人信息过度披露的风险。对各类数据使用主体,建立信用评价制度,对信用评价指数高的数据利用主体,扩大数据使用的权限,激励数据使用主体的安全与风险意识。

  第六,建立社会监督与评议机制,充分利用社会力量的参与,推动对已开放数据的监管与使用,如发现数据开放中的风险,可主动及时向政府部门反馈,由相关部门进行及时调整与修正。

  最后,在技术层面,应探索采用技术手段规避数据的采集、存储、加工、流通等各环节的潜在风险;通过异构数据的计算、平台架构的设计等防范数据关联分析所涉及的风险及数据窃取问题;在数据开放后,应对已经开放的数据进行长期监测并及时反馈,对发现的风险进行及时处理。

  六、小结

  尽管各地在推进政府数据开放的进程中遇到一定问题,也存在不少潜在风险,然而,数据开放工作是大势所趋,不能因噎废食,应正确处理好加快开放、安全保护与开放数据价值实现之间的关系,在数据开放与安全保护中寻找开放数据策略的平衡,推动开放数据工作的进程,妥善保护涉及国家秘密、商业秘密、个人隐私以及法律法规明确不能开放的政府数据资源,确保开放工作的安全有序,提高开放数据的广度和深度。同时,在实践中,应探索通过多种手段、多种方式推动政府数据开放;也应引导和鼓励各类社会主体对开放数据进行增值、加工和利用,促进政府数据开放价值的实现。

  参考文献:略。

  作者简介:

  刘新萍(1986—),女,汉族,博士,上海理工大学管理学院讲师,复旦大学数字与移动治理实验室研究员,研究方向为电子治理、跨部门协同、开放政府数据。

  孙文平(1990—),男,汉族,上海理工大学管理学院硕士研究生,研究方向为开放政府数据。

  郑磊,博士,复旦大学国际关系与公共事务学院副教授,数字与移动治理实验室主任,担任GovernmentInformation Quarterly编委。研究领域包括数字治理、政府数据开放、跨边界信息共享、政府社会化媒体应用、移动互联时代的公共服务等。

标签:

责任编辑:liudan
在线客服