说说政务大数据

推荐会员: 点金大数据     发布时间: 2020-07-31 09:35  阅读次数: 1,739 views

政务大数据广泛存在于税务、工商、教育、交通、卫生、公安、民政等承担公共服务管理的部门,除了管理部门内部数据之外,还有相关下属管理企事业单位的数据、社区和开放公共数据等。对拥有大数据处理能力的机构来讲,这些数据无疑是一种战略资源和生产要素,能通过数据的加工处理和挖掘,产生新的服务和创新;而无法有效利用就会成为一种负担,比如某些管理部门没有低成本的大数据存储能力,为了降低成本,不得不定期清空历史数据。

大数据智能为政府治理提供了新的思路、方法和技术,当然也面临挑战和风险,笔者认为主要涉及两点。一是数据集中和匮乏的矛盾。我们很多管理部门希望掌握的数据越多越好,数据越大越好,所谓见微知著,希望各级人、事、物的数据都能集中到领导的案头,可现实是各级部门的利益纠葛,数据归口不一,数据之间相互矛盾的地方比比皆是,数据集中不容易,集中之后要保证准确无误更不易。二是数据开放和管控的矛盾。公众和企业希望开放的数据越多越好,而各级政务部门会考虑,开放于社会有什么好处?哪些数据能开放,哪些不能开放,数据开放过程中的风险如何控制,这些都是问题。所以要有效利用政务大数据,首先要搞清楚其应用动机和存在的困难。关于政务大数据治理的挑战,我们可以自问三个问题。

第一问:如何处理集中与开放的矛盾
大数据智能时代,如何基于大数据和AI技术优化政府运作方式,打破信息孤岛,提高服务效率,甚至保障国家安全。政府各级管理部门的大数据治理意识和技术处理能力等都面临挑战。
首先是政务大数据集中过程本身存在的问题。当前的数据集中主要靠上级的行政命令,一纸公文要求大数据把数据全交上来,这种形式只对直属下属部门有效,而条块分割的管理模式导致的数据孤岛问题仍然无法破解,除非在更高层级做横向数据协同。另外,在从下到上的大数据集中,基层部门如果不能获取数据集中的有效反馈和应用利益(如通过大数据分析提高基层办事效率,提升业务能力),那这种形式的数据集中,就难以保证数据质量,而且可持续性和成本问题等也是要打问号的,因为没有像互联网大数据产品一样形成应用闭环。
其次是数据共享和开放的风险问题。一般来讲,政府各部门之间没有共享核心数据的意愿,包括商业领域也是一样的,任何大型组织都十分重视自己的数据资产,谁都不愿意轻易分享自己的资产。政府部门还面临数据安全管控更大的责任,政务数据大部分都涉及个人隐私或包含组织机密,这需要权衡数据开放和隐私保护、权衡数据开放程度和保护机密安全等多个方面的因素,新兴技术的应用还需要一个过程,在无法做到绝对的安全分级管控之前,是很难进行数据共享和开放的。再就是涉及各级机构核心业务数据的,除了技术风险之外,还要考虑到成本和回报等因素,而不愿意主动共享和开放数据的情况也普遍存在。

第二问:如何推进政务大数据治理和决策优化
大数据不在于数据大,而是要看是否能进行有效分析、辅助决策和价值变现。一般垂直行业和细分领域的大数据集很少谈数据治理,那政务大数据为什么重在治理呢?这是由政务领域特征决定的,政务数据来源广泛,安全风险较大,数据质量和标准问题错综复杂,政府毕竟不是企业,其创新基因、大数据思维意识和相应新兴技术、制度支持的缺失等,都是问题。所以散布于各级部门信息中心的高价值数据多数还是在休眠状态的,真正想用于或能用于科学决策和优化服务的大数据应用就更少了。另外,陈刚在《求是》杂志上说到了另一个难题 ,那就是涉及体制本身的管理,他说道:“数据治理既有技术难题,也有管理难题,难题解决的根本却在于后者。

所以说,政府大数据治理的关键不在于技术,而在于管理。从某种程度上讲,大数据智能相关的项目背景多半是一把手工程,这就是涉及从上到下的管理革新问题,没有从上到下的顶层设计,而且是人人遵从、行之有效的顶层设计,就没有政务大数据应用的成功。如何通过政务大数据治理提升政务管理水平,要解决两个关键问题:一是打通政府各部门垂直条块分割管理模式所带来的数据孤岛问题,以互利互惠的原则和建立数据权、责、利制度,构建互联互通的横向大数据协作中心平台;二是涉及安全和隐私的数据能否公开、如何公开、公开到何种程度,这些要从制度和管理角度仔细调查研究,再采用隐私脱敏、定向互通、加密解密等各种技术手段进行数据预处理,以保障大数据应用的安全。

第三问:如何降低政务数据治理带来的负面影响
技术是把双刃剑,大数据智能也一样。大数据智能的发展不只涉及技术问题,同时也涉及社会问题,从这个角度讲,政务大数据智能不只是应用,而是要从宏观政策、经济社会、国防安全等多个层面进行深入研究和规划设计,不只是下发一些扶持政策那么简单。比如技术的加速迭代会加剧失业问题,怎么平衡?大数据的垄断是否可控,数据泄露的安全措施怎么应对?AI武器研究应用的伦理道德问题,对手研究了我们如何应对?大数据智能平台对传统产业的冲击,如何进行相应的结构升级调整?总之,大数据智能时代,特别是面对强AI技术的研发和应用,政府应该重视其对社会、经济、政治、军事等领域产生的深远影响,核心技术的研究和应用既不能落后也不能冒进。

对政务大数据来讲,由于面临着数据质量参差不齐、数据源标准不统一、安全机制不健全等种种问题,数据治理的需求更迫切,主要包括数据质量、数据安全和数据标准等方面,一般通过如元数据管理、数据审计、数据合规性检查和数据隐私脱敏等技术进行保障。
简单来讲,大数据治理是对组织机构中相关数据的可用性、完整性、准确性、规范性和安全性等的全面管理。数据驱动的组织需要在技术人员和决策者之间建立起一座桥梁,而有效的数据治理就是这座桥梁的骨架。那么除数据治理之外,政务大数据应用主要还包括哪些关键环节和内容呢?如图1所示,政务大数据应用的核心内容可以从如下三个方面进行解读。


图1 政务大数据应用框架

1)管理和治理是基础
拥有大数据的机构也意味着要承担更大的责任,随着大数据的日益增长,爆发出来的监管问题也越来越突出,比如Facebook中8000多万人的个人资料被泄露,还有隐秘非法的数据交易市场,政务大数据面临的安全问题不容小觑。2018年5月,欧盟出台《通用数据保护条例》(General Data Protection Regulation,GDPR)(具体条款内容可到网上搜索),它代表了欧洲加强个人数据保护的决心,该立法的影响将远远超出欧盟国家的范围,因为它提出了严格的个人数据保护标准,将促使人们越来越重视个人数据的私密性和安全性问题,垄断企业和各级机构的大数据必须被有效管理和审计,并接受公众和政府的监督,未能保护好个人数据的组织可能会受到处罚。从欧盟的个人数据保护计划到Facebook的数据泄露,凸显了大数据治理的重要性。
由于元数据管理、数据审计、数据访问控制、数据隐私脱敏等技术一般在系统服务端,这些治理关键技术对用户来讲是不可见的,因为这是隐形的成本支出,而不能产生直接的收益,这也是为什么数据治理一直以来被很多大数据服务商包括政府机构忽视的原因。从某种程度上讲,数据治理的不成熟也是制约大数据进一步被挖掘、应用的原因之一。
那怎么进行有效的大数据治理呢?也就是说没有标准的做法?首先必须围绕数据治理、数据安全、数据标准和数据模型等多个层面制定一套标准的管理程序和流程(元数据管理平台加数据治理团队),规定授权人员如何使用数据,通过标准的控制措施和审计程序,确保持续遵守数据安全保护标准和相关的法律法规,防止数据滥用和数据泄露,并保证数据不被黑客攻击窃取,能在多个应用程序之间以一致的方式进行流动,这些内容应该覆盖数据采集的合法性、数据获取的合规性、数据存储访问的安全性、数据使用的正当性等多个方面。总之,大数据治理本身也是一个系统工程,其复杂性不比机器学习建模更容易,不仅需要像传统结构化数据那样定义和衡量其准确性、完整性、有效性,还需要考虑数据的及时性、可读性和安全授权等问题,比如数据是否能在数据管道中快速流动,及时响应大数据分析需求;数据的格式和标准是否容易理解和便于交换访问;数据访问是否符合相应级别的权限、是否合规和合法等。总之,大数据治理是基础,这些关键问题都解决之后,才能有效支撑政务大数据的共享、开放和决策服务。

2)技术和算法是手段
虽然模型和算法是通用的技术,但在政务大数据应用中也需要考虑一些关键特性。比如机器学习算法的数据偏见问题,将其用于京东搞的“猪脸识别”来讲应该没有大的问题,但用于公安警务预测的嫌疑人比对就要小心了。如2017年有学者就提出了基于人脸深度学习的犯罪倾向预测方法,引来了很多人的口诛笔伐。另外,AI相关模型算法公开应用于武器的研发,也是被学术圈所不能容忍的。种种这些问题,不仅需要研究机构和人员自身的自律,还需要政府制定相关措施加以引导或监管。这里笔者就不赘述了,总之,政务大数据的很多场景,都会强调涉及更多相关约束条件下的智能模型和算法的应用。

3)决策和服务是目的
政务大数据应用的核心就是为决策服务的,越复杂、越敏感、越上层的决策,越是需要广泛数据的支持。政府各级部门的管理与决策,看似简单,实则不容易做好。任何决策都有滞后效应,不管是好的结果还是坏的结果,都要经过一段时间才得以显现。传统的政务决策多依靠政治精英和专家智囊的知识、经验或直觉,是一种经验性和模糊性决策,决策效果多少会存在一定偏差。数据驱动的决策,就是一切让数据说话,通过数据学习预测发现规律,提供科学依据,使政务决策尽量基于客观的数据事实。
但即使是大数据,对决策优化来讲也不是万能的。从问题到数据,从数据到模型,从方法再到决策,不仅需要通过一系列大数据智能技术来打通政务管理链条,还需要从管理制度、人员意识、各方协同等多个层面进行跟进。受部门自身利益和权、责、利的影响,不同单位决策者的驱动因素大不相同,甚至有些相互掣肘,存在难以调和的矛盾。比如,信息化部门的领导希望通过大数据智能技术来提升系统的效率和各项数据的准确性,更好地为其他部门提供精准信息服务,这就需要各级部门的数据互联互通,而且要保证数据录入的质量。金融部门希望通过大数据技术提升交易服务能力,而防止洗钱或欺诈交易等技术的应用一般是需要上级监管部门来驱动的,需要决策者进行平衡。如何创建数据驱动型组织,协同政务相关的人、事、物和各种信息数据的有效流动,如何将人员、流程和信息之间的关系进行关联分析和跟踪预测,以确保整个组织的高效合规运作,是政府大数据决策者要考虑的关键问题。

 

关键词:

版权声明:本站原创和会员推荐转载文章,仅供学习交流使用,不会用于任何商业用途,转载本站文章请注明来源、原文链接和作者,否则产生的任何版权纠纷与本站无关,如果有文章侵犯到原作者的权益,请您与我们联系删除或者进行授权,联系邮箱:service@datagold.com.cn。