政府开放数据资源利用与创新应用效能评价研究

时间:2023-10-29 17:32:01 来源:网友投稿

赵龙文 洪逸飞 赵雪琦

关键词:政府开放数据:数据包络分析:效率评价:数据创新应用

DOI:10.3969/j.issn.1008-0821.2023.07.013

[中图分类号]G203 [文献标识码]A [文章编号]1008-0821(2023)07-0133-12

数据资源作为新型生产要素,是国家基础性战略资源。在数字技术快速发展和疫情对线上办公的催化等因素共同作用下,数据资源作为国家经济发展、公共服务和社会治理等方面的重要基石,侧面反映一个国家的软实力与竞争力。作为社会主要数据持有者的政府部门在履行社会治理与公共服务职能过程中采集、应用并存储了大量数据,通过开放这些数据供社会应用和创新,可以发挥数据资源对经济、公共服务和社会治理发展的促进作用。在企业方面,可供企业识别市场机会,正确做出决策;
在公众方面,可为大众创业、万众创新提供良好基础;
在政府方面,可促进政府工作透明度和公信力提高并改进政府管理流程。2009年,美国政府先后签署了《开放透明政府备忘录》并创建了首个政府开放数据平台,建设政府开放数据平台成为开放政府数据的主要途径。根据《2020/21开放数据清单》可知,截至2021年7月,全球范围内已经有187个国家和地区上线了政府开放数据平台。我国开放政府数据运动开始于2012年,上海、北京率先上线开放数据平台,虽然我国开放政府数据运动起步较晚,但随着中央和地方政策文件的出台,明确提出要推进政府数据的开放共享,促进数据的创新应用,促进开放数据平台建设,加快数字化转型。截至2021年10月,我国已上线地级及以上政府开放数据平台193个,其中省级平台20个,政府开放数据平台建设已经取得了可观的成果。

学界目前针对政府开放数据进行了以下3个方面研究:首先,是政府开放数据建设研究,包括开放数据建设的构成内容、建设路径、政策法规、隐私保护与机制机构保障研究;
随着政府开放数据建设的完善,学者开始进行政府开放数据应用研究,包括开放数据的利用价值、影响因素、保障措施以及价值创造机制,政府开放数据的应用实现过程涉及诸多利益相关者,是一个多主体共同参与及多领域覆盖的过程,但由于公众对于数据的利用只涵盖了交通出行、教育科技、健康卫生和住房等少数领域,产出成果量和覆盖面都处于较低水平,导致政府开放数据利用率低且未能发挥数据价值;
针对开放数据的应用情况,学者进行了政府开放数据评价及改进的相关研究,研究热点更多的聚焦于对开放数据质量与开放平台建设情况的评价。

近年来,开放数据平台数量不断增长,我国现有的政府开放数据平台在数据集数量、数据集开放情况、数据集规范程度、数据集更新情况和数据质量之间存在较大差异,平台建设质量良莠不齐。客观准确地对政府开放数据建设成果进行评价并提出启发式建议十分必要。然而,现有的评价方法中,人工观察评价受限于效率与主观性,无法做到全面、完整、客观;
基于专家打分建立评价矩阵并进行评价则受限于专家打分情况,专家主观性与知识水平会直接影响评价结果,甚至使结果产生偏差;
基于投入产出数据的数据评价则只采集了平台相关数据进行评价,对数据开放的多种促进作用则缺乏考虑。因此,本研究在现有数据评价体系的基础上,将开放数据对城市创新应用的影响情况纳入体系中,旨在为政府开放数据建设与数据资源创新应用提供启发式建议。

1相关研究现状述评

1.1国内外研究现状

政府开放数据平台作为政府开放数据应用过程的核心,通过其提供的公共服务,将该过程中的其他主体及参与者连接起来。政府开放数据平台直接影响到整个数据应用过程的运作,对政府开放数据平台进行评价并对其提供的公共服务进行改进是重要且必要的。随着开放政府数据运动的发展,学界对政府开放数据的关注点逐渐由“怎么开放”转移到“开放得怎么样”,越来越多的学者对政府开放数据的成果进行了评价研究。

目前,对政府开放数据平台评价的相关研究已经有了一定的成果,学者们主要通过以下3种评价方法对平台进行评价:①结合平台功能和服务情况,分析评估数据集和数据资源内容,对单个平台直接评价。Umbrich J等使用CKAN数据管理系统,从可检索性、实用性、完整性、准确性、开放性和连续性6个维度通过分析涉及的数据资源对82个政府开放数据平台进行质量情况评价。Wang V等分别从开放程度、内容价值和反馈情况这3个维度对英国政府开放数据平台上的400个数据集进行分析,发现数据的实用性、覆盖范围、即时性及颗粒度直接影响政府数据开放情况。李晓彤等对广州、北京和哈尔滨三地政府开放数据平台共1900个数据集进行调研,构建出数据完整性、准确性、一致性、时效性、唯一性、可理解性、开放性7个维度的评价指标进行评价。还有学者结合平台服务情况和用户使用情况建立了综合评价框架,对平台进行更全面的评价。Raca V等基于平台开放性、数据集质量与数据质量3个维度构建评估框架,对西巴尔干国家开放数据平台进行评估,发现数据集及数据的格式、更新速度、可发现性和一致性是政府开放数据利用的先决条件。Nikiforova A等根据用户反馈和开放政府数据门户可用性分析框架得出数据可使用性、平台技术水平、数据质量等因素很大程度上影响着用户体验。Zhang W等从可持续利用角度,使用以实验决策分析法为基础的网络层次分析法建立了包括数据、平台、产出和用户4个维度12个指标的政府开放数据平台评价体系,对4个城市的政府开放数据平台进行评价;
②以专家打分产生的評价矩阵为基础,使用定性一定量相结合的方法对不同平台进行对比评价。曹海军等使用熵权法,根据专家打分从有形性、易用性、可靠性、响应性、移情性5个维度对6个省级、副省级政府开放数据平台的服务质量进行评价,发现易用性、可靠性、响应性是影响平台质量的关键因素。阮霁阳在此基础上将层次分析法与熵权法结合,基于服务质量差距理论从有形性、功能性、可靠性、响应性、移情性5个维度对10个省级政府开放数据平台服务质量进行评价,认为平台优化建设应考虑功能性与可靠性方面。王迪等基于可用性框架体系,根据4位专家的评估打分对8个省级政府开放数据平台进行可用性评价,认为目前我国政府开放数据平台应当在差错预防、用户交互、数据标签、筛选推荐、数据格式和数据可视化方面进行改进以提高平台建设水平。陈水湘采用德尔菲法、层次分析法和权值评优法构建平台价值评价模型,对19个政府开放数据平台进行评价,发现这些平台在开放数据质量、用户需求满足与数据开放程度上还存在问题;
③采集平台数据、技术、资金、政策等层面的投入产出数据,使用非参数法进行平台评估。马海群等、海伦等、韩磊等学者从数据和平台两个维度收集政府开放数据平台的相关数据,利用数据包络分析法对我国省级、副省级和地级开放平台进行总体效率、纯技术效率以及规模效率评估,根据评估结果为政府开放数据平台建设提出改进建议。邓崧等则从数据、技术、资金、利用率和透明度5个维度,使用数据包络分析法对13个省级、副省级政府开放数据平台进行效率评估,并从提高平台影响力、提高平台曝光度、优化用户使用体验等方面给出了效率改进建议。

随着政府开放数据生态系统相关研究不断深入,一些学者也开始从生态系统的角度对政府开放数据成果进行评价。朱红灿等结合社会技术系统理论和成熟度模型构建了政府开放数据平台生态系统5级成熟度模型,从政策、组织、用户、创新、数据、门户6个维度进行评价。郑娜静基于生态系统理论与生态链理论构建了政府开放数据生态系统模型,从数据资源、基础保障、组织管理、制度建设、用户参与、个性化服务、开发利用、数据可持续性、自我调节能力等维度进行评估。LnenickaM等基于智慧城市开放数据生态系统透明度水平评估框架,从数据量与结构、数据质量、数据可访问性、可查找性、可理解性、有用性、公众参与和协作及服务质量8个维度对22个城市的34个开放数据门户进行评价。

随着政府开放数据建设的不断完善,在大量政府數据被开放的同时,也营造了良好的政府数据使用环境,为公众创新及企业创新提供了前提。在大数据时代,政府数据的开放共享为创新创业提供了高质量的信息资源,通过社会对政府开放数据的增值开发和创新应用,可营造大众创业、万众创新的氛围,提高城市创新能力,同时,基于政府开放数据非歧视性、机器可读性、开放授权性等特性开展的政府开放数据创新应用竞赛能够吸引公众开发利用政府开放数据,实现政府开放数据价值创造,发挥其蕴含的潜力并以此激发出“群体智慧”与创新创业活力。在企业创新方面,政府数据的开放为企业商业智能的创新突破提供了条件,通过对政府开放数据的可视化分析可以将数据分析、转化并用于商业智能的训练,该商业智能可用于对市场机会的识别和商业战略的制定。

1.2研究评述

考虑到方法①通过对数据集和数据资源的人工评价来实现对平台的评估,虽然人工评价可以一定程度地在数据层面对一个平台做出评价,但受限于人工评价的效率与评价者的主观性,对一个平台的数据评价必然无法做到全面且完整,若想同时对多个平台进行评价,通过对比平台间优劣进行改进,则需要花费大量人力物力。方法②对平台的评价很大程度上受限于专家打分情况,虽然采用了定性一定量相结合的评价方法,但定量评价部分是基于定性的打分进行的,评价结果可能由于主观性过强而产生偏差,另外,基于专家打分的评价方法虽然可以在宽度上实现对多个平台的对比评价,但在对单个平台的评价深度方面存在一定问题。目前对于政府开放数据平台的评价大多是针对平台的建设情况进行的,虽然已有研究从生态系统视角进行政府开放数据成果评价,但相关研究较少且对于政府开放数据对城市经济、公共服务和社会治理发展的促进作用缺乏考虑,没有将政府开放数据平台与所在城市的企业、政府等其他参与者联系起来作为整体进行系统分析。同时,虽然已有研究表明政府开放数据对公众创新与企业创新具有促进作用,但水平不一的政府开放数据建设对创新的促进作用有何种程度的差距以及何种政府开放数据建设路径可以更加充分地发挥对创新的促进作用缺乏相关研究。

综上所述,本研究选择使用数据包络分析法,根据从政府开放数据平台采集到的数据对政府开放数据资源利用效能进行评价,数据包络分析法具有客观性,在对决策单元进行效率评估时约束较少,生产函数及投入指标与产出指标的权向量不是人为提前预设的,在很大程度上避免了因函数形式错误而导致结论错误。此外,本研究除了使用数据包络分析法根据平台数据对数据资源利用效能进行评价,还以城市创新能力为例,评价政府开放数据资源对城市创新的促进作用,基于两次评价的结果对政府开放数据建设改进提出建议对策。

2评价模型构建

2.1数据包络分析法

数据包络分析(Data Envelopment Analysis,DEA)由Charnes A、Cooper W W和Rhodes E 3位运筹学家于1978年提出。数据包络分析法是一种基于线性规划技术,可以有效评价具有多项投入与多项产出的决策单元(Decision Making Units,DMU)的相对有效性的效率评价方法。效率评价通过测算每个决策单元投入指标与产出指标的权重确定效率包络面后,再将各决策单元与改效率包络面进行对比计算得到效率值的差值来实现。

CCR模型是DEA的最基本模型,它假设规模报酬不变。在该模型中约束条件均以不等式存在,因此会存在松弛变量,在CCR-I模型中松弛变量存在于投入指标中,为多余的投入。在CCR-O模型中松弛变量存在于产出指标中,为欠缺的产出,松弛变量可以在寻找改进方向时提供帮助。现实中的实际生产环境由于竞争以及环境中不利的约束的存在,大部分决策单元的规模并不能处于最优状态。因此,CCR模型具有一定的局限性,仅能判断一个决策单元是否在技术与规模两个方面同时处于有效状态。而BCC模型假设规模报酬可变,可以用来判断一个决策单元在技术与规模两个方面中任一方面的有效状态。

在DEA方法的多种模型中,CCR模型虽然基本,但是十分重要。而CCR模型关于规模报酬不变的假设在现实生活中很难实现,容易与实际情况发生冲突。同时,由于BCC模型只能运行得出纯技术效率与规模报酬情况,因此选择同时使用BCC与CCR两种模型进行效率评估,对政府开放数据平台的综合技术效率、纯技术效率以及规模报酬进行综合评估,并根据投影情况进行进一步的分析,最后给出改进建议实现效率优化。

2.2评价样本选取

本研究主要评价政府开放数据资源利用效能以及数据资源对所在省市创新能力的促进情况。选取的评价样本为域名中应包含data、gov.cn等相关字符的政府开放数据平台,为确保所选择平台拥有足够的数据量和较好的稳定性以供评价和数据获取,本研究选择省级以及副省级平台作为评价样本。在初步确定样本选取范围后,通过线上考察对初步拟定的平台进行基于数据量和数据可获得性的筛选,去除北京平台、重庆平台这类数据不易获取的平台以及陕西平台、江西平台这类数据量过少的平台,最终选择上海、浙江、贵州、广东、山东、天津、福建、河南、四川、广西、宁夏11个省级平台以及深圳、广州、哈尔滨、厦门、成都、宁波、武汉7个副省级平台共18个政府开放数据平台作为研究样本,如表1所示。

通过对18个政府开放数据平台进行初步调研后发现,省级平台与省级平台、省级平台与副省级平台及副省级平台与副省级平台之间在平台建设投入与成果产出均存在不同程度的差别,通过数据包络分析确定DEA有效平台后便可以根据DEA有效平台与DEA无效平台之间的差别进行投影分析,为DEA无效平台的投入产出改进提供指导建议。同时,各个平台的建设政策和指导方针均存在不同程度的差异,在平台具体的模块设计和服务提供上有不同的侧重,通过对DEA有效与无效平台之间的异质性问题进行综合分析,可以对比分析得出更有利于政府开放数据资源利用与创新应用效能提升的政府开放数据平台建设模式。

2.3评价指标构建

政府开放数据平台的平台建设技术是为了平台提供数据资源服务的,即平台建设技术是一个平台的基础,平台所能提供的数据资源才是一个平台真正的核心,在确定评价样本的初步考察中,所有的平台均可以通过搜索“省市名”+“数据开放平台”找到。同时,随着我国政府开放数据平台10年的发展,平台搭建技术已趋近成熟,评价样本平台在初步考察中均表现出了可靠稳定的性能,并没有出现平台崩溃、卡顿等影响使用的情况。

考虑到各个平台搭建技术处于较为均衡的情况下,本研究将评价指标构建的重点聚焦在数据资源利用维度。在政府开放数据资源利用效能评估模型中,本研究通过参考《中国地方政府数据开放报告》中的开放数林指数评估指标体系,同时考虑使用数据包络分析法对数据完整性和可获得性的要求,在对作为研究样本的开放数据平台进行调研和数据爬取与汇总分析后,选择数据集数量、平均数据集容量、可机读数据集数量、及时更新数据集数量和无条件开放数据集数量作为投入指标,分别反映数据资源的数据质量、使用便捷性、资源时效性以及开放性;
选择平台公示的典型应用数量、浏览量和下载量位列前25%的数据资源的平均浏览量和平均下载量作为产出指标,来反映平台数据资源的曝光情况、使用情况和应用情况,从数据数量、数据质量、数据规范、数据获取和利用成果维度进行评估,如表2所示。各个指标的具体内容如下:

在政府开放数据资源利用效能评估模型中,通过平台提供的数据集数量(包括数据接口),以及数据集平均拥有的数据条数作为平台提供数据数量和质量的评价指标。

根据维基百科的定义,可机读数据是指符合可由电脑处理格式的数据,其划分依据为某种格式的数据是否可以由计算机轻松处理而无需人工干预,同时确保不丢失语义。JSON、XML、CSV、RDF、XLS、XLSX等数据格式是主要用于机器处理的数据文件格式,可通过电脑编程逻辑来提取、转换和处理其内容;
虽然人们可以通过电脑浏览并获取DOC、DOCX、PDF、JPG、RAR格式的数据内容,但这些内容却很难通过电脑编程逻辑来提取、转换和处理。因此,若平台提供数据集格式为JSON、XML、CSV、RDF、XLS、XLSX等,认为其是可机读数据集,若格式为DOC、DOCX、PDF、JPG、RAR等,则认为其为不可机读数据集,统计可机读数据集数量作为平台提供数据可机读性的评价指标。

通过对开放数据平台公示具有较强时效性、对数据来源更新频率具有较高要求,如交通、气象、民生、教育查询应用的数据来源更新频率进行数据收集和分析发现,这些数据集的更新频率大多高于每周1次。因此,本研究认为更新频率高于每周1次(包括每周1次、每天1次、每小时1次、每分钟1次以及实时更新数据集)的数据集是高频更新数据集,通过比较数据集创建时间与最后更新时间,若在数据集创建后有过更新,认为是持续更新数据集,通过统计高频更新数据集数量与持续更新数据集数量作为平台提供数据更新情况的评价指标。

不同平台对无条件开放的定义存在一定差别,一部分平台(如贵州、山东)是真正意义上的无条件开放,即不需要登录、实名认证等额外操作就可以下载无条件开放数据集,其他平台标记为无条件开放的数据集通常需要登录或实名制后才可以下载,有条件开放的数据集则需要上传额外的证明材料进行申请,审批通过后才可以下载。本文不将登录或实名制后才可以下载的数据集认定为有条件开放,仅将需要提供额外材料申请开放的数据集认定为有条件开放。统计无条件开放数据集数量作为平台提供开放数据程度的评价指标。

通过统计下载量与浏览量之和排名前25%的数据集的平均下载量与浏览量作为平台曝光度的评价指标。

通过统计平台上公示的典型应用数量(包括优化方案、APP、小程序、Web应用等)以及平均下载量作为平台数据利用情况的评价指标。

在数据资源创新应用效能评估模型中,选择平台公示的典型应用数量、浏览量和下载量位列前25%的数据资源的平均浏览量和平均下载量作为投入指标,以反映政府开放数据平台数据资源的使用情况。为了衡量城市创新能力的高低,通过查阅文献发现发明专利申请量通常被用来衡量创新水平,同时考虑到高新技术企业对于数据资源具有较高的需求,最终选择将平台所在省市发明专利申请量和高新技术企业数量作为产出指标,来反映平台所在省市的创新能力,如表3所示。

2.4数据来源与采集

根据已构建的评价指标体系,实现政府开放数据资源利用效能评估需要的具体数据信息包括评价样本平台所有数据资源(包括数据集和数据接口)的ID、名称、数据容量、更新频率、创建时间、最后更新时间、开放条件、承诺更新频率、数据格式、数据资源访问量和下载量。部分平台如山东、广东、广州、深圳等平台会提供EXCEL格式的开放目录,从中可以得到部分数据信息,对于缺失的数据信息和不提供开放目录的平台,则通过Python爬虫工具爬取缺失的信息。对得到的信息进行预处理,清除或填补缺失信息后,统计数据集总量、平均数据集容量、可机读数据集数量、持续更新及高频更新數据集数量、无条件开放数据集数量、平均访问量与平均下载量。典型应用数量则根据平台网站公示的典型应用案例经筛选去除无意义应用、垃圾广告应用后得到。

关于政府开放数据资源创新应用效能评估模型中的数据,省市发明专利申请量通过查阅《中国统计年鉴2021》以及各省市统计局发布的《统计年鉴2021》得到,省市高新技术企业数在各省市统计局发布的《2020年国民经济和社会发展统计公报》中查找得到,部分城市缺失的发明专利申请量及高新技术企业数信息通过查找相关新闻报道材料,提取对应数据,对缺失数据进行填充。

政府开放数据资源利用效能评估模型中投入产出指标共8个,政府开放数据资源创新应用效能评估模型中投入产出指标共5个,选择的评估样本平台数量为18个,无论在哪个评估模型中,均能满足数据包络分析中决策单元个数不少于投入产出指标总数2倍的要求。

3效率评价

3.1政府开放数据资源利用效能评价

将采集得到的政府开放数据平台数据资源信息统计整理得到的政府开放数据资源利用效能评估模型投入产出数据表,如表4所示。

为了得到具体效率情况,将以上投入产出数据表使用DEA-Solver Pro5的CCR-I模型与BCC-I模型运行,通过CCR-I模型运行结果得到综合技术效率,通过BCC-I模型运行结果得到纯技术效率与规模报酬情况。通过综合技术效率值除以纯技术效率值得到规模效率值。政府开放数据平台效率表如表5所示。

根据表5可以看出,18个政府开放数据平台的数据资源利用效率情况可以分为3类,综合技术效率、纯技术效率、规模效率均为1,即DEA有效,上海、浙江、广东等9个省市的平台属于此种情况;
综合技术效率、规模效率小于1,纯技术效率为1,福建、宁夏、厦门的平台属于此种情况;
综合技术效率、纯技术效率、规模效率均小于1,贵州、山东、天津等6个省市的平台属于此种情况,后两种情况均为DEA无效。

综合技术效率受管理、技术、规模等多个因素影响,将综合技术效率分解为规模效率与纯技术效率后,若综合技术效率不为1,纯技术效率为1,则说明投入产出结构和资源配置已达到最优状态,但规模效率为无效状态,未处于最优规模状态,表示在当前的投入产出结构下,投入的生产要素已经发挥了最大作用,但由于没有达到最优生产规模而造成DEA无效,改进方向在于生产规模的优化。若纯技术效率不为1,说明资源配置存在问题,需要改变投入要素的组合方式;
规模效率不为1,说明生产要素投入量水平需要调整;
规模报酬递减说明投入可能存在冗余,需要缩减规模。

通过DEA模型得到的效率值可以明确各个平台数据资源的DEA效率状态,通过纯技术效率值、规模效率值和规模报酬情况对DEA无效平台进行定性分析,对平台效率改进提供大致方向。通过DEA-Solver Pr05运行得到的投影结果,则可以定量分析决策单元效率不足的原因和程度,并从更具体的角度实现平台效率改进,政府开放数据资源利用效率投影结果如表6所示。

通过表6可以看出,在投入指标方面,由于可机读性、更新频率、开放条件指标是由满足相应标准的数据资源数量表示的,因此投影情况反映出这些指标的冗余实质上与数据资源数量的冗余相关,因此,所有的数据资源利用DEA无效平台在投入指标方面存在的问题为数据资源不同程度的冗余。由于政府开放数据平台在本质上属于公共服务具有特殊要求,即只要满足相关政策法规,就需要满足任何潜在用户的数据资源需求,即使某些数据资源只有个别用户群体才需要,这种类型的数据也同样需要提供。由于这种特殊要求的存在,对冗余平台数据资源进行清理显然是无法实现的,为了在一定程度上解决提供数据资源的冗余情况,实现平台的效率改进,只能从数据利用率角度人手,在提供特殊的、小众的资源同时,追踪社会热点,研究热点,对数据需求进行分析,提供社会需要、使用者需要的热点数据资源与核心数据资源。

在产出指标方面,除天津、成都和广州平台,其余DEA无效平台的数据浏览量和下载量均存在较为严重的不足,反映出平台曝光度的不足与数据资源利用率的缺乏。政府开放数据平台建设的最终目标并不仅仅是简单地将政府掌握的数据资源开放出去,而是在实现开放的基础上,引导、鼓励使用者去利用这些数据资源实现价值创造,实现数据资源对经济、公共服务和社会治理方面的促进作用。

3.2政府开放数据资源创新应用效能评价

政府开放数据资源创新应用效能评价与政府开放数据资源利用效能评价过程相同,对已收集的城市创新应用数据进行汇总整理得到政府开放数据资源创新应用效能评估模型投入产出数据表,如表7所示,使用DEA-Solver Pro5的CCR-I模型与BCC-I模型运行得到政府开放数据资源创新应用效率表,如表8所示。

对比政府开放数据资源利用效率情况与政府开放数据资源创新应用效率情况可以看出,在数据资源利用方面达到DEA有效的平台在数据资源创新应用方面未必有效,例如:上海、浙江、广西等平台;
而在数据资源利用方面处于DEA无效状态的平台在数据资源创新应用方面也未必同样无效,例如:广州、山东、天津、福建等平台。

通过对以上海平台为代表的数据资源利用有效而数据资源创新应用无效平台和以广州平台为代表的数据资源利用无效而数据资源创新应用有效平台进行综合分析对比,分析平台除开放数据资源外的其他功能模块发现,广州平台在政策咨询功能模块中提供了资讯动态、法规与政策、标准规范3种咨询信息。在资讯动态模块中提供了从2017年至今以广东省为主、其他省为辅的数据资源应用咨询,应用范围除城市创新外,还涵盖了气象、防疫、数字经济、数字安全、交通出行等多个领域;
在法规与政策模块中则提供了国家及各省市发布的包括数字资源、数字经济及数字治理等数字化相关的法规与政策;
在标准规范模块中则提供了数据资源质量评估标准和利用要求,以及平台具体的操作规范。对比上海平台,虽也有相关消息及制度保障模块,但模块所处位置并不容易发现且相关消息提供咨询超过一半为2015年平台相关数据资源开放清单,在提供咨询的时效性与丰富性上远不及广州平台;
在制度保障模块存在同样的问题,仅提供了5项相关政策,全部为上海市数据资源使用相关政策文件。通过数据资源应用相关咨询的分享,平台用户可以了解到当下数据资源应用的热点领域和前沿领域,對引导用户使用资源、提高数据资源利用率具有良好的促进作用。通过数字化相关法规与政策的发布,对平台建设、数据资源质量和用户数据利用都有较好的规范约束作用。

因此,数据资源创新应用应是一个政府部门、开放数据平台、数据资源用户相互作用的过程,其中,政府部门通过制定相关政策与法规,保证平台建设与数据资源的质量并规范用户利用资源的行为,在该过程中发挥主导作用;
开放数据平台作为核心,承载着开放数据、维护数据、引导用户、与用户互动并根据用户反馈做出相应改进等责任;
用户则是城市创新的主体,通过使用数据资源进行创新活动,实现城市创新能力的提高。

除了政府部门、开放数据平台、数据资源用户两两之间的相互作用,用户与用户之间的互动在数据资源创新应用过程中同样重要且不可忽视,虽然上海平台为用户提供的基于论坛的互动社区使用情况不佳,论坛帖子数较少,用户使用意愿不强,讨论热度不高,但仍为用户与用户之间的互动提供了渠道。用户之间的互动更有利于创意产生,同时用户之间的合作也可以实现创意的完善,实现从创意到创新的前进。

4结论与建议

本研究以上海、浙江、广州等18个省级、副省级政府开放数据平台作为研究样本,通过采集各平台数据集数量、平均数据集容量、可机读数据集数量、及时更新数据集数量、无条件开放数据集数量以及公示的典型应用数量、浏览量和下载量位列前25%的数据资源的平均浏览量和平均下载量,使用数据包络分析法对政府开放数据资源利用效率进行评估,發现上海、浙江、广东等9个省市的平台DEA有效,数据资源利用情况良好;
福建、宁夏、厦门平台虽然投入产出结构和资源配置合理,但由于未处于最优规模状态而DEA无效;
贵州、山东、天津等6个省市的平台则在投入产出结构、资源配置和规模状态都存在问题,为DEA无效状态。

为解决DEA无效平台在投入数据资源冗余方面的问题,政府应在满足任何潜在用户的数据资源需求,即不对冗余数据资源进行清理的前提下,对数据需求进行分析,提供社会需要、使用者需要的热点数据资源与核心数据资源,通过增加高使用率数据资源比例来缓解投入冗余;
为解决数据浏览量和下载量不足的问题,政府应通过适当的宣传增加曝光度,确保数据资源能被有需要的用户发现,同时加强引导,促进数据资源的利用。

在政府开放数据资源创新应用情况研究中,通过采集各平台典型应用数量、前25%的数据资源平均浏览量和平均下载量以及平台所在省市的发明专利申请量和高新技术企业数量,对政府开放数据资源创新应用情况进行评估,通过对比以上海平台为代表的数据资源利用有效但数据资源创新应用无效的平台和以广州平台为代表的数据资源创新应用有效但数据资源利用无效的平台,对两类平台具体提供的功能模块进行分析,认为应通过构建以政府部门为主导、以开放数据平台为核心、以数据资源用户为创新主体的数据资源创新应用过程,政府通过发布政策法规发挥整体规范约束作用,平台通过开放数据、维护数据、引导使用数据、根据反馈改进服务为用户创新活动的进行提供良好基础,用户以数据资源为基础,在与平台和其他用户的互动中实现创新活动,最终在数据资源创新应用过程各方参与者的相互作用下实现城市创新水平的提高。

本研究认为,政府开放数据平台建设的目标不仅仅是简单地将政府数据通过平台开放出去,而是在开放的基础上引导用户使用数据,充分发挥数据的潜在价值,相对于现有的政府开放数据平台评价研究,本研究在通过数据资源利用效能评价平台建设的同时,以城市创新应用为例对数据资源价值发挥情况进行了评价,并综合分析两次评价的结果,为政府开放数据平台建设、促进数据资源利用、提高创新应用效能提供建议。但本研究在数据资源利用效能评价中评价数据集质量时,由于对平台中每个数据集的具体质量情况进行判断十分困难,本研究仅通过数据集平均容量来衡量质量高低,这是不全面的;
同时,数据资源对城市发展的促进作用是体现在多方面的,包括对经济发展的促进作用、对社会治理的促进作用,对城市创新的促进只是其中一方面。在后续研究中将进一步完善评价体系,对数据集质量进行更全面的衡量,同时从经济、社会治理、城市创新等多角度评价数据资源对城市发展的促进作用,以得到更加全面、合理、完备的政府开放数据平台建设模式。

猜你喜欢效率评价数据包络分析我国商业银行经营效率的实证分析对外经贸(2016年11期)2017-01-12战略性新兴产业金融支持效率分析商业经济研究(2016年24期)2017-01-10“精准扶贫”背景下全社会扶贫开发投入管理体系研究武汉理工大学学报(社会科学版)(2016年6期)2017-01-10战略性新兴产业金融支持效率研究会计之友(2016年24期)2017-01-09长株潭地区高职院校旅游管理专业办学效率研究职教论坛(2016年26期)2017-01-06基于DEA方法的重庆市物流产业效率评价指标体系的构建现代经济信息(2016年8期)2016-12-26中国地区农业技术效率和技术差距研究湖北农业科学(2016年18期)2016-12-08陕西省装备制造业技术创新效率评价合作经济与科技(2016年24期)2016-12-07农业保险效率的评估指标体系研究时代金融(2016年29期)2016-12-05基于DEA模型的沈阳市城市土地利用效益分析商(2016年33期)2016-11-24

推荐访问:效能 利用 评价

版权所有:天海范文网 2010-2024 未经授权禁止复制或建立镜像[天海范文网]所有资源完全免费共享

Powered by 天海范文网 © All Rights Reserved.。鲁ICP备10209932号