开放数据的三个定律:在过去的三年中,笔者逐步深入参与到政府部门的政务公开领域―更准确的说是开放数据领域,将政府部门收集和生成的数据向普通用户免费开放,并根据各自需求进行分析,加工和使用。笔者在这方面的兴趣主要来自于之前对“技术, 开放系统及其更新换代是如何对政务工作产生影响的”课题的工作及写作经历。今年早些时候我开始向温哥华市长及议会提供咨询服务,帮助他们通过政务公开的动议(政府职员称之为“open3”),并建立开放数据门户,使之成为加拿大史上第一个市政开放数据门户。
显而易见,政务公开涉及面广,但最近的工作促使笔者尝试揭开其中开放数据方面的本质。归根结底,我们到底需要什么,而又要求得到什么?因此,当笔者出席一个由加拿大政府信息委员会办公室组织的为期一周面向议会成员,主题为“数字时代知情权的透明度”的交流活动中,与在座人士分享了这方面工作的最新进展:政务数据开放的三个定律。
1,如果数据不能被链接或索引,数据就是不存在的;
2,如果数据不是开放并且由机器可读的格式,数据就是不可使用的;
3,如果一个合法平台不允许改变数据用途,数据就是未授权使用的。
更详细的说,定律一指:数据能否被用户找到?如果用谷歌(或是其他搜索引擎)不能检索到,该数据对绝大多数普通用户在本质上就是不存在的。因此,数据提供方必须优化系统,以使数据能被各类的搜索引擎检索到。
当用户取得数据后,定律二强调要让数据变得有用, 用户必须能操作该数据。因而,用户需要能够提取数据或下载为一个实用的格式(例如:一个应用程序编程接口,订阅数据或是资料文件)。用户需要获取特定格式的数据以使他们能将之与谷歌地图或其他数据合成呈现,用Open Office阅读分析数据,或是进一步转换为其他应用程序能够接受的格式。如果在数据交流过程中用户不能使用并操作信息,该用户将在此过程中被边缘化。
最后,当用户能够获取并使用数据后,定律三强调用户需要一个合法的平台使之能够共享自己的成果,并发动其他的用户,提供新的服务或是呈现相关主题数据。这就意味着信息和数据的授权应当允许最大限度的自由,或是更加理想化的,无需授权。最好的政务信息和数据是无需进行版权保护的。带有授权信息并有意阻止用户间共享的数据缺乏效用,无法传播且备受诟病。
获取,使用数据,并共享成果。这是广大用户的需求。
当然,浏览互联网读者还能够发现其他相关的研究成果。颇为出众的一篇题为政务数据开放的8个原则,其中讨论了更多细节,更适合信息主管及其下属阅读。但如果对象是政治人物(分管总理,内阁部长或是执行主管),我发现前文三个定律更加简单实用,也更容易引起听众共鸣。
2011级博士班 邢文明供稿 刘静编辑
,