本文故事取自涂子沛大数据》,讲述美国从公共数据开放网站TrackGov.us到联邦政府数据开放网站Data.Gov的故事。

随着软件开放(开源软件+自由软件)运动的风起云涌、并逐渐形成现实和得到业界广泛认可,由于软件由代码和数据组成,数据开放成为创新者的新诉求。但数据不同于代码,它涉及到的问题很广泛,因而也面临着更大的挑战和阻力。公共领域的公共数据,遂成为数据开放的排头兵。

2004年,普林斯顿大学学生Joshua Tauberer利用在校的业余时间开发了首个公共数据开放网站TrackGov.us。这是一关于国会立法法案的数据开放网站,它将国会法案由谁发起、哪些议员支持或反对、投票结果、修改次数、通过时间、法案内容及当前状态等,统统放到网上供查询、下载、邮件跟踪和重复使用。TrackGov.us不仅给学术研究提供了方便,也为个人或公司提供了查询的便利工具,更成为新闻监督的利器。

著名的O’Reilly出版社创始人、Web 2.0概念首创者Tim O’Reilly是开源运动的坚定支持者,经常赞助开源活动和会议。2007年,他召集Tauberer和其他29名公共数据开放推动者,开会制订了公共数据开放的8大原则,约定:数据必须是完整的、原始的、及时的、可读取的、机器可处理的,数据获取必须是无歧视的、数据格式必须是通用非专有的、数据必须是不需要许可的。开放数据衍生出更多话题,如开放政治、开放政府、开放媒体、开放城市等。2004年奥巴马当选联邦参议员后而成功推出的第一份法案,就是有关数据开放的《联邦资金责任透明法案》。2007年,根据该法的规定,USAspending.gov上线,成为美国联邦政府发布公共支出信息的门户,受到社会各界的极大好评,被称为“政府的Google”。美国联邦政府很早就公开发布公共支出信息,只是发布零散、不系统,可能会通过新闻发言、文字简报、电子数据等多种形式。有鉴于此,Gary Bass早在1983年创办的公益组织OMB Watch于2005年开始筹建联邦政府开支数据的查询、研究和监督网站fedspending.org,并于2006上线发布。它能够逐条跟踪、记录、分析、汇总每一笔财政支出。奥巴马数据开放法案的起草、推行和和USAspending.gov的建立,正是与OMB Watch合作之下完成的。

奥巴马参选总统的过程中说过,“人民知道得越多,政府官员才可能更加负责任。”作为重视高新技术的开放政府倡导者,2009年他上任总统后不久,就任命了首席信息官CIO Vivek Kundra和首席技术官CTO Annesh Chopra,有的联邦委员会甚至设置了首席数据官CDO (Chief Data Officer)。

    

Kundra在面试政府职位时目睹了911事件的发生,从此坚定了进入公共领域、服务社会的决心。2007年,他成为华盛顿特区的CTO。甫一上任,针对DCStat(见《数据驱动创新:从草根梦想到数据治国》)所收集整理的大量数据,他加强了的分析、使用和开放,并以此为基础建立了城市数据仓库(Citywide Data Warehouse),把各类公共数据推上互联网,允许任何人访问和下载。他将这些举措称之为“数据民主化 (Democratizing Data)”。与TrackGov.us和USAspending.gov相比,城际数据仓库开放了更广泛、更综合的数据,如学区学位情况、青少年犯罪情况、交通事故发生的时间和地段、公共场所租用情况等曾经是政府管理人员内部决策参考的“专利”数据。

作为华盛顿特区的CTO,Kundra在公共管理各环节大量使用创新技术。例如,他要求市政合同的招投标过程一律录像,并在Youtube上公开;他允许居民通过Facebook提交更换驾驶证的申请。

Kundra上任奥巴马政府CIO后不到一周,就召开了联邦政府各部门信息主管的工作会议,出台了提高绩效、增加联邦政府开放性的主体计划,也就是为联邦政府建立一个统一的数据开放平台Data.Gov,全面开放政府拥有的公共数据。不到80天,Data.Gov成功上线,包含原始数据、地理数据、数据工具三大类数据。

Data.Gov并不仅仅是一个创新成果,它代表着数据在社会的自由流动、知识向大众的自由流动,并为更多大众创新、社会创新提供了公共平台。民间程序员、公益组织等社会力量亦自发参与其中,使基于Data.Gov的应用和工具层出不穷,一时蔚然成风。

2011年,EMC公司设立数据英雄奖(Data Hero Award),以奖励那些“在大数据时代用数据对个人、组织、产业和世界产生了深远影响的从业人员”,并将首届“数据英雄奖”颁给Kundra。