大众创新:航班延误之候机经济学

    数据不会被它所激发的思想和创新消耗,相反,它可以为创新提供无穷的燃料。一小片合适的信息,可以促使创新迈进一大步。一组数据,可能会得到数据收集人难以想象的应用,也可能会在另一个看起来毫不相关的领域得到应用,因为这些创新型的应用,数据的能量将层层放大。19

    ——《利用数据的力量服务科学和社会》,联邦政府跨部门工作组给总统科学技术委员会的报告,2009年1月

    保“数”运动(Save the Data Campaign)
    Data.gov的发展并不是一帆风顺的。
    2011年4月,由于预算赤字,美国联邦政府被迫大幅削减开支。国会宣布,原来用于支持Data.gov、USASpending.gov等数据开放网站的3400万美元年度预算将缩减到200万美元,这意味着个别网站可能被迫关闭。
    以艾伦·米勒为首的阳光基金会立即联合13家公益组织,发起了“保数运动”。他们联合一些知名的技术精英和社会活动家,征集了3000多位公民的签名,给国会的众议长以及两党的领袖发出了公开信,要求国会在预算博弈中保护Data.gov。这场运动也受到国家公共电台等十多家媒体的报道和关注。
    次月,国会表态,该项目的预算将最少增加到800万美元。

    由政府主导、向全社会开放政府拥有的公共数据,这种做法,本身就是一种创新。但更重要的是,Data.Gov不仅仅是一个创新的结果,它的出现,代表着数据在社会的自由流动、知识向大众的自由流动,这为更多的大众创新、社会创新提供了一个平台。

    截至2011年12月,仅仅在Data.Gov网站上,就汇集了1140个应用程序和软件工具、85个手机应用插件。其中,有近300个是由民间的程序员、公益组织等社会力量自发开发的。

    本书将从中选择几个,立足细节,对美国社会如何利用公共数据进行创新做一个分析和介绍。

    候机经济学:航班延误分析系统

    近年来,因航班延误产生的机场纠纷一度在中国成为一个热点话题。

    美国的航班也有延误,但却几乎没有“罢乘”、“霸机”、冲击机场的事件。Data.gov上线以后,美国交通部开放了全美航班起飞、到达、延误的数据,有程序员立刻利用这些数据开发了一个航班延误时间的分析系统(Flyontime.us)。该系统向全社会免费开放,任何人都可以通过它查询分析全国各次航班的延误率及机场等候时间。

    这个系统上线之后,由于其简单、实用,获得了全美多个新闻报刊的报道和关注,成为很多人乘机、候机的行动指南。

    大众创新和社会创新
    大众创新,指以普通公民而不是以知识精英为主体的创新。
    社会创新(Social Innovation),是指为了解决某个社会问题、满足某种社会需要、改善某部分人群的生存状况,民间力量自发产生的一种新的思想、行动和举措。社会创新也指政府在公共政策、社会治理方面的创新。
    社会创新最著名的例子是孟加拉的乡村银行(Grameen Bank),它向贫穷的人发放不需要担保的小额贷款,以帮助穷人改善生活。其创建人Muhammad Yunus获得了2006年的诺贝尔和平奖。

    以波士顿至纽约的航线为例(起飞:Boston,Logan International;到达:New York,Kennedy International),在系统的主页上,输入机场名称,点击之后,用户可以看到不同天气、不同日期、不同时段、不同航空公司、不同航班等各种条件下飞机是否准时以及平均延误时间的数据明细。

    从以上分析可以看到,各种不同组合条件下的数据分析明细基本都有了。这些数据和分析结果,对具体一名消费者和整个社会的经济活动,会起到什么作用呢?

    一是可以帮助消费者找到表现最佳、或者最符合自己需要的航班。如果没有这些信息,消费者在选择航空公司的时候,信息是不完全、不充分的,与航空公司构成一种典型的信息不对称关系。航班的历史数据是一种有效的参考和信号,公开这些信息,弥补了消费者的信息不对称。此外,消费者在对比分析大量历史数据的基础上,自己做出判断,即使结果不尽如人意,但也感觉公平。

    Flyontime.us的界面

    大众创新:航班延误之候机经济学 - 图1

    总体情况分析

    大众创新:航班延误之候机经济学 - 图2

    按航空公司分析

    大众创新:航班延误之候机经济学 - 图3

    分析[1]:2010年从波士顿至纽约的航线总共有6735次航班,其中62%准点或提前到达,14%有20分钟以内的延误,20%有20分钟以上的延误,还有4%的航班最终取消。

    分析[2]:按航空公司排序,JetBlue公司的准点率最高,为64.4%;Pinnacle公司的最低,为15.6%。

    各种不同天气情况下的延误情况分析

    大众创新:航班延误之候机经济学 - 图4

    分析[3]:天气良好的情况下,多数航班会提前5分钟到达;下雪天,平均延误时间为7分钟,年度最糟情况为53分钟,并有7%的航班取消;雷雨天气,平均延误2分钟,最糟情况53分钟。查询的结果还向用户显示当天当地的天气情况。

    按星期和每天的时间段分析

    大众创新:航班延误之候机经济学 - 图5

    分析[4]:就一星期而言,星期六的准点率最高,为78%;星期一的准点率最低,为64%。就一天而言,每天早晨5点到6点起飞的航班准点率最高,为83%;晚上9点到10点的准点率最低,为53%。

    按节假日分析

    大众创新:航班延误之候机经济学 - 图6

    分析[5]:感恩节、圣诞节当天的飞机一般都会准点到达,但节日前后的延误情况是最严重的。圣诞节次日平均延误34分钟,最糟的情况是80分钟,还有41%的航班被取消。

    按航班分析

    大众创新:航班延误之候机经济学 - 图7

    分析[6]:全部航班的表现应有尽有。最准点的是航班Comair 6633,最不准点的是航班Delta 1807,平均延误26分钟。

    二是最大程度降低了旅客等待时间的不确定性。法国有句谚语:让别人等待的人,他的错误会遭到众人的清算。20憎恶等待,是人之常情,因为等待意味着时间流失、经济损失,不确定性的等待还往往导致精神焦虑。单次航班的延误时间似乎是随机的、无规律的,但是,当数据累积到一定程度时,航班延误时间的长短就会在统计上呈现出一种秩序和稳定。航班延误分析系统把这种统计学上“秩序和稳定”传达给了旅客,帮助他们建立正确的期待,合理安排时间,避免焦虑。

    三是有利于推动航空市场的良性竞争。航班延误分析系统按平均延误时间给相关航空公司排了“座次”。回到上面的例子,经营波士顿至纽约航线的公司共有5个。就是否准点而言,谁好谁差,几乎一目了然。此外,各次航班的表现也有明细。例如American Eagle航空公司的第4617航班,全年共有182班次,平均延误7分钟;相比之下,该公司的4614航班,全年也是182班次,但平均提前8分钟到达。这些数据,不仅是消费者的行动指南,也是各大航空公司的核心竞争指标。通过这种数据公开,无疑可以促进市场竞争,航班延迟必然逐渐下降到消费者能够接受的合理范围之内。

    其实,为了缓解航班延误的问题,美国政府也想过同样的办法。早在Data.Gov之前,国家交通安全局就在其网页上(NSA.gov)提供过一个“航班等待时间计算器”,帮助旅客估计因航班延误而导致的等待时间。2009年政府开放原始数据之后,民间开发出来的这个免费工具明显比交通安全局提供的“计算器”功能更强大、界面更友好。很快,该局便关闭了这个“计算器”。

    有评论说,开放数据是一石三鸟,不仅服务大众,刺激经济,还调动了大众创新,为政府节省了软件开发的开支。

    Flyontime.us还能够查询各个机场安检通关的时间长短,这个数据,当然是机场服务质量的一个重要指标。但这部分的数据来源,并不是政府发布的数据,而是乘客自己提交的数据。候机的乘客可以通过推特(Twitter)或者智能手机向该系统提交其在某个机场通过安全检查的时间。这些数据,通过加总和平均,成为其他用户的参考。

    当然,这又是一个大众通过网络的共同协作,改善管理、促进社会福利的例子。

    有意思的是,伴随着Data.Gov的开放,美国的航班延误率正在呈下降趋势,由2008年的27%下降到2009年的20.79%,再到2010年的20.23%。当然,原因可能是多方面的,数据开放在其中的作用大小,还有待进一步研究。

    大众创新:航班延误之候机经济学 - 图8

    联邦政府的Recalls.Gov手机界面

    大众创新:航班延误之候机经济学 - 图9

    民间开发的Recalls TM手机界面(带有商品的照片和图像)

    消费者的福音:商品召回手机查询系统

    如何避免购买到具有安全隐患和质量问题的商品,无疑是所有消费者最关心的话题,这在美国也不例外。特别是婴幼儿的食品和用品,如果有质量问题,往往成为父母亲的梦魇。

    Data.gov上线之后,各种因为质量问题而被召回的商品记录立即成为最受欢迎的数据之一。

    联邦政府共有农业部、食品药品监督局、消费者委员会等6个部门涉及商品质量和产品召回的管理工作。早期,这6个部门在各自网页上公开其管辖范围之内的问题商品的召回记录。

    2009年,为了方便用户查询,联邦政府内务部决定:在整合这些数据的基础上,开设一个专门的商品召回查询网站。在这个网站上,消费者可以对任何商品进行查询,获得其是否具有召回的记录,也可以对某一项商品进行跟踪,获得电子邮件的提示信息。

    这个系统还可以在智能手机上使用。消费者在购物时,通过在随身携带的智能手机上键入产品的名称及型号,可以在购买时直接查看该商品是否具有质量问题和被召回的历史记录。如果消费者怀疑该商品存在问题或者是被召回产品的漏网之鱼,还可以立即在线举报。

    但联邦政府开发的这个系统仅仅只能在Android(安卓)的手机上使用。

    Data.gov开放数据之后,一款基于苹果手机的新应用RecallsTM很快就被开发出来,并对全社会免费开放使用。和联邦政府开发的系统相比,该系统的功能更强大、使用更方便、界面也更绚丽,受到了消费者的莫大欢迎。

    可视化的经典:数据混搭器

    数据混搭器(Datamasher.org)是阳光基金会举办首次公共数据程序员开放大赛(App for America)的金奖作品。它之所以在众多的参赛作品中拔得头筹,原因在于,它不仅仅是一个应用程序,还是一个平台,任何一个用户都可以在它上面选择需要整合对比的公共数据组,然后产生以地图为基础的数据可视化分析。

    例如,一名用户以全美每个州为基准,整合了每百万人口发生犯罪案件的多少和各州居民拥有武器的比例两组数据,这两组数据分别来自联邦调查局和美国疾病控制中心(CDC)。下图表明,华盛顿居民的枪支拥有率为1.9%,远远低于全国平均水平,但其每百万人口的罪案数却为1414宗,居全国第一。又如密西西比州,其枪支拥有率为11.1%,居全国第二,但其每百万人口的罪案数却仅为291宗,在全国处于较低的水平。

    犯罪案件的多少和居民枪支拥有率的可视化展示

    大众创新:航班延误之候机经济学 - 图10

    这个可视化应用以直观的地图对比,想向读者证明:一个地区居民拥有枪支的多少,与该地区的治安情况没有必然的联系。

    用户不仅可以在该平台上整合、分析Data.gov上开放的数据,还可以保存自己的设计和对比,并开放给平台的其他用户,和他人共享,接受他人的评价、意见和反馈。

    截至2011年年底,该网站上已经拥有1570个不同的数据可视化应用。从一个地区空气质量与工厂数量多少的关系,到高中升学率与师资力量的关系,再到肥胖人员的数量与一个地区快餐店多少的关系,林林总总的对比和展示,有些给人直接的启示,有些发人思考,还有的令人忍俊不禁,但笑过之后又不禁感叹:社会大众蕴藏的智慧和创造力是无穷无尽的!

    注释

    01 英语原文为:“Every motivation that makes a man do something can be classified under‘survival’,‘social life’and‘entertainment’. As a result, progress is defined as reaching a higher category: not doing a thing merely for survival, but for social reasons, and then, even better, just for fun.”—The Hacker Ethic and the Spirit of the Information Age, Prologue, Linus Torvalds, 2001

    02 英语原文为:“The open society is one in which men have learned to be to some extent critical of taboos, and to base decisions on the authority of their own intelligence.”—The Open Society and Its Enemies(1945), Vol. 1, Endnotes to the Chapters: Notes to the Introduction

    03 英语原文为:“We're entering a new world in which data may be more important than software.”—Tim O'Reilly

    04 英语原文为:“Who can afford to do professional work for nothing? What hobbyist can put 3-man years into programming, finding all bugs, documenting his product and distribute for free?”—An Open Letter to Hobbyists, Bill Gate, Feb 3rd, 1976

    05 黑客(Hacker),其本意是指热衷、喜爱计算机编程、对程序设计有精深理解和高级技巧的人。

    06 英语原文为:“Given enough eyeballs, all bugs are shallow.”—The Cathedral and the Bazaar, Eric Raymond

    07 英文书名为Open Sources: Voices from the Open Source Revolution。

    08 Fallibility, Wise Men and Politics, New York Times, May 20, 2008

    09 8 Principles of Open Government Data, http://www.opengovdata.org

    10 英语原文为:“Information maintained by the Federal Government is a national asset.”—Transparency and Open Government, Memorandum for the Heads of Executive Departments and Agencies, White House, 2009

    11 英语原文为:“Change will not come if we wait for some other person or some other time. We are the ones we've been waiting for. We are the change that we seek.”—Barack Obama, speech, Feb. 5, 2008

    12 该法案全名为:Federal Funding Accountability and Transparency Act of 2006。

    13 OMB Offers an Easy Way to Follow the Money, Elizabeth Williamson, The Washington Post. December 13, 2007

    14 参见2007年11月奥巴马访问谷歌的实况录像:Candidates@Google: Barack Obama, YouTube。

    15 英语原文为:“We are democratizing data, putting the power of information in the hands of the American people.”—Vivek Kundra, January 22, 2010

    16 华盛顿特区是美国联邦政府、国会和最高法院的所在地,其地位相当于中国的北京,在英文中简称为“Washington D.C.”,这也是这个项目被简称为“DCStat”的原因。

    17 President Obama Names Vivek Kundra Chief Information Officer, the White House, March 5, 2009

    18 英语原文为:“A primary goal of Data.gov is to improve access to Federal data and expand creative use of those data beyond the walls of government by encouraging innovative ideas(e.g., web applications). Data.gov strives to make government more transparent and is committed to creating an unprecedented level of openness in Government. The openness derived from Data.gov will strengthen our Nation's democracy and promote efficiency and effectiveness in Government.”参见Data.Gov网页。

    19 英语原文为:“Data are not consumed by the ideas and innovations they spark, but are an endless fuel for creativity. A small bit of information, well found, can drive a giant leap of creativity. The power of a data set can be amplified by ingenuity through applications unimagined by the authors and distant from the original field.”—Harnessing the Power of Digital Data for Science and Society, Report of the Interagency Working Group on Digital Data to the Committee on Science of the National Science and Technology Council, Jan 2009

    20 法语原文为:On compte les défautsde qui se fait attendre.