实例3:年龄和选举
紧随奥巴马的历史性选举之后,产生了一个年轻选民在获胜联盟中发挥很大作用的推测。选举后民意测验数据显示奥巴马在年轻人当中特别受欢迎,但是这真的很有新闻价值吗?举个例子,政治顾问Mark Penn在《New York Times》的网站上写道:“显然,绝大多数年轻人都选奥巴马,但是他们也非常支持John Kerry。”Penn的看法是正确的吗?
和通常一样,做出比较的最清晰的方式是使用图形。图19-3显示了结果有四个版本:第一个版本是我们在选举夜做出的基本图形(从CNN网站上得到的选后民意调查数据),然后一个学生在Web上注意到了我们的图形,并发布了一份升级版;然后我们发布了自己的包含了更广时间序列的图形。在每个这种图形中,点和线连接,点表示共和党候选人在最近几次选举中在四个不同年龄组中每个分组所占的两党选票的比例。显然2008年是不同的,因此Mark Penn错了——这是权威人士只看数字不看宏观形势的案例。这就是所有图形的共同优势:一次性显示所有细节和模式。
要了解实际的更为宏观的状况,还需要大量的研究,而且我们并不认为这些揭示了一些简单模式的图形从任何角度可以代替有关随着年龄模式和选举的时间推移的变化模式的更严肃的研究。
图 19-3:几张显示最近几届美国总统选举的选票年龄纬度的分布模式图
左上图是我们的第一次尝试,基于即时的选后民意调查数据,在选举之夜生成的。右上图是Hober Short创建的,Hober Short是一个学生,他在Web上看到了我们的图,自己做了一个,x轴是选举时间。左下图是基于Short的图的“简洁版”,把所有四个年龄分组直接在图中的线条上标注出来。所有这些图显示了2008年相对于在其之前的两次选举的重大变化。最后,右下图把数据扩展到1988年,显示了1996年Bill Clinton也很受年轻人支持——和奥巴马一样,他也是一个年轻的民主党,对手是年老的共和党——但是没有达到奥巴马在2008年受欢迎的程度。
这些图显示了在制作即使是最简单可行的图形时的选择。正如在很多的政治背景中,最大的收入来自于组合额外的数据——在这种情况下,比较2008年和其之前的年份,比较年轻的选举人和那些年老的选举人,以及比较三个其他年龄组和另一个(在最后比较中缺乏变化性,成为特别重点研究年轻人的选票趋势的动力)。
此外,我们通过重点研究民主党而不是共和党的选票(由于奥巴马在年轻选民中很受关注,这种方式更合适)以及给图形添加更有描述性的标题来改进图形。