第7章 发现差异

体育评论员喜欢把少数运动员捧为超级明星,或者认为其高人一等,而把其他运动员视为平均水平或角色球员。这种分类一般并不是来自于统计数据,而是来自他们看过的大量比赛。这是种“我看即我识”的心理,并非满嘴跑火车。评论员(往往)都知道自己在说些什么,通常也会考虑到数据的上下文背景。每当体育分析员查看运动员的表现数据时,必定会有人提到:“你不能只看表面的数据。正是这种不确定性让赛事变得如此美妙。”这就是统计学的魅力所在。

很明显不只是体育界才这样。也许你希望找到街区最好的餐馆,或者找出谁是店里最忠实的顾客。在这种情况下,你也许不会去为个体进行分类,而是寻找那些从同类中脱颖而出的人或事。本章将讲述如何从全体中找出满足多种标准的集合,以及利用常识找出异常值。