15.9 知识测试:练习

  • 练习15-1
  • 在我写这本书的时候,每个段落大概会出现三个错别字。使用泊松分布的PDF函数dpois来查看我在一个给定的段落中恰好出现三个错别字的概率。[5]

  • 一个25岁的健康女性在特定时间进行无避孕措施的性行为,则她每个月怀孕的机率为25%。使用负二项分布的CDF函数pnbinom来计算她一年后怀孕的概率。[5]

  • 你需要23个人才能使他们中的两到三个在同一天生日的机率达到50%。使用生日分布的逆CDF函数qbirthday来计算你需要多少人才会使他们在同一天生日的机率达到90%。[5]

  • 练习15-2

重新对gonorrhea数据集进行线性回归分析,只考虑15-34岁的人。观察显著的预测变量是否有所不同? [15]

附加分题:研究一下如果把交互项加入到模型中的结果是什么。[15]

  • 练习15-3

安装并加载betareg包。通过包里的betareg函数,使用beta回归来研究obama_vs_mccain数据集。把Obama一列作为响应变量。

为简单起见,去掉“District of Columbia”这个异常区间,不用考虑交互,且只包括一个民族(ethnicity)和宗教(religion)列。(种族和宗教列并非独立,因为它们代表了总体中的组成部分。)抛开政治上的理解,纯粹是为了更新模型,你可以信任其p值。提示:你需要从0到1重新调整Obama列的范围。[30]