15.9 知识测试:练习
- 练习15-1
在我写这本书的时候,每个段落大概会出现三个错别字。使用泊松分布的PDF函数
dpois
来查看我在一个给定的段落中恰好出现三个错别字的概率。[5]一个25岁的健康女性在特定时间进行无避孕措施的性行为,则她每个月怀孕的机率为25%。使用负二项分布的CDF函数
pnbinom
来计算她一年后怀孕的概率。[5]你需要23个人才能使他们中的两到三个在同一天生日的机率达到50%。使用生日分布的逆CDF函数
qbirthday
来计算你需要多少人才会使他们在同一天生日的机率达到90%。[5]
- 练习15-2
重新对gonorrhea
数据集进行线性回归分析,只考虑15-34岁的人。观察显著的预测变量是否有所不同? [15]
附加分题:研究一下如果把交互项加入到模型中的结果是什么。[15]
- 练习15-3
安装并加载betareg
包。通过包里的betareg
函数,使用beta回归来研究obama_vs_mccain
数据集。把Obama
一列作为响应变量。
为简单起见,去掉“District of Columbia”这个异常区间,不用考虑交互,且只包括一个民族(ethnicity)和宗教(religion)列。(种族和宗教列并非独立,因为它们代表了总体中的组成部分。)抛开政治上的理解,纯粹是为了更新模型,你可以信任其p值。提示:你需要从0到1重新调整Obama
列的范围。[30]