2.13 术语表
区间(bin)
将相近数值进行分组的范围。
集中趋势(central tendency)
样本或总体的一种特征,直观来说就是最能代表平均水平的值。
临床上有重要意义(clinically significant)
分组间差异等跟实践操作有关的结果。
条件概率(conditional probability)
某些条件成立的情况下计算出的概率。
分布(distribution)
对样本中的各个值及其频数或概率的总结。
频数(frequency)
样本中某个值的出现次数。
直方图(histogram)
从值到频数的映射,或者表示这种映射关系的图形。
众数(mode)
样本中频数最高的值。
归一化(normalization)
将频数除以样本大小得到概率的过程。
异常值(outlier)
远离集中趋势的值。
概率(probability)
频数除以样本大小即得到概率。
概率质量函数(Probability Mass Function,PMF)
以函数的形式表示分布,该函数将值映射到概率。
相对风险(relative risk)
两个概率的比值,通常用于衡量两个分布的差异。
分散(spread)
样本或总体的特征,直观来说就是数据的变动有多大。
标准差(standard deviation)
方差的平方根,也是分散的一种度量。
修剪(trim)
删除数据集中的异常值。
方差(variance)
用于量化分散程度的汇总统计量。