2.13 术语表

  • 区间(bin)

    将相近数值进行分组的范围。

  • 集中趋势(central tendency)

    样本或总体的一种特征,直观来说就是最能代表平均水平的值。

  • 临床上有重要意义(clinically significant)

    分组间差异等跟实践操作有关的结果。

  • 条件概率(conditional probability)

    某些条件成立的情况下计算出的概率。

  • 分布(distribution)

    对样本中的各个值及其频数或概率的总结。

  • 频数(frequency)

    样本中某个值的出现次数。

  • 直方图(histogram)

    从值到频数的映射,或者表示这种映射关系的图形。

  • 众数(mode)

    样本中频数最高的值。

  • 归一化(normalization)

    将频数除以样本大小得到概率的过程。

  • 异常值(outlier)

    远离集中趋势的值。

  • 概率(probability)

    频数除以样本大小即得到概率。

  • 概率质量函数(Probability Mass Function,PMF)

    以函数的形式表示分布,该函数将值映射到概率。

  • 相对风险(relative risk)

    两个概率的比值,通常用于衡量两个分布的差异。

  • 分散(spread)

    样本或总体的特征,直观来说就是数据的变动有多大。

  • 标准差(standard deviation)

    方差的平方根,也是分散的一种度量。

  • 修剪(trim)

    删除数据集中的异常值。

  • 方差(variance)

    用于量化分散程度的汇总统计量。