卫生统计学 - 词条分类 - 公卫百科

集中趋势-统计

集中趋势（central tendency），又称“平均数（average）”，指一组数据向某一中心值靠拢的趋势，反映了一组数据中心点的位置。可用于描述变量的平均水平。

定义

留出法-统计

留出法（holdout method），指一种简单的模型评估方法。将数据集随机分为互斥的两部分，大部分用于训练模型，小部分用于测试模型性能。通常训练集占70-80%，测试集占 20-30%。实现简单，计算成本低，但评估结果可能受数据划分影响较大。 ...

定义

完备事件组-统计

完备事件组（collectively exhaustive events），指一组相互独立且互斥的事件，这组事件在一起涵盖了所有可能的结果，确保其中的任意一个事件发生的总概率为1。即，总有一个事件在该组中发生，而不会有两个或更多的事件同时发生。 ...

定义

P-P 图-统计

P-P 图（probability-probability plot），指以一份观测值从小到大的累计频率作为横坐标，以按照正态分布计算的相应累计概率作为纵坐标，把观测值表现为直角坐标系中的散点，通过判断各散点是否在第一象限紧邻45 度线来判断资料是否服从正态分布的统计图。 ...

定义

乘积极限法-统计

乘积极限法（product-limited method），又称“卡普兰-迈耶，Kaplan-Meier 法(Kaplan-Meier method)”，指通过逐步计算每个事件发生时间点的生存概率，估计生存函数的非参数统计方法。适用于右删失数据，生成阶梯形生存曲线，广泛应用于医学研究和临床试验。 ...

定义

表现偏倚-统计

表现偏倚（performance bias），指在临床试验或观察性研究中，由于干预组和对照组在实施干预以外的环节存在差异，导致结局评估失真的一种系统性误差。

定义

库克距离-统计

库克距离（Cook's distance），又称“Cook 距离”，指一种用于衡量数据集中的个别数据点对回归模型拟合结果影响程度的统计量，该值越大，表示该数据点对回归模型的拟合结果产生的影响越大。

定义

BP 检验-统计

BP 检验（Breusch–Pagan test），指通过对模型残差的平方与自变量进行回归来检验线性回归模型中异方差是否存在的方法，相比怀特检验在残差平方回归模型中不包括原解释变量的平方值和交互项。

定义

克拉默分解定理-统计

克拉默分解定理（Cramer's decomposition theorem），全称“克拉默分解定理”，指对于任何时间序列，可以分解为完全由历史信息确定的多项式确定性趋势部分和白噪声序列对应的随机波动部分。

定义

标准化死亡比-统计

标准化死亡比（standard mortality ratio），指实际上死亡数除以理论上死亡数的商，其中理论上死亡数为各人口构成组中实际人口数与标准人群中这个组死亡率乘积的总和。用来刻画实际人群与标准人群间死亡率的相对大小。

定义

期初例数-统计

期初例数（number at risk），指在某随访时间或时间段终点事件发生之前尚存活的人数。

定义

高杠杆点-统计

高杠杆点（high leveragepoints），指回归分析中自变量（X）取值极端、远离数据中心的观测点，其杠杆值显著高于平均水平。这类点可能对回归系数的估计产生较大影响，但若因变量（Y）合模型预测趋势，则未必导致模型偏差。高杠杆点需结合残差分析判断其实际影响，常用杠杆值阈值进行识别。 ...

定义

正态性-统计

正态性（normality），指描述数据分布是否符合正态分布特征的统计属性。通过偏度、峰度和正态概率图等方法进行检验。适用于多种统计分析，确保模型假设的有效性。提供数据分布形态的评估依据，确保后续分析的可靠性。

定义

哈迪-温伯格平衡-统计

哈迪-温伯格平衡（Hardy-Weinberg equilibrium），指在一个没有突变、选择和迁移的遗传漂变的无限大的随机交配群体中，一对等位基因在常染色体上遗传时，无论群体起始基因频率如何，只要经过一代的随机交配，群体的基因型频率和基因频率即达到平衡状态。 ...

定义

外部验证-统计

外部验证（external validation），指利用独立于训练数据的外部数据集评估模型性能的方法。通过测试模型在完全未见数据上的表现，客观反映其泛化能力和实际应用效果。常用于模型最终评估和比较，结果更具说服力，但需要额外收集数据。 ...

定义

区间删失-统计

区间删失（interval censoring），指在生存分析中，事件发生时间仅能确定在两个观察时间点之间，而非确切时间。常见于定期随访研究中，导致部分数据不完整。需要特殊统计方法进行处理，如特思布尔（Turnbull）算法，以确保对事件时间的准确估计。 ...

定义

寿命表法-统计

寿命表法（life table method），指一种基于时间区间的生存率估计方法，将观察期分为若干区间，计算每个区间的存活概率、死亡风险和预期寿命。适用于大样本数据，常用于人口学、保险学和流行病学研究。

定义

去死因寿命表-统计

去死因寿命表（cause-eliminated life table），指通过假设特定死亡原因被消除，重新计算群体生存概率和预期寿命的统计工具。用于评估特定疾病或风险因素对整体寿命的影响，帮助理解如果消除某一死因，群体寿命将如何改变。

定义

测量偏倚-统计

测量偏倚（detection bias），指组间的结果检测存在系统差异导致的偏倚。

定义

有限总体-统计

有限总体（finite population），是在所规定的时间、空间、人群范围内观察单位数量有限的总体。

定义