卫生统计学 - 词条分类 - 公卫百科

留一法交叉验证-统计

留一法交叉验证（leave-one-out cross validation），指一种模型验证的方法，每次从包含n 个样本的数据集中留出1 个样本作为测试集，其余 n-1 个样本作为训练集，重复 n 次后以平均误差评估模型性能。其优势在于充分利用数据且无随机性，但因需训练n 次模型，计算成本较高，适用于小样本场景。 ...

定义

K 折交叉验证-统计

K 折交叉验证（K-fold cross validation），指一种评估模型性能的交叉验证方法。将数据集均分为K 个子集，依次以其中一个子集为验证集，其余为训练集，重复 K 次训练与验证。计算 K 次结果的平均值作为模型性能指标。有效利用有限数据，提供稳定可靠的模型评估结果。 ...

定义

测试集-统计

测试集（testing set），指用于最终评估统计模型和机器学习模型性能的独立数据子集。通过模拟真实应用场景，测试模型在完全未见数据上的泛化能力。通常占总数据 10-20%，仅在模型训练和调优完成后使用。提供模型性能的客观评价，反映实际应用效果。 ...

定义

验证集-统计

验证集（validation set），指用于评估和选择统计模型和机器学习模型性能的数据子集。通过测试模型在未见数据上的表现，调整超参数，防止过拟合。通常占总数据 10-20%，独立于训练集和测试集。提供模型泛化能力的初步估计，为最终模型选择提供依据。 ...

定义

训练集-统计

训练集（training set），指用于构建和调整统计模型的数据子集。通过输入特征与对应标签，使模型和算法学习数据内在规律，优化模型参数。通常占总数据 60-80%，与验证集、测试集共同构成完整数据集。质量直接影响模型性能，需保证代表性、无偏性。 ...

定义

交叉验证-统计

交叉验证（cross validation），指一种评估模型泛化能力的统计方法。将数据集分为训练集和验证集，多次重复训练与验证过程，计算平均性能指标。常见形式包括 k 折、留一法等。有效防止过拟合，广泛应用于机器学习、数据挖掘等领域，为模型选择与参数调优提供可靠依据。 ...

定义

贝叶斯信息量准则-统计

贝叶斯信息量准则（Bayesian information criterion, BIC），指一种基于贝叶斯理论的模型选择标准，由吉迪思·施瓦茨(Gideon Schwarz)提出。通过惩罚复杂模型，平衡拟合优度与参数数量，选择最优模型。公式为-2 倍对数似然值加上参数个数乘以样本量的对数，值越小模型越好。适用于大样本情况下的模型比较。 ...

定义

赤池信息量准则-统计

赤池信息量准则（Akaike information criterion, AIC），指一种评估统计模型拟合优度的标准，由日本统计学家赤池弘次提出。通过权衡模型复杂度与拟合精度，选择最优模型。公式为-2 倍对数似然值加上2 倍参数个数，惩罚过多参数以避免过拟合。值越小模型越好。广泛应用于时间序列分析、回归分析等领域。 ...

定义

信息准则-统计

信息准则（information criterion），指用于评估统计模型优劣的标准，平衡模型复杂度与拟合精度。通过量化模型对数据的解释能力与参数数量，帮助选择最优模型，避免过拟合或欠拟合。常见形式包括赤池信息量准则、贝叶斯信息量准则等。 ...

定义

校正决定系数-统计

校正决定系数（adjusted coefficient of determination），指用于评估回归模型解释变量对因变量解释能力的指标，考虑到随着模型自变量数目的增加，决定系数也随之逐步增加的特点，在决定系数公式中引入一个惩罚项（自由度），对决定系数进行调整后所得的值。该值小于等于决定系数。 ...

定义

决定系数-统计

决定系数（coefficient of determination），指衡量一个回归模型对观测数据的拟合程度的统计量，可以理解为因变量的变异中被模型解释的比例。

定义

偏残差图-统计

偏残差图（partial residual plot），指用于检测和可视化当回归模型存在其他自变量时单个自变量与因变量之间关系的图表工具，以回归模型的拟合值或单个自变量观测值为横坐标，回归模型的标准化残差为纵坐标。

定义

标准化残差图-统计

标准化残差图（standardized residual plot），指用于评估回归模型拟合效果的诊断工具，通过绘制标准化残差与预测值或自变量的散点图，检测异常值和模型假设的偏离。标准化残差消除单位影响，便于识别非线性模式、异方差性和异常数据点。广泛应用于回归分析和模型验证，帮助改进模型拟合和提升预测准确性。 ...

定义