进入词条
首页
论坛
疾病控制
职称考试
加入百科
家园
撰写日志
群组
软著申请
百科
学院大全
复旦导师
CHARLS分析指标
我要完善百科
考场
执业医师
中级职称
积分
购买钢镚
升级会员
导航
登录
注册
词条分类 :
全部
公卫人物
工作单位
专业词条
软件词条
期刊研究
问卷量表
指南共识
二级分类 :
全部
流行病学
卫生统计学
环境卫生学
营养学
妇幼卫生学
卫生管理学
放射卫生学
卫生毒理学
爱国卫生运动
媒介生物控制学
职业医学
热带医学
职业卫生学
伤害控制学
消毒学
地方病学
卫生工程学
儿少与学校卫生学
卫生经济学
医学信息学
社会学
食品卫生学
军事预防医学
检验医学
医学伦理学
社会医学
热门词条
最新更新
最新创建
共1788个词条
留一法交叉验证-统计
留一法交叉验证(leave-one-out cross validation),指一种模型验证的方法,每次从包含n 个样本的数据集中留出1 个样本作为测试集,其余 n-1 个样本作为训练集,重复 n 次后以平均误差评估模型性能。其优势在于充分利用数据且无随机性,但因需训练n 次模型,计算成本较高,适用于小样本场景。 ...
定义
K 折交叉验证-统计
K 折交叉验证(K-fold cross validation),指一种评估模型性能的交叉验证方法。将数据集均分为K 个子集,依次以其中一个子集为验证集,其余为训练集,重复 K 次训练与验证。计算 K 次结果的平均值作为模型性能指标。有效利用有限数据,提供稳定可靠的模型评估结果。 ...
定义
测试集-统计
测试集(testing set),指用于最终评估统计模型和机器学习模型性能的独立数据子集。通过模拟真实应用场景,测试模型在完全未见数据上的泛化能力。通常占总数据 10-20%,仅在模型训练和调优完成后使用。提供模型性能的客观评价,反映实际应用效果。 ...
定义
验证集-统计
验证集(validation set),指用于评估和选择统计模型和机器学习模型性能的数据子集。通过测试模型在未见数据上的表现,调整超参数,防止过拟合。通常占总数据 10-20%,独立于训练集和测试集。提供模型泛化能力的初步估计,为最终模型选择提供依据。 ...
定义
训练集-统计
训练集(training set),指用于构建和调整统计模型的数据子集。通过输入特征与对应标签,使模型和算法学习数据内在规律,优化模型参数。通常占总数据 60-80%,与验证集、测试集共同构成完整数据集。质量直接影响模型性能,需保证代表性、无偏性。 ...
定义
交叉验证-统计
交叉验证(cross validation),指一种评估模型泛化能力的统计方法。将数据集分为训练集和验证集,多次重复训练与验证过程,计算平均性能指标。常见形式包括 k 折、留一法等。有效防止过拟合,广泛应用于机器学习、数据挖掘等领域,为模型选择与参数调优提供可靠依据。 ...
定义
贝叶斯信息量准则-统计
贝叶斯信息量准则(Bayesian information criterion, BIC),指一种基于贝叶斯理论的模型选择标准,由吉迪思·施瓦茨(Gideon Schwarz)提出。通过惩罚复杂模型,平衡拟合优度与参数数量,选择最优模型。公式为-2 倍对数似然值加上参数个数乘以样本量的对数,值越小模型越好。适用于大样本情况下的模型比较。 ...
定义
赤池信息量准则-统计
赤池信息量准则(Akaike information criterion, AIC),指一种评估统计模型拟合优度的标准,由日本统计学家赤池弘次提出。通过权衡模型复杂度与拟合精度,选择最优模型。公式为-2 倍对数似然值加上2 倍参数个数,惩罚过多参数以避免过拟合。值越小模型越好。广泛应用于时间序列分析、回归分析等领域。 ...
定义
信息准则-统计
信息准则(information criterion),指用于评估统计模型优劣的标准,平衡模型复杂度与拟合精度。通过量化模型对数据的解释能力与参数数量,帮助选择最优模型,避免过拟合或欠拟合。常见形式包括赤池信息量准则、贝叶斯信息量准则等。 ...
定义
校正决定系数-统计
校正决定系数(adjusted coefficient of determination),指用于评估回归模型解释变量对因变量解释能力的指标,考虑到随着模型自变量数目的增加,决定系数也随之逐步增加的特点,在决定系数公式中引入一个惩罚项(自由度),对决定系数进行调整后所得的值。该值小于等于决定系数。 ...
定义
决定系数-统计
决定系数(coefficient of determination),指衡量一个回归模型对观测数据的拟合程度的统计量,可以理解为因变量的变异中被模型解释的比例。
定义
偏残差图-统计
偏残差图(partial residual plot),指用于检测和可视化当回归模型存在其他自变量时单个自变量与因变量之间关系的图表工具,以回归模型的拟合值或单个自变量观测值为横坐标,回归模型的标准化残差为纵坐标。
定义
标准化残差图-统计
标准化残差图(standardized residual plot),指用于评估回归模型拟合效果的诊断工具,通过绘制标准化残差与预测值或自变量的散点图,检测异常值和模型假设的偏离。标准化残差消除单位影响,便于识别非线性模式、异方差性和异常数据点。广泛应用于回归分析和模型验证,帮助改进模型拟合和提升预测准确性。 ...
定义
残差图-统计
残差图(residual plot),指以自变量的观测值或预测值作为横坐标,将对应的残差值作为纵坐标绘制的散点图。
定义
标准化残差-统计
标准化残差(standardized residual),指残差除以其标准差所得到的值。
定义
残差分析-统计
残差分析(residual analysis),指利用残差提供的信息来考察模型假设合理性与数据可靠性的方法。
定义
非线性最小二乘-统计
非线性最小二乘(non-linear least squares),指一种数学优化方法,用于估计非线性模型中的参数,以使模型的预测值与实际观测数据之间的残差平方和最小化。
定义
线性化-统计
线性化(linearization),指将一个非线性系统、函数或方程在某一点附近近似为一个线性系统、函数或方程的过程。
定义
非线性-统计
非线性(nonlinearity),指两个变量间的关系不遵循直线关系。
定义
线性-统计
线性(linearity),指两个变量间的关系呈简单直线关系的性质。
定义
1 ...
69
70
71
72
73
74
75
76
77
... 90
/ 90 页
下一页
×
CHARLS指标专栏
中国健康与养老追踪调查
CHARLS分析指标一应俱全,不断完善
指标按照特性多重分类,立刻存到收藏夹