验证集-统计

验证集(validation set),指用于评估和选择统计模型和机器学习模型性能的数据子集。通过测试模型在未见数据上的表现,调整超参数,防止过拟合。通常占总数据 10-20%,独立于训练集和测试集。提供模型泛化能力的初步估计,为最终模型选择提供依据。 ...

主分层-统计

主分层(principal stratification),指一种根据所有治疗中伴发事件的潜在发生情况,将受试者划分为不同的潜在子群体,来估计因果效应的方法。主要用于处理随机化试验中因非依从或死亡截断等问题导致的随机化被破坏的情况。

累积逻辑斯谛回归模型-统计

累积逻辑斯谛回归模型(cumulative logistic regression model),又称“累积logistic 回归模型”,指因变量服从多项逻辑分布,且具有符合自然规律的多个有序类别的一类回归模型,对不同分类类别拟合的模型系数有平行斜率的假定。

部分信息先验-统计

部分信息先验(weakly informative prior),又称“弱信息先验”,指一种基于已有知识和部分信息的先验分布。它为参数提供了某种基本的、广泛的指导或限制,但并没有强烈地偏向于任何特定值。这种先验有助于提供模型的稳定性,同时仍然允许数据对参数估计产生主导作用。 ...

恩赛因三阶段设计-统计

恩赛因三阶段设计(Ensign's three-stage design),指恩赛于 1993 年提出的一种三阶段设计方法,综合了吉亨(Gehan)第一阶段设计和西蒙(Simon)最优设计的三阶段设计方法。

典则变量-统计

典则变量(canonical variable),指在典则相关分析中,通过线性组合原始变量得到的新变量,用于最大化两组变量间的相关性。每对典则变量反映两组数据间的最强关联模式,其相关系数称为典则相关系数,常用于揭示多变量数据集间的潜在关系。 ...

对应分析图-统计

对应分析图(correspondence analysis map),指可视化二维或多维列联表数据关联性的图。以点的形式在较低维的空间中表示联列表的行与列中各元素的比例结构,通过空间距离反映两个或多个分类变量间的关系。

核匹配-统计

核匹配(kernel matching),指基于核函数,以在给定协变量下分入某处理组概率越小权重越大为原则,计算所有对照个体的加权平均值并与该处理个体进行匹配的策略。

预试验岭回归估计量-统计

预试验岭回归估计量(preliminary test ridge regression estimator, PTRRE),指在进行岭回归分析前,预先检验数据的统计特性,并根据检验结果对模型参数进行调整,最终获得的参数估计量。

平均增长速度-统计

平均增长速度(average growth rate),指动态数列中一定时间段内各个时间发展水平与前一时间发展水平之比的几何均数。用以反映所关心指标在较长一段时间内逐期平均增长变化的程度。

疾病进展时间-统计

疾病进展时间(time-to-progression),指研究对象从观察起点(如随机化分组)至终点事件(如疾病)进展恶化所经历的时间,该时间只包含了该研究事件的恶化期。

t 检验-统计

t 检验(t test),又称“学生t 检验(Student's t test)”,指在总体方差未知且样本含量较小时以t 分布为基础的检验方法。常用于两组及以下定量资料均数比较的假设检验。

方差分析-统计

方差分析(analysis of variance, ANOVA),指通过分解总变异为组间变异和组内变异,检验多个组别均值是否存在显著差异的统计方法。适用于比较三个及以上独立或相关样本的均值,广泛应用于实验设计和多组数据比较分析。

无缝设计-统计

无缝设计(seamless design),指一种将多期独立的试验合并为一个试验进行或整合多期试验数据进行分析的设计方法。主要包括操作无缝设计和推断无缝设计两种类型。

趋势面插值法-统计

趋势面插值法(trend surface interpolation),根据样本点的属性值和空间坐标的关系,对整个研究区域的样本点采用全局多项式、最小二乘法进行拟合, 生成反应要素整体渐变趋势的平滑表面,从而对未知点进行插值的一种全局多项式插值法。 ...

医疗保障统计指标-统计

医疗保障统计指标(indicators of medical insurance),指反映一定时期、一定地区内基本医保覆盖、基本医保筹资、基金使用与受益的统计指标。

结构效度-统计

结构效度(construct validity),又称“构想效度”,指测量工具效度的一种类型,用于评估量表或问卷是否真实、准确地测量了目标理论构念,并反映其内在理论结构。

相关矩阵-统计

相关矩阵(correlation matrix),指由多个变量相关系数构成的矩阵,该矩阵对角线元素为 1 且对称。

概化系数-统计

概化系数(generalizability coefficient),指用相对误差估计出来的信度系数,全域分变异与观测分期望值之比,即测量目标的有效变异与总变异的比值,反映测量的精度。

两水平模型-统计

两水平模型(two-level model),指一种用于分析具有多层次结构数据的统计模型,适用于描述数据中存在两个层次或级别的情况,其中个体或观察值被嵌套在高一级的层次单位内。
1 ...232425262728293031... 90下一页
×
CHARLS指标专栏

中国健康与养老追踪调查

CHARLS分析指标一应俱全,不断完善

指标按照特性多重分类,立刻存到收藏夹