留一法交叉验证-统计

留一法交叉验证(leave-one-out cross validation),指一种模型验证的方法,每次从包含n 个样本的数据集中留出1 个样本作为测试集,其余 n-1 个样本作为训练集,重复 n 次后以平均误差评估模型性能。其优势在于充分利用数据且无随机性,但因需训练n 次模型,计算成本较高,适用于小样本场景。 ...

外部验证-统计

外部验证(external validation),指利用独立于训练数据的外部数据集评估模型性能的方法。通过测试模型在完全未见数据上的表现,客观反映其泛化能力和实际应用效果。常用于模型最终评估和比较,结果更具说服力,但需要额外收集数据。 ...

发病率比值-统计

发病率比值(incident rate ratio),指不同组别发生某疾病概率的比值。

伤残调整寿命年-统计

伤残调整寿命年(disability-adjusted life year,DALY),指又称“伤残调整生命年”。从发病到死亡所损失的全部健康寿命年,包括因早死所致的寿命损失人年总和,以及疾病所致伤残引起的健康寿命损失人年总和。

重心距离法-统计

重心距离法(centroid neighbor),指以两个聚类的各自的重心之间的距离来进行聚类的方法。

无限总体-统计

无限总体(infinite population),是研究对象的数量不受限制,或在时间、空间、人群范围上无限制,难以准确计数全部单位的总体,通常用 于理论分析或假设场景。

格莱泽检验-统计

格莱泽检验(Glejser's test),又称“Glejser 检验”,指一种用于检验回归模型中异方差性(heteroscedasticity)的统计方法,使用残差与自变量做回归,以判断误差项的方差是否与自变量存在相关性。

正态性-统计

正态性(normality),指描述数据分布是否符合正态分布特征的统计属性。通过偏度、峰度和正态概率图等方法进行检验。适用于多种统计分析,确保模型假设的有效性。提供数据分布形态的评估依据,确保后续分析的可靠性。

信息准则-统计

信息准则(information criterion),指用于评估统计模型优劣的标准,平衡模型复杂度与拟合精度。通过量化模型对数据的解释能力与参数数量,帮助选择最优模型,避免过拟合或欠拟合。常见形式包括赤池信息量准则、贝叶斯信息量准则等。 ...

连接函数-统计

连接函数(link function),指将线性预测器与响应变量的期望值关联起来的函数。通过变换响应变量,使其与线性组合的自变量相关联,常见形式包括逻辑函数、对数函数和概率单位函数。 适用于处理不同类型的响应变量,如二项分布和泊松分布,增强模型的灵活性和适应性。 ...

对数单位变换-统计

对数单位变换(logit transformation),又称“logit 变换”,指一种常用的数据转换方法,将一个取值范围在 0 到 1 之间的概率值,通过逻辑函数转换为取值范围为负无穷大到正无穷大的实数值。

累积逻辑斯谛回归模型-统计

累积逻辑斯谛回归模型(cumulative logistic regression model),又称“累积logistic 回归模型”,指因变量服从多项逻辑分布,且具有符合自然规律的多个有序类别的一类回归模型,对不同分类类别拟合的模型系数有平行斜率的假定。

泊松回归-统计

泊松回归(Poisson regression),又称“Poisson 回归”,指因变量服从泊松离散分布的一种回归模型,可用来分析计数资料的离散分布规律。

尺度皮尔逊卡方-统计

尺度皮尔逊卡方(scaled Pearson chi-square),指由数学家卡尔·皮尔逊提出,基于标准误校正的卡方统计量,反映模型的拟合离散度。

起始事件-统计

起始事件(initial event),指在研究中,某个感兴趣的研究事件的开始,例如某健康事件的发病时间,第一次确诊时间,或接受正规治疗的时间等。

考克斯比例风险回归-统计

考克斯比例风险回归(Cox's proportional hazards regression model),又称“Cox 比例风险回归”、“Cox 回归模型”。指以生存结局和生存时间为因变量,可同时分析多个因素对生存期和生存结局的影响,可分析截尾数据,不要求数据服从特定的生存分布。 ...

有活力期望寿命-统计

有活力期望寿命(active life expectancy, ALE),指基于日常生活能力量表评分测算的人群期望寿命。

系统聚类图-统计

系统聚类图(hierarchy diagram),指一种以树状形式,呈现所有样本之间的相似性和聚类结构的图,图的纵轴表示聚类的相似性度量,横轴表示样本。

快速聚类-统计

快速聚类(quick cluster),指采用近似计算、降维、采样、初始化优化等策略使得在更短时间内完成聚类分析的一类聚类算法。

抽样误差-统计

抽样误差(sampling error),指由于个体之间存在变异导致的样本统计量与总体参数之间的差异,随样本量增大而减小,反映样本代表性的不确定性。
1 ...161718192021222324... 55下一页