外部验证-统计

外部验证(external validation),指利用独立于训练数据的外部数据集评估模型性能的方法。通过测试模型在完全未见数据上的表现,客观反映其泛化能力和实际应用效果。常用于模型最终评估和比较,结果更具说服力,但需要额外收集数据。 ...

区间删失-统计

区间删失(interval censoring),指在生存分析中,事件发生时间仅能确定在两个观察时间点之间,而非确切时间。常见于定期随访研究中,导致部分数据不完整。需要特殊统计方法进行处理,如特思布尔(Turnbull)算法,以确保对事件时间的准确估计。 ...

寿命表法-统计

寿命表法(life table method),指一种基于时间区间的生存率估计方法,将观察期分为若干区间,计算每个区间的存活概率、死亡风险和预期寿命。适用于大样本数据,常用于人口学、保险学和流行病学研究。

去死因寿命表-统计

去死因寿命表(cause-eliminated life table),指通过假设特定死亡原因被消除,重新计算群体生存概率和预期寿命的统计工具。用于评估特定疾病或风险因素对整体寿命的影响,帮助理解如果消除某一死因,群体寿命将如何改变。

测量偏倚-统计

测量偏倚(detection bias),指组间的结果检测存在系统差异导致的偏倚。

有限总体-统计

有限总体(finite population),是在所规定的时间、空间、人群范围内观察单位数量有 限的总体。

最大似然估计-统计

最大似然估计(maximum likelihood estimation,MLE),又用“极大似然估计”,指一种参数估计方法,通过极大化似然函数寻找最可能产生观测数据的参数值。利用样本信息,使观测数据出现的概率最大。具有一致性、渐近正态性等优良性质。广泛应用于统计学、机器学习等领域,为模型参数估计提供理论基础。 ...

准实验设计-统计

准实验设计(quasi-experimental design),指对随机对照设计的严苛条件做出一定妥协而形成的研究方案。对混杂因素的控制好于非实验设计,而差于随机对照设计的一种实验设计。

法恩-格雷检验-统计

法恩-格雷检验(Fine-Gray test),又称“Fine-Gray 检验”,指用于竞争风险模型的单因素分析的统计检验方法。

秩估计方法-统计

秩估计方法(rank based estimation procedure),指基于秩次排序的非参数估计方法。

简略寿命表-统计

简略寿命表(abridged life table),指从实足 5 岁开始以 5 岁为一个年龄组的寿命表。

空间杜宾模型-统计

空间杜宾模型(spatial Dubin model),又称“空间 Dubin 模型”,指同时考虑了因变量和自变量的空间交互效应,将因变量和自变量的空间滞后项同时纳入模型,从而形成的空间回归模型。

变量聚类-统计

变量聚类(variable clustering),又称“R 型聚类(R-type clustering)”,指基于变量之间的相似性或相关性将变量分组在一起的方法,每个聚类可以用一个单独的成分或变量来表示。

狭义遗传度-统计

狭义遗传度(narrow-sense heritability),指在特定群体中,某一性状由遗传加性效应解释的变异在全部表型变异中所占的比例。

对数变换-统计

对数变换(logarithm transformation),指对原始数据值取对数,是用于将偏态数据转换成一个新尺度的常用数据变换方法。

概念验证-统计

概念验证(proof of concept, PoC),指在早期临床研究阶段进行的验证候选药物的药理效应是否可以转化成临床获益的试验。

最终聚类中心-统计

最终聚类中心(final cluster center),指在多均值聚类迭代结束时,计算得到的代表每个类的中心点。

误差条图-统计

误差条图(error bar chart),用于展示数据变异性的统计图,通常在柱状图或折线图的基础上添加误差条。误差条表示数据的离散程度, 可反映标准差、标准误或置信区间等统计量。其长度代表数据的波动范围,有助于直观比较不同组间的差异显著性,能有效评估数据的可靠性和稳定性。 ...

测试集-统计

测试集(testing set),指用于最终评估统计模型和机器学习模型性能的独立数据子集。通过模拟真实应用场景,测试模型在完全未见数据上的泛化能力。通常占总数据 10-20%,仅在模型训练和调优完成后使用。提供模型性能的客观评价,反映实际应用效果。 ...

连接函数-统计

连接函数(link function),指将线性预测器与响应变量的期望值关联起来的函数。通过变换响应变量,使其与线性组合的自变量相关联,常见形式包括逻辑函数、对数函数和概率单位函数。 适用于处理不同类型的响应变量,如二项分布和泊松分布,增强模型的灵活性和适应性。 ...
1 ...67891011121314... 135下一页