沃尔德统计量-统计

沃尔德统计量(Wald statistic),又称“Wald 统计量”,指检验回归参数线性约束与非线性约束是否成立的统计量。

沃尔德检验-统计

沃尔德检验(Wald test),又称“Wald 检验”,指以测量无约束估计量与约束估计量之间距离为原理的统计检验方法,同时适用于线性与非线性的检验。

计分检验-统计

计分检验(score test),又称“得分检验”,指一种非参数统计方法,即将秩次转换为正态计分,并以此为基础计算检验统计量。

对数似然比检验-统计

对数似然比检验(log-likelihood ratio test),指运用两个对立的对数似然函数之比检测某个假设是否成立的检验方法。

似然比检验-统计

似然比检验(likelihood ratio test),指运用两个对立的似然函数之比检测某个假设是否有效的检验方法。

比值比-统计

比值比(odds ratio),又称“优势比”,指病例组暴露人数与非暴露人数的比值除以对照组暴露人数与非暴露人数的比值,是反映疾病与暴露之间关联强度的指标。

对数单位变换-统计

对数单位变换(logit transformation),又称“logit 变换”,指一种常用的数据转换方法,将一个取值范围在 0 到 1 之间的概率值,通过逻辑函数转换为取值范围为负无穷大到正无穷大的实数值。

逻辑斯谛回归-统计

逻辑斯谛回归(logistic regression),指一种用于二分类或多分类问题的广义线性模型。通过对数单位函数(logit 函数)将线性预测结果映射为概率值,描述解释变量与类别概率之间的非线性关系。采用极大似然估计等方法求解参数,输出结果具有概率解释。广泛应用于疾病诊断等分类预测领域。 ...

最大似然估计-统计

最大似然估计(maximum likelihood estimation,MLE),又用“极大似然估计”,指一种参数估计方法,通过极大化似然函数寻找最可能产生观测数据的参数值。利用样本信息,使观测数据出现的概率最大。具有一致性、渐近正态性等优良性质。广泛应用于统计学、机器学习等领域,为模型参数估计提供理论基础。 ...

连接函数-统计

连接函数(link function),指将线性预测器与响应变量的期望值关联起来的函数。通过变换响应变量,使其与线性组合的自变量相关联,常见形式包括逻辑函数、对数函数和概率单位函数。 适用于处理不同类型的响应变量,如二项分布和泊松分布,增强模型的灵活性和适应性。 ...

指数族分布-统计

指数族分布(exponential family of distributions),指一类重要的概率分布集合,概率密度函数可表示为指数形式,具有统一的数学结构,通过自然参数、充分统计量和规范化函数描述,包括正态分布、泊松分布、二项分布等。广泛应用于广义线性模型、统计力学等领域。具有共轭先验、充分统计量等良好性质,便于理论分析与计算 ...

广义线性模型-统计

广义线性模型(generalized linear regression),指一般线性模型的扩展,通过分布函数选择因变量为非正态分布;通过连接函数建立因变量的数学期望值与自变量之间的回归关系。当因变量的分布为正态分布,连接函数为恒等(Identity link)时,可简化为一般线性模型。 ...

泛化性-统计

泛化性(generalizability),指机器学习模型在面对未见过的数据时的性能表现。

外部验证-统计

外部验证(external validation),指利用独立于训练数据的外部数据集评估模型性能的方法。通过测试模型在完全未见数据上的表现,客观反映其泛化能力和实际应用效果。常用于模型最终评估和比较,结果更具说服力,但需要额外收集数据。 ...

欠拟合-统计

欠拟合(underfitting),指模型在训练数据和新数据上均表现不佳的现象。由于过于简单,模型未能充分学习数据中的潜在规律。常见于参数过少、训练时间不足的情况。可通过增加模型复杂度、延长训练时间等方法改善。

过拟合-统计

过拟合(overfitting),指模型在训练数据上表现优异,但在新数据上性能显著下降的现象。由于过度复杂,模型捕捉了训练数据中的噪声和细节,导致泛化能力差。常见于参数过多、训练时间过长的情况。可通过正则化、早停等方法缓解。 ...

内部验证-统计

内部验证(internal validation),指利用训练数据本身评估模型性能的方法。通过重采样技术如交叉验证、自助法,在训练集内部分割出验证集。提供模型泛化能力的初步估计,用于模型选择与参数调优。计算成本较高,但充分利用有限数据,评估结果相对稳定。 ...

留出法-统计

留出法(holdout method),指一种简单的模型评估方法。将数据集随机分为互斥的两部分,大部分用于训练模型,小部分用于测试模型性能。通常训练集占70-80%,测试集占 20-30%。实现简单,计算成本低,但评估结果可能受数据划分影响较大。 ...

留一法交叉验证-统计

留一法交叉验证(leave-one-out cross validation),指一种模型验证的方法,每次从包含n 个样本的数据集中留出1 个样本作为测试集,其余 n-1 个样本作为训练集,重复 n 次后以平均误差评估模型性能。其优势在于充分利用数据且无随机性,但因需训练n 次模型,计算成本较高,适用于小样本场景。 ...

K 折交叉验证-统计

K 折交叉验证(K-fold cross validation),指一种评估模型性能的交叉验证方法。将数据集均分为K 个子集,依次以其中一个子集为验证集,其余为训练集,重复 K 次训练与验证。计算 K 次结果的平均值作为模型性能指标。有效利用有限数据,提供稳定可靠的模型评估结果。 ...
1 ...686970717273747576... 90下一页