强影响点-统计

强影响点(influential point),指回归分析中对模型参数估计或预测结果具有显著影响的观测点,其存在可能大幅改变回归线的斜率、截距或拟合优度。这类点通常兼具高杠杆值(自变量 X极端)和异常残差(因变量Y 偏离预测)特征,可通过库克距离、DFFITS 或 DFBETAS 等指标量化其影响程度。 ...

方差加权模型-统计

方差加权模型(variance-weighted model),指通过对观测数据进行方差加权,以提高模型预测精度和稳健性的统计方法。分配较高权重给方差较小的观测值,减少噪声对模型的影响。常用于加权最小二乘法和组合预测,适用于异方差性或数据质量不一致的情境,增强模型对不确定性和异常值的抵抗力。 ...

怀特检验-统计

怀特检验(White's test),又称“White 检验”,指通过对模型残差的平方与自变量进行回归来检验异方差是否存在及检测自变量是否能够显著地解释残差方差变化的统计检验方法。

交叉验证-统计

交叉验证(cross validation),指一种评估模型泛化能力的统计方法。将数据集分为训练集和验证集,多次重复训练与验证过程,计算平均性能指标。常见形式包括 k 折、留一法等。有效防止过拟合,广泛应用于机器学习、数据挖掘等领域,为模型选择与参数调优提供可靠依据。 ...

泛化性-统计

泛化性(generalizability),指机器学习模型在面对未见过的数据时的性能表现。

指数族分布-统计

指数族分布(exponential family of distributions),指一类重要的概率分布集合,概率密度函数可表示为指数形式,具有统一的数学结构,通过自然参数、充分统计量和规范化函数描述,包括正态分布、泊松分布、二项分布等。广泛应用于广义线性模型、统计力学等领域。具有共轭先验、充分统计量等良好性质,便于理论分析与计算 ...

交叉设计的方差分析-统计

交叉设计的方差分析(analysis of variance for crossover design),指用于分析交叉试验数据的统计方法。在该设计中,受试者按特定顺序接受不同处理,通过比较阶段、处理和个体差异的变异,评估处理效应及残留效应。其优势在于控制个体变异,提高检验效能,广泛应用于医学、心理学等领域的干预研究,但需满足无携带效应和 ...

距离判别法-统计

距离判别法(distance discriminant analysis),指根据样本在空间中与各个总体相距远近来判断其属于某个总体的方法。

距离最近准则-统计

距离最近准则(minimum distance criterion),又称“最邻近方法(nearest neighbor method)”,指样本和某个总体在空间中相距最近,则判断它属于该总体的原则。

最长距离法-统计

最长距离法(furthest neighbor),指以两类中距离最远的两个样本或变量之间的距离来进行聚类的方法。

安德鲁-普雷吉邦统计量-统计

安德鲁-普雷吉邦统计量(Andrew-Pregibon statistic),又称“Andrew-Pregibon 统计量”,指用于识别对回归模型结果产生较大影响的观测值,通过检测剔除某个观测值后对模型参数估计的影响来评估该观测值对模型结果的影响程度。

序列相关-统计

序列相关(serial correlation),指时间序列中不同时间点之间的观测值的相关性。

标准化残差-统计

标准化残差(standardized residual),指残差除以其标准差所得到的值。

无进展生存时间-统计

无进展生存时间(progression-free survival),又称“无进展生存期”,指从观察起点(如随机化分组)到研究事件(如疾病)进展或终点事件发生(如因病死亡)所经历的时间,包含了疾病恶化期的概念,可用于评估一些治疗的临床效益。 ...

疾病进展时间-统计

疾病进展时间(time-to-progression),指研究对象从观察起点(如随机化分组)至终点事件(如疾病)进展恶化所经历的时间,该时间只包含了该研究事件的恶化期。

队列寿命表-统计

队列寿命表(cohort life table),又称“定群寿命表(generation life table)”,指数据由纵向观察而得,反映某一特殊人群(队列)的死亡经历。

疾病负担-统计

疾病负担(burden of disease, BOD),指疾病、伤残和过早死亡对个人、家庭及整个社会经济和卫生健康造成的负担。

系统聚类-统计

系统聚类(hierarchical clustering),又称“层次聚类”、“分层聚类”,指将相似的样本或变量进行归类的方法,先将每个被聚对象各自视为一类,然后计算各类之间的距离,将类间距离最近的两类合并成一新类;接着计算新类与其他类间的距离,再将其中最近的两类合并。重复上述过程,逐步合并至所有的被聚对象都合并为一类。 ...

R 估计-统计

R 估计(R-estimation),指基于秩统计量的估计方法,通过利用数据的秩信息而非具体数值,提供对参数的稳健估计。适用于处理异常值或非正态分布数据,减少对分布假设的依赖。广泛应用于稳健统计和非参数统计中,增强模型对数据异常和分布偏离的抵抗力,确保估计结果的可靠性和解释性。 ...

标准化残差图-统计

标准化残差图(standardized residual plot),指用于评估回归模型拟合效果的诊断工具,通过绘制标准化残差与预测值或自变量的散点图,检测异常值和模型假设的偏离。标准化残差消除单位影响,便于识别非线性模式、异方差性和异常数据点。广泛应用于回归分析和模型验证,帮助改进模型拟合和提升预测准确性。 ...
1 ...171819202122232425... 55下一页