聚类数-统计

聚类数(number of clusters),指在多均值聚类中,将数据集分为不同类的预定数量,预定的数量通常由分析人员事先决定。

BP 检验-统计

BP 检验(Breusch–Pagan test),指通过对模型残差的平方与自变量进行回归来检验线性回归模型中异方差是否存在的方法,相比怀特检验在残差平方回归模型中不包括原解释变量的平方值和交互项。

发病率比值-统计

发病率比值(incident rate ratio),指不同组别发生某疾病概率的比值。

重心距离法-统计

重心距离法(centroid neighbor),指以两个聚类的各自的重心之间的距离来进行聚类的方法。

无限总体-统计

无限总体(infinite population),是研究对象的数量不受限制,或在时间、空间、人群范围上无限制,难以准确计数全部单位的总体,通常用 于理论分析或假设场景。

格莱泽检验-统计

格莱泽检验(Glejser's test),又称“Glejser 检验”,指一种用于检验回归模型中异方差性(heteroscedasticity)的统计方法,使用残差与自变量做回归,以判断误差项的方差是否与自变量存在相关性。

正态性-统计

正态性(normality),指描述数据分布是否符合正态分布特征的统计属性。通过偏度、峰度和正态概率图等方法进行检验。适用于多种统计分析,确保模型假设的有效性。提供数据分布形态的评估依据,确保后续分析的可靠性。

极差-统计

极差(range),又称“全距”,指所有观测值中最大值与最小值的差值。其越大说明数据变异程度越大,或数据越离散。符号 R。

外部验证-统计

外部验证(external validation),指利用独立于训练数据的外部数据集评估模型性能的方法。通过测试模型在完全未见数据上的表现,客观反映其泛化能力和实际应用效果。常用于模型最终评估和比较,结果更具说服力,但需要额外收集数据。 ...

连接函数-统计

连接函数(link function),指将线性预测器与响应变量的期望值关联起来的函数。通过变换响应变量,使其与线性组合的自变量相关联,常见形式包括逻辑函数、对数函数和概率单位函数。 适用于处理不同类型的响应变量,如二项分布和泊松分布,增强模型的灵活性和适应性。 ...

对数单位变换-统计

对数单位变换(logit transformation),又称“logit 变换”,指一种常用的数据转换方法,将一个取值范围在 0 到 1 之间的概率值,通过逻辑函数转换为取值范围为负无穷大到正无穷大的实数值。

泊松回归-统计

泊松回归(Poisson regression),又称“Poisson 回归”,指因变量服从泊松离散分布的一种回归模型,可用来分析计数资料的离散分布规律。

起始事件-统计

起始事件(initial event),指在研究中,某个感兴趣的研究事件的开始,例如某健康事件的发病时间,第一次确诊时间,或接受正规治疗的时间等。

考克斯比例风险回归-统计

考克斯比例风险回归(Cox's proportional hazards regression model),又称“Cox 比例风险回归”、“Cox 回归模型”。指以生存结局和生存时间为因变量,可同时分析多个因素对生存期和生存结局的影响,可分析截尾数据,不要求数据服从特定的生存分布。 ...

系统聚类图-统计

系统聚类图(hierarchy diagram),指一种以树状形式,呈现所有样本之间的相似性和聚类结构的图,图的纵轴表示聚类的相似性度量,横轴表示样本。

快速聚类-统计

快速聚类(quick cluster),指采用近似计算、降维、采样、初始化优化等策略使得在更短时间内完成聚类分析的一类聚类算法。

强影响点-统计

强影响点(influential point),指回归分析中对模型参数估计或预测结果具有显著影响的观测点,其存在可能大幅改变回归线的斜率、截距或拟合优度。这类点通常兼具高杠杆值(自变量 X极端)和异常残差(因变量Y 偏离预测)特征,可通过库克距离、DFFITS 或 DFBETAS 等指标量化其影响程度。 ...

方差加权模型-统计

方差加权模型(variance-weighted model),指通过对观测数据进行方差加权,以提高模型预测精度和稳健性的统计方法。分配较高权重给方差较小的观测值,减少噪声对模型的影响。常用于加权最小二乘法和组合预测,适用于异方差性或数据质量不一致的情境,增强模型对不确定性和异常值的抵抗力。 ...

怀特检验-统计

怀特检验(White's test),又称“White 检验”,指通过对模型残差的平方与自变量进行回归来检验异方差是否存在及检测自变量是否能够显著地解释残差方差变化的统计检验方法。

留一法交叉验证-统计

留一法交叉验证(leave-one-out cross validation),指一种模型验证的方法,每次从包含n 个样本的数据集中留出1 个样本作为测试集,其余 n-1 个样本作为训练集,重复 n 次后以平均误差评估模型性能。其优势在于充分利用数据且无随机性,但因需训练n 次模型,计算成本较高,适用于小样本场景。 ...
1 ...3456789101112... 40下一页