标准误-统计

标准误(standard error),指描述样本统计量(如均值)抽样分布离散程度的指标, 反映样本估计值与总体参数的接近程度。计算公式为总体标准差除以样本量的平方根。标准误越小,表明样本统计量越稳定,对总体参数的估计越精确。广泛应用于假设检验、置信区间构建等统计分析,是衡量估计可靠性的关键指标。 ...

方差齐性检验-统计

方差齐性检验(test for homogeneity of variance),指判断不同样本所来自的总体是否具有相等方差而实施的假设检验。

总体-统计

总体(population),是研究对象的全体,具有同质性和变异性的个体组成的集合。

卫生统计学-统计

卫生统计学(health statistics),应用统计学的基本原理和方法,研究健康领域中数量现象的学科。通常包括资料的搜集、整理、分析和研 究等过程。

有限总体-统计

有限总体(finite population),是在所规定的时间、空间、人群范围内观察单位数量有 限的总体。

随机误差-统计

随机误差(random error),指由不可控因素引起的测量结果与真实值之差。随机误差呈现无规律波动,具有随机性和不可预测性,可通过增加样 本量或重复测量减小其影响。

赤池信息量准则-统计

赤池信息量准则(Akaike information criterion, AIC),指一种评估统计模型拟合优度的标准,由日本统计学家赤池弘次提出。通过权衡模型复杂度与拟合精度,选择最优模型。公式为-2 倍对数似然值加上2 倍参数个数,惩罚过多参数以避免过拟合。值越小模型越好。广泛应用于时间序列分析、回归分析等领域。 ...

负二项回归-统计

负二项回归(negative binomial regression),指一种处理计数数据的广义线性模型。假设响应变量服从负二项分布,通过对数连接函数建立协变量与期望计数的关系。适用于数据过度离散的情况,比泊松回归更灵活。广泛应用于流行病学、生态学等领域,分析事件发生次数的影响因素。 ...

随机抽样-统计

随机抽样(random sampling),指从总体中抽取样本时,遵循随机原则,确保每个个体或单位具有相同的、已知的非零概率被抽中的过程,包括完全随机抽样、系统抽样、整群抽样、分层抽样等。

初始聚类中心-统计

初始聚类中心(initial cluster center),指在多均值聚类开始迭代前,为每个类选择的起始点。

变量聚类-统计

变量聚类(variable clustering),又称“R 型聚类(R-type clustering)”,指基于变量之间的相似性或相关性将变量分组在一起的方法,每个聚类可以用一个单独的成分或变量来表示。

贝叶斯信息量准则-统计

贝叶斯信息量准则(Bayesian information criterion, BIC),指一种基于贝叶斯理论的模型选择标准,由吉迪思·施瓦茨(Gideon Schwarz)提出。通过惩罚复杂模型,平衡拟合优度与参数数量,选择最优模型。公式为-2 倍对数似然值加上参数个数乘以样本量的对数,值越小模型越好。适用于大样本情况下的模型比较。 ...

验证集-统计

验证集(validation set),指用于评估和选择统计模型和机器学习模型性能的数据子集。通过测试模型在未见数据上的表现,调整超参数,防止过拟合。通常占总数据 10-20%,独立于训练集和测试集。提供模型泛化能力的初步估计,为最终模型选择提供依据。 ...

费希尔判别法-统计

费希尔判别法(Fisher discriminant analysis),又称“Fisher 判别法”,指在空间中找到一个方向,使得多组高维数据在该方向的投影彼此之间的区分度最大的方法。

最终聚类中心-统计

最终聚类中心(final cluster center),指在多均值聚类迭代结束时,计算得到的代表每个类的中心点。

离散程度-统计

离散程度(dispersion),指衡量数据集中各观测值偏离中心趋势的程度,常用指标包括方差、标准差和极差。反映数据的分散性和变异性,帮助理解数据的分布特征和波动情况。

无病生存时间-统计

无病生存时间(disease-free survival),又称“无病生存期”,指研究对象从观察起点(如随机化分组)到某终点事件(如疾病)复发或者任何原因导致的终点事件(如死亡)发生所经历的时间,常用于根治性手术治疗或放疗后的辅助治疗。 ...

广义线性模型-统计

广义线性模型(generalized linear regression),指一般线性模型的扩展,通过分布函数选择因变量为非正态分布;通过连接函数建立因变量的数学期望值与自变量之间的回归关系。当因变量的分布为正态分布,连接函数为恒等(Identity link)时,可简化为一般线性模型。 ...

中位生存时间-统计

中位生存时间(median survival time),又称“半数生存期”、“中位生存期”,指恰有一半观察对象尚存活的时间,取值越长,表示疾病的预后越好,反之亦然。

离差平方和法-统计

离差平方和法(Ward's method),简称“Wald 法”,指在每个聚类中,将所有的样本点到聚类中心的距离的平方相加,再把所有聚类的离差平方和相加,得到最后的评估指标,用于评估聚类质量, 其值越小,表示聚类效果越好。
12345678910... 36下一页