验证集-统计

验证集(validation set),指用于评估和选择统计模型和机器学习模型性能的数据子集。通过测试模型在未见数据上的表现,调整超参数,防止过拟合。通常占总数据 10-20%,独立于训练集和测试集。提供模型泛化能力的初步估计,为最终模型选择提供依据。 ...

训练集-统计

训练集(training set),指用于构建和调整统计模型的数据子集。通过输入特征与对应标签,使模型和算法学习数据内在规律,优化模型参数。通常占总数据 60-80%,与验证集、测试集共同构成完整数据集。质量直接影响模型性能,需保证代表性、无偏性。 ...

交叉验证-统计

交叉验证(cross validation),指一种评估模型泛化能力的统计方法。将数据集分为训练集和验证集,多次重复训练与验证过程,计算平均性能指标。常见形式包括 k 折、留一法等。有效防止过拟合,广泛应用于机器学习、数据挖掘等领域,为模型选择与参数调优提供可靠依据。 ...

贝叶斯信息量准则-统计

贝叶斯信息量准则(Bayesian information criterion, BIC),指一种基于贝叶斯理论的模型选择标准,由吉迪思·施瓦茨(Gideon Schwarz)提出。通过惩罚复杂模型,平衡拟合优度与参数数量,选择最优模型。公式为-2 倍对数似然值加上参数个数乘以样本量的对数,值越小模型越好。适用于大样本情况下的模型比较。 ...

赤池信息量准则-统计

赤池信息量准则(Akaike information criterion, AIC),指一种评估统计模型拟合优度的标准,由日本统计学家赤池弘次提出。通过权衡模型复杂度与拟合精度,选择最优模型。公式为-2 倍对数似然值加上2 倍参数个数,惩罚过多参数以避免过拟合。值越小模型越好。广泛应用于时间序列分析、回归分析等领域。 ...

信息准则-统计

信息准则(information criterion),指用于评估统计模型优劣的标准,平衡模型复杂度与拟合精度。通过量化模型对数据的解释能力与参数数量,帮助选择最优模型,避免过拟合或欠拟合。常见形式包括赤池信息量准则、贝叶斯信息量准则等。 ...

校正决定系数-统计

校正决定系数(adjusted coefficient of determination),指用于评估回归模型解释变量对因变量解释能力的指标,考虑到随着模型自变量数目的增加,决定系数也随之逐步增加的特点,在决定系数公式中引入一个惩罚项(自由度),对决定系数进行调整后所得的值。该值小于等于决定系数。 ...

决定系数-统计

决定系数(coefficient of determination),指衡量一个回归模型对观测数据的拟合程度的统计量,可以理解为因变量的变异中被模型解释的比例。

偏残差图-统计

偏残差图(partial residual plot),指用于检测和可视化当回归模型存在其他自变量时单个自变量与因变量之间关系的图表工具,以回归模型的拟合值或单个自变量观测值为横坐标,回归模型的标准化残差为纵坐标。

标准化残差图-统计

标准化残差图(standardized residual plot),指用于评估回归模型拟合效果的诊断工具,通过绘制标准化残差与预测值或自变量的散点图,检测异常值和模型假设的偏离。标准化残差消除单位影响,便于识别非线性模式、异方差性和异常数据点。广泛应用于回归分析和模型验证,帮助改进模型拟合和提升预测准确性。 ...

残差图-统计

残差图(residual plot),指以自变量的观测值或预测值作为横坐标,将对应的残差值作为纵坐标绘制的散点图。

标准化残差-统计

标准化残差(standardized residual),指残差除以其标准差所得到的值。

残差分析-统计

残差分析(residual analysis),指利用残差提供的信息来考察模型假设合理性与数据可靠性的方法。

非线性最小二乘-统计

非线性最小二乘(non-linear least squares),指一种数学优化方法,用于估计非线性模型中的参数,以使模型的预测值与实际观测数据之间的残差平方和最小化。

线性化-统计

线性化(linearization),指将一个非线性系统、函数或方程在某一点附近近似为一个线性系统、函数或方程的过程。

非线性-统计

非线性(nonlinearity),指两个变量间的关系不遵循直线关系。

线性-统计

线性(linearity),指两个变量间的关系呈简单直线关系的性质。

正态性-统计

正态性(normality),指描述数据分布是否符合正态分布特征的统计属性。通过偏度、峰度和正态概率图等方法进行检验。适用于多种统计分析,确保模型假设的有效性。提供数据分布形态的评估依据,确保后续分析的可靠性。

异方差性-异方差性

异方差性(heteroscedasticity),指在经典线性回归模型中,假定随机扰动项具有同方差性,即给定解释变量,随机扰动项的方差等于一个常数。给定解释变量条件下,随机扰动项的方差,也就是因变量的方差,不再保持不变,便称为具有异方差性。 ...

怀特检验-统计

怀特检验(White's test),又称“White 检验”,指通过对模型残差的平方与自变量进行回归来检验异方差是否存在及检测自变量是否能够显著地解释残差方差变化的统计检验方法。
1 ...272829303132333435... 63下一页