皮尔逊列联系数-统计

皮尔逊列联系数(Pearson contingency coefficient),指描述列联表中两个分类变量之间关联性的统计指标。

广义平方距离-统计

广义平方距离(generalized square distance),指为传统欧式距离的扩展,在距离计算中考虑权重或者将数据进行变换,以反应不同维度或特征的重要性。

极大似然准则-统计

极大似然准则(maximum likelihood criterion),指一种参数估计的原则,其目标是选择参数值,使得样本数据在给定模型下的似然函数达到最大化,即这组参数使观测数据在模型中的生成可能性最大。

正相关-统计

正相关(positive correlation),指当一个变量增加时,另一个变量增加,两者呈同向变化的趋势。

零相关-零相关

零相关(zero correlation),指一个变量不随另一变量的改变而改变的趋势。

双变量正态分布-统计

双变量正态分布(bivariate normal distribution),指由两个随机变量构成的联合概率分布,两个变量各自服从正态分布,且它们的任意线性组合也服从正态分布,变量间的关系通过协方差或相关系数描述,其概率密度函数呈现出特定的钟形曲面形态,体现两变量的联合变化特征。 ...

复相关-统计

复相关(multiple correlation),指研究某个变量与多个变量之间的线性相关性及其程度。

错判概率-统计

错判概率(misclassification probability),指分类模型将样本归属总体判断错误的概率。

对应分析-统计

对应分析(correspondence analysis, CA),指用于分析分类数据的多维统计方法,通过将数据表中的行和列同时映射到低维空间,揭示变量间的相似性和关联模式。生成二维或三维图示,帮助可视化分类变量之间的关系和结构。适用于频数表或计数数据的分析,提供对复杂数据集的直观解释和洞察。 ...

多重对应分析-统计

多重对应分析(multiple correspondence analysis,MCA),指分析三维及以上列联表数据关联性的方法。以点的形式在较低维的空间中表示联列表的行与列中各元素的比例结构,通过空间距离反映多个分类变量间的关系。

正交对应分析-统计

正交对应分析(canonical correspondence analysis, CCA),指一种改进的对应分析方法,通过正交变换消除维度间的相关性,使低维空间中的坐标轴相互独立。适用于复杂列联表数据的降维分析,增强可视化效果,更清晰地展示分类变量间的关联结构。 ...

因变量-统计

因变量(dependent variable),指又称“应变量,反应变量”,指在回归分析中,被预测或被解释的变量。

线性回归方程-统计

线性回归方程(linear regression equation),指利用回归分析所得到的,用于反映自变量与因变量间数量依存关系的方程式。

截距-统计

截距(intercept),指当所有自变量取值为零时,因变量的平均水平。

最小二乘法-统计

最小二乘法(least square method),指用于估计模型参数的统计方法,通过最小化观测值与预测值之间差值的平方和来确定最佳拟合线。适用于线性回归和其他模型,确保预测误差最小。

简单线性回归-统计

简单线性回归(simple linear regression),指研究两个变量之间线性关系的统计方法,其中一个为自变量,另一个为因变量。通过拟合直线,描述因变量如何随自变量的变化而变化,常用于预测和趋势分析。

偏回归系数-统计

偏回归系数(partial regression coefficient),指在多重回归分析中,某个自变量对因变量的影响。表示当方程中其他自变量保持不变时,该自变量每变化一个单位,因变量平均变化的数值。

标准化回归系数-统计

标准化回归系数(standardized regression coefficient),指消除了因变量与自变量所取量纲的影响之后的回归系数。其绝对值的大小直接反映了自变量对因变量的影响程度。

多重共线性-统计

多重共线性(multicollinearity),指在进行回归分析时,两个或多个自变量间存在高度相关,导致模型参数估计的稳定性降低与统计推断失真的现象。

两步聚类-统计

两步聚类(two-step clustering),指包含两个步骤的聚类算法。第一步,使用预处理方法将数据点分为多个较小的子集,以降低计算复杂度;第二步,在每个子类上应用聚类算法(通常使用系统聚类方法),将预处理得到的子类合并成最终的聚类结果,以进一步细化聚类结构。 ...
1 ...181920212223242526... 38下一页