类间相似度计算准则-统计

类间相似度计算准则(calculation criterion of inter-class similarity),指评估不同簇或类之间的相似性或差异的标准或指标,帮助确定聚类质量的算法,特别是在没有真实类别信息的情况下。

肯德尔秩相关系数-统计

肯德尔秩相关系数(Kendall rank correlation coefficient),指简称“Kendall 秩相关系数”。衡量两个变量之间数据点的排序或排名的相似性。量化了协调对的数量(在两个变量中具有相同顺序的数据点对)和不协调对的数量(在两个变量中具有不同顺序的数据点对)。 ...

列联系数-统计

列联系数(coefficient of contigency),指用于衡量两个分类变量之间关联程度的指标。它基于列联表计算,表示变量之间的依赖关系强度。其值介于0 和 1 之间,其中 0 表示两个变量完全独立, 1表示完全依赖。

余弦相似度-统计

余弦相似度(cosine similarity),指用于衡量两个向量在多维空间中相似程度的指标,定义为这两个向量的夹角余弦值,通过向量的点积除以它们的模长的乘积计算。

皮尔逊相关系数-统计

皮尔逊相关系数(Pearson correlation coefficient),指又称“Pearson 相关系数”。用于度量两个连续型变量之间线性关联程度和方向的指标。数值介于-1 和1 之间,其中1 表示完全正相关,-1 表示完全负相关,0表示不相关。

变量间相似度-统计

变量间相似度(variable similarity),指在聚类分析中,对数据集内变量之间相似或相关性的评估。用于确定聚类过程中不同变量的相关性和重要性。

变量聚类-统计

变量聚类(variable clustering),又称“R 型聚类(R-type clustering)”,指基于变量之间的相似性或相关性将变量分组在一起的方法,每个聚类可以用一个单独的成分或变量来表示。

快速聚类-统计

快速聚类(quick cluster),指采用近似计算、降维、采样、初始化优化等策略使得在更短时间内完成聚类分析的一类聚类算法。

聚类数-统计

聚类数(number of clusters),指在多均值聚类中,将数据集分为不同类的预定数量,预定的数量通常由分析人员事先决定。

最终聚类中心-统计

最终聚类中心(final cluster center),指在多均值聚类迭代结束时,计算得到的代表每个类的中心点。

初始聚类中心-统计

初始聚类中心(initial cluster center),指在多均值聚类开始迭代前,为每个类选择的起始点。

k 均值聚类-统计

k 均值聚类(k-means clustering),指一种聚类的方法,首先指定需要划分类的个数,然后按照某种原则选择原始数据中根据预先指定分类个数的样本作为初始凝聚点;基于样本间距离,对除初始凝聚点外的所有样本进行逐个归类,将每个样本归入离初始凝聚点最近的那个类中,该类新的凝聚点更新为该类的均值。重复上述过程,直至所 ...

树状图-统计

树状图(tree diagram),表示集群(包括单个样本)间内在联系与差异的一种结构图,其中“分枝”表示较小集群,“根”表示较大集群。用于指导在聚类过程中相似性水平的选取。

系统聚类图-统计

系统聚类图(hierarchy diagram),指一种以树状形式,呈现所有样本之间的相似性和聚类结构的图,图的纵轴表示聚类的相似性度量,横轴表示样本。

系统聚类-统计

系统聚类(hierarchical clustering),又称“层次聚类”、“分层聚类”,指将相似的样本或变量进行归类的方法,先将每个被聚对象各自视为一类,然后计算各类之间的距离,将类间距离最近的两类合并成一新类;接着计算新类与其他类间的距离,再将其中最近的两类合并。重复上述过程,逐步合并至所有的被聚对象都合并为一类。 ...

离差平方和法-统计

离差平方和法(Ward's method),简称“Wald 法”,指在每个聚类中,将所有的样本点到聚类中心的距离的平方相加,再把所有聚类的离差平方和相加,得到最后的评估指标,用于评估聚类质量, 其值越小,表示聚类效果越好。

重心距离法-统计

重心距离法(centroid neighbor),指以两个聚类的各自的重心之间的距离来进行聚类的方法。

类平均法-统计

类平均法(average linkage),指以两个聚类各自的中心点(同一类中所有样本点的均值)之间的距离来进行聚类的方法。

中间距离法-统计

中间距离法(intermediate neighbor),指以两类中所有样本点之间距离的平均值来进行聚类的方法。

最长距离法-统计

最长距离法(furthest neighbor),指以两类中距离最远的两个样本或变量之间的距离来进行聚类的方法。
1 ...91011121314151617... 54下一页