热卡填补-统计

热卡填补(hot-deck imputation, HI),又称“热卡插补”,指一种基于相似性匹配的单一填补方法。其核心思想是从同一数据集中选择与缺失个案相似的完整个案的值进行填补。

回归填补-统计

回归填补(regression imputation),又称“回归插补”,指一种利用已知变量信息,依据变量间的关系建立回归模型并通过回归模型的预测值作为填补值的方法。

均值填补-统计

均值填补(mean imputation),又称“均值插补”,指一种直接将缺失值填补为平均值的方法。它的假设是缺失的数据在期望上与总体相等,常被应用于随机缺失和完全随机缺失的情况中。

单一填补-统计

单一填补(single imputation, SI),又称“单一插补”,指一种处理缺失数据的方法。它为数据集中的每个缺失值仅生成一个填补值,形成完整数据集后进行分析。

填补法-统计

填补法(imputation),又称“插补法”,指基于某种已知数据分布特征对(未观测值)缺失值进行弥补的方法。

期望值最大化法-统计

期望值最大化法(expectation maximization, EM),指一种在不完全数据情况下计算极大似然估计或者后验分布的迭代算法。数据集满足大样本、多元正态分布条件,呈任意缺失模式时,通过缺失值和模型参数间的迭代关系,在假定模型参数基础上进行缺失估计, 再利用缺失估计值修正模型参数,迭代至模型收敛。 ...

加权校正法-统计

加权校正法(weighting adjustment),指当出现缺失单元时,通过估算单元的应答率,估计缺失产生的影响,并计算出相应权重,把缺失单元的权数分解到非缺失单元上,通过增大样本中观测数据的权数,以减小由于缺失值可能对估计量带来偏差的方法。 ...

成对删除-统计

成对删除(pairwise deletion),又称“有效案例分析法”,指一种根据要做的检验所涉及的变量进行个案剔除的分析方法。比如做两个变量的相关时,仅删除在这两个变量上有缺失的个案,可最大限度地保留了数据集中的可用信息。 ...

列表删除-统计

列表删除(listwise deletion),又称“个案剔除法(case deletion method)”、“完全案例分析法”,指一种删除数据集中任何包含缺失值的个案,仅保留所有变量都完整的个案的分析方法。

删除法-统计

删除法(deletion),指直接对未观测的数据值进行排除的分析方法。

非随机缺失-统计

非随机缺失(missing not at random, MNAR),指缺失值不仅与其他变量的取值有关,也与自身变量的取值有关,此情况不可忽略缺失数据带来的影响。

随机缺失-统计

随机缺失(missing at random, MAR),指在一定条件下,缺失值与已知其他数据或变量有关,而与自身取值大小无关。

完全随机缺失-统计

完全随机缺失(missing completely at random, MCAR),指数据的缺失与已观测到和未观测到的数据均无关,所有数据缺失概率都是相同的。

任意缺失模式-统计

任意缺失模式(arbitrary missing data pattern),指对含有多个观测变量的数据各种行交换或/和列交换均不能使缺失数据呈现层级缺失的模式。即数据缺失具有偶然性,呈现没有规律可循的缺失模式。

单调缺失模式-统计

单调缺失模式(monotone missing data pattern),指在包含多个观测变量的数据集中,缺失值的出现遵循一种特定的顺序特征,如果个体在某个变量上的值缺失,则该个体在所有后续变量上的值也必将缺失。

缺失数据-统计

缺失数据(missing data),又称“缺失值(missing values)”,指一组数据中由于某种原因而缺失掉的数据。通常分为完全随机缺失、随机缺失和非随机缺失三种类型。

贝叶斯网络-统计

贝叶斯网络(Bayesian network),指一种用有向无环图描述随机变量及其条件依赖关系的概率图模型。

半朴素贝叶斯分类器-统计

半朴素贝叶斯分类器(semi-naive Bayes classifier),指放宽各个属性间属性独立性假设,适当考虑一部分属性间的相互依赖关系,放松后的朴素贝叶斯分类器。

朴素贝叶斯分类器-统计

朴素贝叶斯分类器(naive Bayes classifier),指假定给定类别标记时特征相互之间独立的贝叶斯分类器。

属性条件独立-统计

属性条件独立(attribute conditional independence), 指在给定其他属性的条件下,两个属性之间互相独立。可用于属性间依赖关系的推断,有助于理解数据关联。
1 ...808182838485868788... 147下一页