回归分析法-统计

回归分析法(regression analysis method),指一种以无缺失值且与有缺失值的变量相关的变量作为自变量,建立适当的线性回归模型,对缺失值进行填补的方法。

马尔可夫链蒙特卡洛法-统计

马尔可夫链蒙特卡洛法(Markov Chain Monte Carlo method, MCMC),指如果缺失值为连续型,通过填补和后验抽样两步循环交替进行缺失值填补的方法。

完全条件定义法策略-统计

完全条件定义法策略(full conditional specification),又称“链式方程多变量插补”、“逐步回归多变量插补”,指对多变量任意缺失,且数据不满足多元正态分布或其他联合分布时,利用条件概率分布原理,基于单变量回归模型对每个变量依次弥补的方法。 ...

联合模型策略-统计

联合模型策略(joint modeling, JM),指在假定模型参数服从多元概率密度分布的情况下,从贝叶斯联合后验分布函数中抽取来做填补值的方法。

多重填补-统计

多重填补(multiple imputation, MI),又称“多重插补”,指一种通过生成多个数据集来提高缺失值估计准确性的方法。对每个缺失值用若干个可能值进行填补,再对填补后的若干个“完整”数据集分别进行分析,综合所有分析的结果,从而得到该缺失值的估计值。 ...

最差观测值结转-统计

最差观测值结转(worst observation carried forward, WOCF),又称“最差观测值向前结转”、“最差观测结转”,指采用该样本既往观测数据中,具有某种特定意义上最差涵义(如临床上测血压最大值等)的观测值替代缺失值的方法。

基线观测值结转-统计

基线观测值结转(baseline observation carried forward, BOCF),指将基线观察应答视作研究终点,是一种非随机缺失数据处理方法。

末次观测值结转-统计

末次观测值结转(last observation carried forward, LOCF), 又称“末次访视观测值向前结转”、“末次观测结转”,指一种基于最后观测值填补缺失数据的方法。当研究的某个参与者或对象在某个时间点缺失了数据时,将该参与者最后一次观察的数据应用于缺失的时间点,作为缺失值的替代。常在队列研究或临床试验中使用。 ...

观测值结转-统计

观测值结转(observation carried forward),指将先前观察到的数值、指标或特征延续到未来的时间段或不同的条件下进行分析、预测或比较的方法。

冷卡填补-统计

冷卡填补(cold-deck imputation),又称“冷卡插补”,指一种基于与缺失值样本相似的其他研究中样本的观测值来填补缺失数据的方法。

序贯热卡填补-统计

序贯热卡填补(sequential hot-deck imputation),又称“序贯热卡插补”,指对样本分层后再每层中按照某些变量对样本进行排序,对于有数据缺失的单元,用同一层中其前后相邻的若干个数据,找到使某距离函数的值达到最小的单元,该单元所对应的目标变量上的非缺失数值的方法。 ...

象限近邻填补-统计

象限近邻填补(quadrant-encapsidated-nearest-neighbor-based imputation),又称“象限近邻插补”,指一种通过找出缺失值周围一定范围内的所有最近数据点对其加权来弥补缺失值的方法。

k-最近邻填补-统计

k-最近邻填补(k- nearest neighbor imputation, KNN),指如果数据的某一变量上有缺失,找出离缺失值最近的若干个数据,用这若干数据的平均值来填充缺失值,每个样本的缺失值使用数据集中找到的这若干数据邻域的平均值进行插补。 ...

最近距离填补-统计

最近距离填补(nearest distance imputation),又称“最近距离插补”,指利用辅助变量,定义一个已观测样本之间的距离函数,在与缺失值临近的非缺失样本中,选择满足所设定距离条件的辅助变量,将这个辅助变量中的非缺失样本所对应的目标变量上的非缺失值作为填补值的一种方法。 ...

最近邻填补-统计

最近邻填补(nearest neighbor imputation),又称“最近邻插补”,指利用辅助变量定义测量间距离度量,以距离含缺失值的数据集观测距离最近的某一变量值作为插补值的方法。

随机热卡填补-统计

随机热卡填补(random hot-deck imputation),又称“随机热卡插补”,指一种基于相似性填补缺失值的插补方法,对于一个包含缺失值的数据集,在完整数据中通过特定规则找到一组与缺失值最相似的观测值,然后从这组观察值中随机选择一个来进行填充。 ...

热卡填补-统计

热卡填补(hot-deck imputation, HI),又称“热卡插补”,指一种基于相似性匹配的单一填补方法。其核心思想是从同一数据集中选择与缺失个案相似的完整个案的值进行填补。

回归填补-统计

回归填补(regression imputation),又称“回归插补”,指一种利用已知变量信息,依据变量间的关系建立回归模型并通过回归模型的预测值作为填补值的方法。

均值填补-统计

均值填补(mean imputation),又称“均值插补”,指一种直接将缺失值填补为平均值的方法。它的假设是缺失的数据在期望上与总体相等,常被应用于随机缺失和完全随机缺失的情况中。

单一填补-统计

单一填补(single imputation, SI),又称“单一插补”,指一种处理缺失数据的方法。它为数据集中的每个缺失值仅生成一个填补值,形成完整数据集后进行分析。
1 ...383940414243444546... 90下一页
×
CHARLS指标专栏

中国健康与养老追踪调查

CHARLS分析指标一应俱全,不断完善

指标按照特性多重分类,立刻存到收藏夹