k-最近邻填补
统计
定义
k-最近邻填补(k- nearest neighbor imputation, KNN),指如果数据的某一变量上有缺失,找出离缺失值最近的若干个数据,用这若干数据的平均值来填充缺失值,每个样本的缺失值使用数据集中找到的这若干数据邻域的平均值进行插补。