- 基于机器学习的数据缺失值填补:理论与方法
- 赖晓晨 张立勇 刘辉 吴霞
- 131字
- 2021-03-31 21:04:32
3.1 基于样本间相似度的填补方法
基于样本间相似度的填补方法通过样本间相似性的挖掘,为每个不完整样本寻找一组相似样本,并根据相似样本的属性值实现缺失值填补。此类方法主要包括:均值填补法、热平台填补法、K最近邻填补法、基于聚类的填补方法。本节依次对上述方法进行详细介绍。
基于样本间相似度的填补方法通过样本间相似性的挖掘,为每个不完整样本寻找一组相似样本,并根据相似样本的属性值实现缺失值填补。此类方法主要包括:均值填补法、热平台填补法、K最近邻填补法、基于聚类的填补方法。本节依次对上述方法进行详细介绍。