- 基于机器学习的数据缺失值填补:理论与方法
- 赖晓晨 张立勇 刘辉 吴霞
- 150字
- 2021-03-31 21:04:27
2.1 数据缺失机制
理解数据缺失的原因对于不完整数据分析至关重要,美国学者Rubin根据缺失值成因将数据缺失问题分为3类,即完全随机缺失、随机缺失和非随机缺失[1]。上述三种数据缺失机制揭示了不完整数据集中缺失值与现有值之间的关系,为缺失值填补方法的设计与应用提供了良好的理论基础。下面对3种数据缺失机制分别展开介绍。
理解数据缺失的原因对于不完整数据分析至关重要,美国学者Rubin根据缺失值成因将数据缺失问题分为3类,即完全随机缺失、随机缺失和非随机缺失[1]。上述三种数据缺失机制揭示了不完整数据集中缺失值与现有值之间的关系,为缺失值填补方法的设计与应用提供了良好的理论基础。下面对3种数据缺失机制分别展开介绍。