2.1 数据缺失机制

理解数据缺失的原因对于不完整数据分析至关重要,美国学者Rubin根据缺失值成因将数据缺失问题分为3类,即完全随机缺失、随机缺失和非随机缺失[1]。上述三种数据缺失机制揭示了不完整数据集中缺失值与现有值之间的关系,为缺失值填补方法的设计与应用提供了良好的理论基础。下面对3种数据缺失机制分别展开介绍。