作者:严洁 日期:2018-11-12 10:36:50
简单地说,多重插补就是给每个缺失单元插补上多个值。主要包括插补、分析、综合三大步骤。对于多重插补,通常会有如下一系列疑问:
1. 一个缺失的单元为什么可以给出多个插补值?
2. 这些插补值是怎么计算来的?
3. 既然要插补多个值,那么需要插补多少个比较合适?
4. 插补后的数据集该怎么用?
5. 什么情况下可以用多重插补?
6. 怎样借助统计软件来做多重插补?简单地说,多重插补就是给每个缺失单元插补上多个值。主要包括插补、分析、综合三大步骤。对于多重插补,通常会有如下一系列疑问: 1. 一个缺失的单元为什么可以给出多个插补值?2. 这些插补值是怎么计算来的?3. 既然要插补多个值,那么需要插补多少个比较合适?4. 插补后的数据集该怎么用?5. 什么情况下可以用多重插补? 6. 怎样借助统计软件来做多重插补?《缺失数据的多重插补:应用案例与软件操作》这本书的主要目的就在于借助实例来解答这些问题。本书包括三个部分,在*部分主要介绍多重插补的基本原理和方法、步骤;第二部分则借助4篇精心挑选出来的文章,通过对文章的评析来进一步解答有关多重插补方法的细节问题和相应的注意事项;第三部分则讲解和示例如何用SPSS、STATA这两种统计软件来实现多重插补。
近些年来,越来越多的社会科学领域学者应用社会调查的方法来探讨中国政治、经济、社会发展过程中的理论和实践问题。但是在社会调查的数据采集过程中,由于各种原因而无法获得某个样本的任何一项回答或者无法获得样本对某个或某些个问题的回答的情况越来越多,前者称为单元无回答/单元无应答,后者称为项目无回答/题目无应答。由无回答引起的数据缺失对于后期的数据分析造成很大的影响,为此,在使用统计分析方法进行描述和推断之前,需要考虑缺失值的处理问题。对于缺失值的处理有多种方法,其中多重插补(multiple imputation)是近些年来*为广泛接受的一种方法。