第二节 数据来源

本书主要基于微观层面的大型社会调查数据进行分析和研究。下面将对这些数据进行介绍。

第一,中国家庭追踪调查数据。中国家庭追踪调查(China family panel studies,CFPS)是由北京大学中国社会科学调查中心实施的一项全国性社会跟踪调查。数据样本覆盖全国25个省份,调查对象包含样本家庭中的全部家庭成员。自2010年起,CFPS每两年开展一次调查访问,目前已积累了六轮调查数据。CFPS收集了包括个体、家庭及社区三个层次在内的经济活动与非经济活动数据,较好地反映了中国居民在人口、社会、经济、教育和健康等方面的特征及变迁。本书在第三章关于流动人口健康状况的描述中使用了CFPS数据。使用该数据的原因在于以下两点。其一,由于《中国卫生健康统计年鉴》等资料中并没有专门针对流动人口的健康统计,因此针对流动人口健康状况的描述目前只能基于微观调查数据;而在现有的微观调查数据中,CFPS同时满足“样本覆盖各年龄段”以及“提供样本的死亡信息”两个条件,因此可以展开预期寿命和健康预期寿命的测算。随后,考虑到健康状况分析的数据一致性,因此,对于其他健康指标的分析也沿用CFPS数据。其二,CFPS数据的追踪时间较长,在反映不同时期我国流动人口健康状况的特征方面具有一定优势。

第二,流动人口动态监测调查数据。流动人口动态监测调查(China migrants dynamic survey,CMDS)是国家卫生健康委员会自2009年起进行的大规模全国性流动人口抽样调查,调查覆盖全国31个省份和新疆生产建设兵团,访问内容不仅涵盖流动人口及其家庭成员的基本情况,还包括流动特征、流入地社会经济生活等相关信息。CMDS在常规调查外,还进行了一系列专题调查。本书在第五章、第六章的分析中采用了CMDS2017年的调查数据;在第五章的稳健性检验部分采用了CMDS2017的专题调查数据。在数据整理过程中,本书删除了重要变量数值缺失或异常的样本。需要说明的是,按照国家统计局口径,流动人口被定义为流动半年及以上的人口,其主要目的在于排除一些因求学、入伍、出差等特殊原因而发生流动的暂时流动人口。CMDS针对的是在本地居住一个月及以上的流动人口,尽管相较国家统计局口径,其对流动时间的界定更短,但在调查时CMDS已将调查对象限定为来本地目的以“生活、工作为主”的流动人口,即已排除了具有特殊流动原因的暂时流动人口。此外,CMDS2017数据中流动时间在一个月以上而未满半年的样本占据了全体样本的8.3%,直接删除这些样本可能有损样本的代表性,因此本书保留了这部分样本。

第三,本书质性研究部分的数据来自笔者于2022年10月至12月对13名流动人口的深度访谈。这13名受访者主要来自上海市、江苏省苏州市、宁夏回族自治区银川市三地。访谈多在受访者的工作地或家中进行,每位受访者接受访谈的时长为1~3小时。经受访人同意,笔者对访谈内容进行了录音。在访谈结束后,笔者还通过电话和微信与部分受访者取得联系,以补充和追加信息。访谈的文稿为质性研究的主要资料来源。为遵循学术规范,笔者使用编号对所有个案进行匿名化处理,编号依据为接受访谈的时间顺序;仅呈现市级及以上行政单位的真实名称。