问卷调查机构慷慨公开的数据都是编排整理过的,不能保全原汁原味。使用这样的数据做研究,要尽可能找到调查时使用的原始问卷,像做文本分析或话语分析一样精读,努力做三个还原,尽量贴近实事本身(zu den Sachen selbst)。
第一,还原设计问卷的前辈学者的现实关怀、理论背景、概念框架和测量方案,推测他们的研究思路、研究假设和预期发现。在多大程度上做好这个还原,就在多大程度上变成了前辈学者的知音,也就在多大程度上把前辈学者辛辛苦苦收集的宝贵数据变成了自己的数据。
第二,还原问卷调查的语境。分析跨国跨地区调查数据的变量,不能望文生义,要仔细区分字面等值、功能等值、实质等值、概念等值。比如,问卷问对地方政府的信任,要琢磨“信任或不信任地方政府”究竟是什么意思。浅层意思值得分析,更重要的是挖掘深层意思。如果地方政府是中央政府任命的,中央政府与地方政府就有委托代理关系,对地方政府(代理人)的信任就直接折射对中央政府(委托人)的信任。如果地方政府是本地民众选举的,对地方政府的信任不直接折射对中央政府的信任,但仍然构成政体支持的关键向度。做好这个还原,就不会把字面等值与概念等值混为一谈,不会比较苹果和橙子,犯虚假等值谬误。更重要的是,做好这个还原,能在缺失字面等值变量时找到功能等值的变量作为替代(proxy),把不完整的问卷补全,当一个或半个高鹗。
第三,还原应答者的文化背景、认知背景和心理反应。把问卷答案的数字还原成变量标签,把变量标签还原成完整的命题(proposition)或陈述(statement),把单纯的命题或陈述融入多层次的段落,把多层次的段落融入复杂的文本,把复杂的文本融入文化系统和历史过程。在这个多重还原过程中,能在问卷数据的字缝里看到字,读出隐含的深层意思。做好这个还原,就不会轻率地怀疑应答者的诚信。相反,会用同理心理解应答者的答案。盯住研究课题,就不会分散注意力。有些方法论假设,比如社会期许偏误和偏好伪装,言之有理,值得重视,但不可能确切验证,是做文章的好题材,但未必是做学问的好课题。
用定性研究方法做定量研究,写出的论文才可能既有学问,也有道理(make sense)。