定量调查与定性调查:结合,组合,还是整合?

42b1ooopicfc

“定量调查与定性调查应该结合起来”这样一个命题与努力方向,其实是来源于对这两种调查方法的理解尚且不够深入。笔者以目前我国社会学界所做出的多种尝试为例,论证了它们其实都是一种组合,而不是结合,也无法结合。笔者认为进一步的发展方向应该是由定性研究来整合定量研究,而不是相反。

许多学者都主张定量调查与定性调查应该结合起来,而且提出了种种具体的方法。

这一问题又可以分为两个层次来讨论:一个是在调查的具体操作过程中两种方法如何共同使用,例如“混合研究方法”;另一个则是如何把分别获得的资料结合起来分析。笔者认为后一个层次的问题更为根本,如果做不到,那么前一层次的结合也就丧失了存在的合理性。

在这个问题上,美国学者派顿提出过四个可能的结合形式:(1)定量的研究设计,研究手段与结果分析为定性;(2)定量的研究设计与结果分析,研究手段为定性;(3)定性的研究设计,研究手段与结果分析均为定量;(4)研究设计与手段均为定性,结果分析为定量。

可是在目前我国社会学界的可见成果中,自觉地、严格地照此办理的研究很罕见,却有一些惯常的做法与各种其他方式的尝试。笔者以为,它们基本上都不是也不可能是“两者择其优而融为新物”意义上的“结合”,而仅仅是“同时分别使用不变的两物”意义上的“组合”。进一步说,我们的发展方向也不应该是“结合”,而应该是“整合”。

定性调查作为定量调查的准备

一般来说,这指的是在设计问卷之前进行定性的试调查(包括使用二手资料)。这大概是最容易被社会学界所接受的一种说法。可是笔者仍然需要质疑它。

从深度与广度来看

问卷调查一般主要是需要广度,尤其在社会学调查的问卷里,如果对于相关因素的涵盖程度不够高,或者相应的提问的备选答案没有封闭住,那么假设-检验的效果就会大受影响。因此为了设计问卷而进行的试调查必定要求尽可能多地发现各种各样的情况,多多益善。可是定性调查(尤其是个案研究)一般来说追求的是调查的深度,是对于现象的深刻理解,因此很难给问卷设计提供足够的广度。

在实践中我们经常可以看到,问卷设计者在相当大的程度上是依赖于自己的学术积累与生活积累。这与学术意义上的定性调查已经很不一样了。反过来说,问卷设计者之所以不是主要地依赖定性调查的结果,也主要是因为这个工具不那么够用。

从假设-检验的设计来看

在这方面,定性调查的必要性更加明显一些,因为只有更加深刻地理解两个变量在现实生活中的意义,才能够假设出双方之间是否可能存在着相关关系。但是至少从逻辑上来说,越是这样深刻的定性调查,其结果就越是无法作为问卷设计的基础资料,因为前者已经把工作都做完了,后者就不再需要了。如果勉强为之,就有可能设计出一种仅仅是检验已知的相关关系在统计学上是否成立的问卷调查。不好听的话就是“更加科学地发明车轮”。

笔者的建议

我们更应该在第一次问卷调查之后,把定性调查作为第二次问卷的试调查;因为这样做至少可以极大地强化对于第一次调查的解释或者质疑。例如,笔者曾经尝试提出在职业流动中的“强关系”与“弱关系”之外还存在着“无关系”与“非关系”这样两种存在,就是依据定性调查的结果,而不是问卷调查的统计分析。

“问卷调查之后的定性调查”也可以以其理解的深度来完善原来的问卷。例如笔者在《2000年中国成年人的性关系与性行为调查》的问卷中,在询问已经发生性关系的双方的首次相识途径的时候,侧重考察的是当时所处的环境与场所;但是在后来的定性研究中笔者有了新的发现,于是在《2006年中国成年人的“性”调查》的问卷中把这个提问调整为侧重考察双方当时的关系。结果我们的统计分析就更加深入一步。

可是,这种方法仅仅是分别地使用定量调查与定性调查,别说“结合”,就连“组合”也没有共时性地实现。所以笔者不再多谈。

定量调查的结果,以定性资料来补充

我们经常可以看到这样的调查报告:在列举出某项统计数字之后,接着列出一段定性调查的访谈资料记录。该作者可能认为这样就可以作为一种补充,进一步说明这个数字的深入情况或者意义、原因等等。还有的社会学调查的研究报告则是使用定性资料或者一个故事来说明整个统计分析的结果。

虽然还很少有人把这种做法明确地定义为是定量调查与定性调查的一种结合,但是如此结合的论文却在国内社会学文献中经常见到。

可是笔者认为,这两种不同性质的资料是不可以这样来使用的。这又可以分为四种情况来讨论。

第一种情况是对于单变量统计结果的“补充”。

在一般社会调查里,任何一个统计结果,除非它的绝对数是1,否则就一定是多个人的情况的汇集。可是任何一个定性访谈资料,除非是对于总体情况的总结,否则就仅仅是一个人的情况。因此如果用一个人的情况来补充、说明或者解释多个人的情况,统计口径就无法保持一致,而且很容易引起误导。

例如,统计结果是“在某个100人的总体中有5%的人是工人”,定性访谈资料描述了“王某这个工人是一个好工人”。如果把后者作为前者的细化说明,那么就很容易使人以为那5%的工人都是“好工人”。可是,那5%的工人实际上是5个人,很可能不都是“好工人”。尤其是,如果研究者没有论证这5个人与王某是同质的,那么这种“定量与定性的结合”只会引出理解上的混乱。

从根本上来说,在一般社会调查里,任何一个提问的统计结果,要说明的都仅仅是这种现象本身的分布状况,而不能说明更加深入的那个层次的任何情况。例如上面所说的“总体中有5%是工人”仅仅说明工人在总体中的比例,既不关心也无法知道这些工人里面有多少人是好工人。可是被当作“补充”的那些定性资料却是说明“王某是个好工人”。这就造成了不同层次的资料的误用,只能说明问卷设计者没有真正理解“不同层次的选项不可以放在同一个提问之中”这个问卷设计的基本功;或者没有真正理解“定性资料在于理解调查对象”这个定性调查的基本功。

可能有人认为,所补充的定性资料仅仅是一个例子,并不意味着它就一定必须代表前面那个数字所包括的所有人。可是这样一来就等于说:前面所说的所有人里面至少有一个人(或者多个人)是这样的,其余的人是什么样我们不知道。可是这种表述,能够补充说明前面的统计结果的什么情况呢?

也许有人认为,无论如何,补充的定性资料总会多给读者一些信息。这倒是对的,但是请务必不要把它作为对于统计结果的“补充、细化、说明”等等来使用,而是用来指出问卷调查的不足。以“有5%的人是工人”这个统计结果为例,如果加上“王某是个好工人”的定性调查资料,那么其意义就是:这个定性资料表明,本次问卷调查没有(或者暂时无法)考察“工人是否好工人”这个问题,留待日后努力。

笔者认为,真正能够起到“补充作用”的定性资料,应该是在发表某个统计结果的时候对于其中某些出乎意料的情况的表述。例如在上面的例子中应该是这样的补充才有意义:“总体中有5%的人是工人,但是其中至少有一位其实是在服刑期间作为工人而被劳动改造。”明眼人可以看出,这其实也是一种“道歉”,因为我们的选项是按照常识来设置的,事先没想到会有这种情况,所以只好多少有些勉强地把这个人也纳入“工人”。

第二种情况是对于原因的“补充”。

在研究实践中,我们常常可以看到一些作者使用定性访谈的资料来解释某个统计结果的形成原因。

这样做的误差可就更大了。还看上面的例子。假如定性资料是“王某之所以当工人是被老板逼迫的”,那么把这个故事附在“总体中5%是工人”这个统计结果的后面,就等于说这5个人都是由于这个同样的原因而当工人的。这怎么可能呢?除非研究者对此加以论证,否则就会形成严重的误导。

这种失误即使在很严谨的学术文章中也时有所见。其根本原因在于:任何一个通过定性调查所了解到的“原因”,必定是独特的。如果没有经过特定方法的抽样,那么不但对所有人没有代表性,就是对于同类人也不会有代表性。可是问卷调查的一切结果,反映的都是每类人的有代表性的共同情况。因此,定性调查发现的“原因”与定量调查测量到的“总体情况”永远也不会匹配。

第三种情况是对于统计分析的“补充”。

在社会学调查里,经常有作者用一个故事(或者定性资料)来说明某个整体的统计分析的结果(往往是某种相关关系)。这同样不可取,道理与上述的一样:双方的统计口径不同。例如“当工人与文化水平相关”这个命题必定来自对于所有样本的统计分析,可是我们却根本不可能证明所有被访者都有过同样的一个故事,更不要说恰好就是我们所“补充”的那个故事。

即使是使用对于调查总体的定性的“情况总结”来说明某种相关关系也不可以,除非我们能够论证出这个“情况总结”确实足以涵盖和代表该总体。例如,我们可以定性地总结出“中国工人热爱劳动”这个命题。可是如果我们把它作为“热爱劳动与工人身份相关”这个统计分析结果的补充;则等于说前一个命题也具有代表性。可惜,它作为一个定性的认识却不可能具有总体代表性。

第四种情况是算不上补充的“补充”。

还有一些处于发展阶段的调查报告,所使用的定性资料与问卷中的选项其实并没有性质上的差别。还拿上例来说,有的研究者表述为:“总体中有5%的人是工人,例如王某就是一个工人”,然后加上一段关于王某的详细的定性访谈资料。

可是,如果这段定性资料中仅仅是不断地确认王某这个人真的是一个工人而没有其他信息,那么它与问卷中的选项就是同义反复。如果具有其他信息,那么如此使用,或者一定是出现了上述的那种失误,或者就是扭曲了定性资料的信息。

所以笔者认为,可以极端地说:除非研究者对某个统计结果中所包含的每个人都进行定性访谈而且一一对应,否则就不可以使用定性资料来描述、说明、细化、解释任何一个统计结果。

定性调查中加入定量调查

这种情况似乎是主张定性研究的中国学者向定量调查的一种妥协。它就是在定性访谈中,虽然没有使用问卷,但是研究者已经有意识地询问了一些足以量化的问题,例如钱数、天数、人数等等;然后把这些信息抽取出来加以标准化再进行统计。

这当然是可以的而且往往是有益的。尤其是,对于某些人们还知之甚少的现象,为了让读者对自己所访谈的那些人的共性有一个概括的认识,就可以使用这样的统计结果来描述。例如笔者曾经对东北的103位小姐进行了定性访谈,其中有一些关于她们的流动情况的可量化内容,足以反映出她们中间存在着“职业平移”的现象。为了让读者有一个总体的认识,笔者就把相应的定性内容进行量化统计,发表出来。

严格来说,我们应该更恰当地把“在定性调查加入定量调查”理解为:在定性的研究设计指导下,在搜集资料的过程中采用了一些定量的技术或方法。两者还是没有结合,而仅仅是组合。

但是在使用这样的统计结果的时候需要说明:这并不是一个标准的定量调查的结果,因为它没有总体与代表性。因此笔者建议,最好还是把这样的统计结果当作定性的认识来使用,就是根据它来对所有调查对象的共性做出一个陈述式的判断,而不是列出一些百分比或者分布状况。例如在笔者的论文中,“东北这三个城市里的这些小姐以前大都从事过其他工作”这样一个命题,虽然是根据统计结果做出的判断,但是在表述的时候最好不直接引用任何具体数字。

从方法论的角度来说,这样得来的统计结果在严格意义上其实并不是“定性资料的量化处理”,仅仅是在定性调查中加入了定量调查,仅仅是两者的“组合”而不是“结合”。当然,组合不可能是50%对50%,因此要看整个研究更加侧重什么,再来决定把自己的这个研究定位于主要是定性调查还是定量调查。

定性资料的量化

这似乎是一个国际流行国内追赶的新潮流。但是笔者却大不以为然。一般来说,这类办法的关键点有三个:第一是“确定关键词”;第二是“检索”,第三个是“回朔”。其基本过程就是;首先确定能够代表资料的相关内容的一些关键词,然后用它们检索全文,就可以得出这些关键词的出现频次。这样就可以进行各种统计处理,然后再根据统计结果所提供的认知,返回去检索全文,找出相应的文字内容加以总结与表述。

这种“量化法”的应用前提是:它基本上仅仅适用于结构式访谈所收集的定性资料。这又是因为它有一个“命门”:在量化时,如何确定所谓的“关键词”?

从方法论的高度来看,任何一个关键词都必然是研究者自己加以人为归类的结果,不可能保持原汁原味。因此,如果非要强行量化任何一种非结构式的定性调查资料,那么无论使用什么方法来确定关键词,都将不可避免地是对于资料的某种程度上的扭曲。

例如在笔者所研究的“性”领域中,天南地北,男女老少,人们可以使用不知道多少种词汇或者非语言方式来指称“性”;其中所蕴含的意义又必然是天差地别甚至可能是南辕北辙。笔者怎么可能有任何合理性与可行标准来把这些丰富多彩的主体表述都归入“性”这个关键词进而加以量化?

当然,在结构式访谈中,这个“命门”可以有惊无险或者化险为夷,因为访谈提纲是研究者自己设定的,只要确保自己总是使用一些以不变应万变的词汇来询问对方,那么在量化访谈资料时,确定关键词就会易如反掌。

可是,第一,这与问卷调查还有多大的区别?第二,研究者所收集到的资料,究竟是被访者的主体表述,还是研究者裁剪生活的必然产物?

因此笔者主张,研究者应该在进行“定性资料的量化”时持有三种态度:其一,慎之又慎地仅仅把那些在主体表述中没有实质差异的内容加以量化;其二,对于同一类内容应该设置尽可能多的关键词;其三,随时准备彻底放弃一切量化的企图。

可是,即使经过这样严谨的处理,所有的定性资料都能被量化完吗?如果是这样,那么这个定性调查与问卷调查的差异何在?如果不是这样,那么其余那些未能被量化的资料,在分析的时候难道就弃之不用了?如是,定性资料将被严重地剪裁,本质上是一种扭曲。反之,笔者在调查实践中的经验则是:能够被量化的资料越少,就越证明该调查更加符合定性研究的目标――发现与理解研究对象的无限丰富性。

显然,所谓“定性资料的量化”,其实就是“能量化的就量化,不能量化就保持质化”。这又是一种组合,不是也不可能是结合。

两种资料的互相印证

这是我国社会学界比较常见的一种“两结合”的形式。有些研究者把定量调查的统计分析结果(例如当地的人口状况)作为自己的定性调查的背景资料来使用,也有人反过来,把定性资料(例如当地的文化特质)作为问卷调查的背景资料。

这些都是很好的方法,但是也需要注意:互相印证不等于相关分析,因此不要超越任何一种方法的边界。

在使用第一种方法的时候,研究者之所以引用某些人口统计资料,仅仅是为了表明研究者所定性调查的那些人在当地的人口分布中处于一种什么样的位置之上,而不能推导出因为他们具有这样的人口特征所以才会有这样的行为。

举例来说,笔者在定性调查某地几位“小姐”的时候发现她们吸毒。虽然笔者在报告中首先叙述了当地的背景是总共大约有30位“小姐”,在当地同龄女性中约占2%;但是这仅仅是为了表明笔者所访谈的这几位“小姐”在当地处于既不是孤零零也不是成群结队这样一种状况。笔者不可以再多走一步,既不可以由此推论出因为她们不是孤零零的所以才吸毒,也不可以认为她们由于是“一小撮人”就会吸毒。因为根据总体的人口统计资料来推论个体的任何情况都是统计学上的越界,都是犯规。

反过来也一样。如果在上述例子中,笔者是主要做问卷调查而把定性认识的当地文化特质作为背景资料,那么无论我们调查的“小姐”有多少人吸毒,也不能归结为当地的文化中存在或者不存在吸毒的风气。这不但是因为笔者没有定量调查过“当地文化”这个总体;而且也是因为拿定性调查来研究任何一种比例关系也是越界,也是犯规。

显然,这仍然是一种“组合”而不是“结合”。也就是说,这两种资料虽然可以在“两现象之间的影响”这个层次上实现互相印证,却仍然无法在“融为一体”的意义上进行内部相互关系的分析。

发展方向:整合

进一步的问题是:我们为什么不能满足于两种方法的组合,却一定要追求两者的结合呢?

讨论这个问题可以引导我们从深入分析“两者结合”的可能性出发,进一步认清楚定量调查与定性调查的不同性质,进而把两者分别做得更好,而且组合得更好。

再进一步说,这两种方法之间的关系,除了结合与组合之外,最好的前途应该是整合。

国际上的一些学者继承了韦伯所倡导的传统:社会学家应当使用不同于自然科学家的调查方法,应该在社会环境中观察与描绘人的行为。只有这样,才能发现人类社会的复杂规律,从而更好地理解人类行为的意义所在。在此传统下,不少学者从根本上反对定性调查与定量调查的“结合”,认为那不过是一种无意义的调和,甚至提出“任何研究最终都是建立在定性分析的基础上”。

笔者则进一步认为,使用定性研究的方法对这两种资料共同进行整合式的分析的可能性更大一些。这是因为,如上所述,定量研究基本上无法做到两种不同性质资料的整合研究。反过来,在定性研究看来,一切量化的统计分析结果都有可能成为我们做出某些定性判断的依据,而这些判断又应该成为我们总的定性认知的基础。也就是说,所谓整合并不是两种方法的折衷或者融合,而是在定性研究的制导下进行的“定量统计的定性化”。

渗透于定量调查中的所谓“科学主义方法论”恰恰是而且仅仅是在这样一个层次上,才在人类的认知发展过程中获得了其应有的历史意义与发展价值。

在社会实践中,哪怕是在相对更加微观的层次上,人类其实一直就是这样做的而且还将继续这样做下去,区别仅仅在于我们是否更加自觉。

作者 | 潘绥铭 黄盈盈 王东

来源 | 《中州学刊》

数据说&有礼是专业自动化调研平台,会持续分享市场调研、数据分析、市场研究等方面的干货内容。

数据说和这厮有礼是数易创研的两款产品,数据说是一个全自动化的市场调研平台,有礼是基于移动端的人群样本库。数据说和这厮有礼作为新型的市场调研产品,以快速、简洁的特色为用户所青睐。登陆数据说平台www.shujushuo.net就可以全自动化的实现问卷、采集、报告的全过程,12小时完成一项专业的调研,扫描下方二维码,获得数据说简介、产品手册、案例、优惠政策。

 

erweimashujushuo