须保持澡慎豹态度。述有,有夔阔题、尤其是人类行为问题,即使是最可靠的证据,也只能作为暂时性豹答案。溺此,在确定渺研究结果的信任度之靛,我们述有很多关于科学研究豹重臀}娜题翼卿清楚、
当传达焦氰豹人服研究结果律证据时,你必须淞热以下几点;毛研究的质薰有天壤之别;我们对科研结果的信任应当是有选择豹、不是所有的研究结果都值得镭搔。项做得很好
第9 章这些证据的可信度有多大(n )? ? ,? … 157 ? 的研究与一项做得很差的研究相比,当然应该相信前者。由于研究过程极其复杂,又受到许多外在因素的影响,即使是受过良好训练的研究人员,有时也会得出有重大缺陷的结论。因此,发表在科学杂志上的论文并不能保证该研究在关键方面没有缺陷。
2 .研究结果常常是相互矛盾的。因此,针对同一问题,一项孤立的研究常常得出有误导性的结论。由多个研究者或研究小组重复验证过的研究结果最值得我们注意。我们必须始终坚持这个问题:“其他研究者验证过这些结论吗?〃 3 .研究结果并不能证娜吉论。最多只能说,研究结果支持结论。记住,研究结果不能为自身作证!研究人员必须解释其研究结果的意义,而所有的研究结果都能用不止一种方式进行解释。因此,我们不能把研究者的结论当作“真理”来看待。当你遇到诸如“研究结果表明… … ”这样的描述时,应当把它们理解成“研究者认为,其研究结果表明… … ”
4 .与所有人一样,研究者的期望、态度、价值观和需要等使他们的提问、操作研究的方法以及解释研究结果的方式存在偏差。尽管他们尽了最大努力来避免这些偏差,但是科学事业不是中立的、没有价值取向的,也不是完全客观的。例如,科学家在某个特定假设上往往投入了个人情感。科学家和所有容易犯错误的人一样,也很难客观地对待那些与假设相矛盾的数据。科学研究的主要优点是它尽量公开研究的程序和结果,以便于其他研究者评价其价值,并能
巧8 ? 学会提问― 批利性思维指南
对它进行验证。尽管如此,无论一份科研报告看起来多么客观,它总会包含一些重要的主观成分。
5 .演讲者和作者经常歪曲或简化研究结论。传达信息的人用来支持其观点的证据与研究得到的原始结果之间可能存在巨大的差异。例如,研究者可能会在他们的原始研究报告中对结论进行仔细限定,而其他人在引用这些结论时却毫无限制。
6 .研究所得的“事实”会随时间发生变化,尤其是关于人类行为的研究。例如,以下这些研究所得的“事实”全部都被主要的科学文献报道过,却都已经被新的研究证据“否决”了:
右利手的人比左利手的人寿命更长。
拍乳房x 线照片对50 岁以下的妇女有益。
人们已经发现一种导致躁狂一抑郁症的基因。
纤维有助于防止结肠癌。
父母离婚对子女造成的破坏性影响是日渐累积的。7 .不同研究的人为性不同。通常,为了实现“控制”这一目的,研究会丢失一些“真实世界”的东西。研究的人为性越强,就越难把研究结果推广到实验室以外的世界。在关于复杂社会行为的研究中,人为性引起的问题尤其突出。例如,为了研究电视暴力的影响,研究者可能会让儿童观看暴力卡通片,然后观察他们对玩具的攻击行为。此时,我们应当思考:“对玩具的攻击行为太人为化,我们是否可以借此获得儿童在其他情境下的攻击性行为的信息?〃
第9 章这些证据的可信度有多大(n )? … … 159 ? 8 .研究者在经济收益、地位、安全及其他方面的需要会影响其研究结果。研究者是人,不是机器。要他们做到绝对的客观是极其困难的。例如,直接由某药品公司赞助的研究者,与跟药品公司没有任何私人关系的研究者相比,前者可能更多地发现该公司的药品具有积极的治疗效果。此外,获得职位和提升、道求尽可能大的收益以及赢得更大名气等方面的压力都有可能影响研究结果的客观性。正如你所看到的那样,尽管科研证据具有很多优良的特性,我们还是要避免过早地相信研究所得的结论。
评价科学研究的线索
运用以下这些问题来判断科研结果是不是可信的证据:
1 .该科研报告的来撅质量如河2 通常,最可信的科研报告发表在由同行专家评审的杂志上,一系列的相关专家对文章进行审查之后才能在这些杂志上发表。一般来说― 但也不总是这样― 杂志的声誉越好,发表在上面的研究设计就越好。因此,你应当尽可能地了解科研报告的来源是否有较好的声誉。
2 .除了来源的品质,该论文中还有没有其他线索能证明研究做得很好?例如,论戈有没有报告该研究并瓣窄出的优点2 3 .该研究得到其他人的必证了吗夕得出相同结论的研究是否不止一个?即使在“统计上达到显著水平”的情况下,研究结果也可能是由随机因素引起的。例如,如果某种关系得到设计良好的研究的反复验证,如吸烟与癌症之间的关系,那么,至少在反对此结论的人提出可靠的反驳证据之前,我们有理由相信这个结论。4 .传达信息的人如阿选择他们需要的研究呢2 例如,他们是否遗漏了与相反的结果有关的那些研究?研究者是不是只选择了支持其结论的研究?
160 ? 学会提问― 批利性思维指南
(续)
丘己有的证据是否具俏我强的批判性思维?演讲者或作者是否对支持其观点的早期研究表明了批判性态度?由于研究本身具有局限性,由研究得到的多数结论都必须限制在一定范围内,传达信息的人是否证明了自己愿意这样做呢?
6 .某些人是否存歪曲该研究的理由呢?我们必须警惕研究者刻意追求某种特定结果的情况。
7 .该研究的条件是不是人为的?有没有披歪曲呢?你必须想想,“该研究的操作条件与作者推广条件的相似程度有多大呢?〃 8 .由取样研究得到的结果,可以推广到多大的范围2 我们将在下一节里深人讨论这一问题。
9 .该研究者所使用的调查、问卷、等级评定或其他冽量手段是否存在偏差或关真2 我们必须确认,研究者对其想测量的东西进行了准确的测量。在研究中,调查与问卷存在偏差的问题是很普遍的,随后我们将进行更详细的讨论。
取样研究的推r
演讲者和作者经常运用研究报告来支持其结论的泛化,即声明其发现的事件具有普遍性。例如,“琼斯夫妇离婚对他们家的孩子产生了不良影响”不是一个泛化的结论,而“父母离婚对子女有不良影响”就是一个泛化的结论。对研究结论的泛化程度依赖于研究者选择的事件或被试的数量、广度和随机性。
根据研究目的选择事件或被试的过程称为抽样。
由于研究者不可能对所有的事或人进行研究,所以研究者必须选用某种方法,从其想泛化的事件或人群中进行抽样.而且相比之下,某些抽样方法更为合适。在对抽样进行评价时,有几个
第9 章这些证据的可信度有多大(11 )? … … 161 ? 重要的问题需要考虑:
1 .样本必须足够大才能证明结论或研究具有普遍性意义。在多数情况下,研究者观察的事件或人越多,结论就越可信。假如我们想知道大学生在完成学期论文时从其他人那里获得了多少帮助,并得出一个普遍性的结论,那么,研究100 个大学生肯定比研究10 大学生得到的结论更可信。2 .抽出的样本在广度或多样性上必须与得出结论的事件一致。例如,研究者想概括大学生的饮酒习惯,就应当以不同大学、不同类型系科的大学生为研究对象。中西部小型私立学校的学生与西海岸大型公立学校的学生可能有着不同的饮酒习惯;因此,如果仅对一所学校的学生进行研究,抽样的广度就不够。
3 .抽样越随机,样本就越理想。当研究者随机抽样时,他们力求使他们想概括的事件有同等的机会被抽取;他们尽量避免抽样偏差。例如,主要的民意测验,如盖洛普(Gall 叩)民意测验等,总是尽量采用随机抽样,这样能避免抽取的事件群或人群具有偏差性的特征。你能看出以下这些样本具有偏差性的特征吗?
a .自愿接受性生活频率调查的人。
b 。 14 : 30 在家接受电话访问的人。
c .完成刊登在某种流行的妇女杂志上的调查,并寄回答案的读者。
因此,我们想对所有的科研结果提问:“他们抽取了多少事件或被试?抽样的广度有多大?抽样的随机性如何?〃
162 ? 学会提问― 批利性思维指南
对传达信息的人来说,一个普遍存在的问题就是,由于对抽样的局限性没有足够的重视而导致研究结果的“过度泛化”。他们所描述的结果的概括性远远大于研究证明的事实的概括性。在第8 章里,我们把这样的概括称为概括草率谬误。下面这个研究就存在过度泛化的问题:
在大学里,教授辱骂学生的现象十分常见。最近,对Brightsville 大学的300 名女性进行的调查显示,超过20 %的女性遭受过不止一位教授的辱骂。
抽样方法不允许这种过度的泛化。该研究报告虽然没有明说,实际上是把结论泛化到所有大学了,尽管他只研究了一所学校。由于不知道研究者抽样的随机性如何,我们甚至不知道该研究的结论是否适用于进行调查的那所大学。过度泛化使研究产生了缺陷。记住:我们只能把研究结果推广到与研究事件或人相似的事件或人身上!
千万要对过度泛化保持警惕!这是一种普遍存在的、强有力的人类行为倾向,我们必须不断与之抗争。
存在偏差的调查和问卷
傍晚,你刚刚吃过晚饭,电话铃响了。“我们正在进行一项关于公众观的调查,你能回答几个问题吗?”如果你回答“好的”; 那么,你就和成千上万的人一起参与了该调查― 这种电话调查就是你最常遇到的一种研究方法。想想你听到“根据最近的民意测验”这句话的机会有多么频繁吧。
第9 章这些证据的可信度有多大(n )? ,' ’… 163 ? 调查和问卷常用于研究人们的态度和观念。可是它们的可信度有多大呢?这就要视情况而言了。调查的结果受到许多因素的影响;因此,在解释调查结果时要特别谨慎。下面,我们来讨论其中一些问题。
首先,要使调查结果有意义,就要确保被调查者对问题的回答是诚实的,即口头报告必须反映被调查者真实的观念和态度。然而,由于各种各样的原因,人们常常掩盖真相。例如,人们给出的答案可能是自己认为恰当的答案,而不是反映真实观念的答案。他们也许对问卷或被询问的问题有敌意,也许对问题的思考太少。假如你曾经当过调查人员,那么,你还能考虑到其他影响因素。记住:你不能假设口头报告准确地反映了真实态度。其次,调查中的很多问题在措辞上是模棱两可的;同一问题可能有多种解释。实际上,不同的人可能对同一问题有不同的理解!例如,你可以想像一下“你的婚姻幸福吗”这个问题可能有几种含义。问题越是模糊不清,调查的结果就越不可信。你应当始终把措辞问题挂在心上。一般来说,措辞越明确,不同的人作出相似理解的可