友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!阅读过程发现任何错误请告诉我们,谢谢!! 报告错误
狗狗书籍 返回本书目录 我的书架 我的书签 TXT全本下载 进入书吧 加入书签

统计数字会撒谎-第5章

按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!



是那么回事的东西。在任意一个基于抽样的研究中,这个问题都十分严重,当你将你的“大部头”或者主要的研究报告采用通俗的手法进行概括时,这个问题会更加严重。
  首先,在与金西相类似的工作中,至少包含了3次抽样。正如以前所指出的,从总体中抽出的样本(第一次抽样)远不能称为随机抽样,因此可能对所有的总体都不具备显著的代表性。同样重要的是,我们还需要了解到:任何一个调查问卷都只不过是所有相关问题的样本(第二次抽样)。而绅士或者女士们所给的答案也只不过是他(或她)关于每个问题的态度或者经历的样本(第三次抽样)。正如在其他调查中发现的那样:由哪些人组成调查人员会对结果产生有趣的影响,金西的调查也可能如此。二战期间,美国民意调查中心(The National Opinion Research Center)派出了两组调查人员对某南方城市的500名黑人进行提问,问题只有3个。一组调查人员由白人组成,另一组是黑人。

内在有偏的样本(6)
其中一个问题是:“如果日本占领美国,你认为黑人的境况会得到改善还是变得更糟?”黑人组成的调查组,9%的被调查者回答“变好”,而白人调查组该比例只有2%。回答“变坏”的比例也不相同,黑人调查组只有25%,而白人调查组则达到45%。
  用“纳粹分子”替代“日本”,两组的结果大体相同。
  第三个问题试图探测被访者的真实态度,这种态度以前两个问题所表现出来的感受为基础。“你认为目前致力于打败轴心国(the Axis)比在国内进一步推进###更重要吗?” 在黑人组成的调查组中,选择“打败轴心国”的比例是39%,而白人组成的调查组则是62%。
  这是由莫名因素造成的误差,恐怕其中最重要的因素是被调查者###对方说好话的倾向,当我们在阅读调查结果时必须考虑到这一点。在战争时期回答一个暗含是否忠诚的问题时,一个南方黑人对白人说了一些听起来不错但并不代表他真实想法的话,这不是很正常吗?当然,区别的起因也可能在于不同的调查人员选择了不同的对象进行交谈。
  在上述例子中,结果如此明显有偏而导致毫无价值。你可以试着自己分析还有多少民意调查的结论,虽然并无有效的方法揭露它们,但却同样有偏,同样无价值。
  一般而言,民意调查都带有一定方向的误差。就像前文所举《文学文摘》例子的偏差一样,如果对此表示怀疑,你还可以找到许多恰当的例子来证明。在《文学文摘》的例子中,与希望代表的全体选民相比,由于偏向了比平均选民收入更高、受过更多教育、信息面更广、反应更快、举止优雅、行为保守、更多固定习惯等特点的群体,而产生了误差。
  为什么会这样呢?下面的例子将有助于你理解这一点。假设你是一个被分配到街道某个角落进行调查的人员,有两个看上去符合调查要求的人——年龄大于40岁的黑人农民——向你走来,一个人穿着干净###,上面打着整齐的补丁,感觉整洁清爽,而另一个人看上去肮脏、态度粗暴。为了完成工作,毫无疑问你会向更加符合要求的人走过去,而遍布城市其他角落的你的同事也会做出同样的抉择。
  一些反对民意调查的最强烈的情绪来自于自由主义者或是左翼集团,他们普遍认为这些调查都是人为操纵的。这种观点背后的事实是:民意调查结果经常与那些思想开放人士的观点和意愿不相符合。他们指出,民意调查的结果选择了共和党人,但不久之后选票者却做出了相反的选择。
  但实际上,正如我们前面所看到的,民意调查并不一定是###纵了,也就是说,并不一定要为了制造假象而恶意扭曲结果。样本有偏的趋势本身就可以自动地操纵结果,使其变得扭曲。
  本章小结:
  ◆为了确保结论有价值,根据抽样得出的结论一定要采用具有代表性的样本,这种样本才能排除各种误差。
  ◆无形的误差与有形的误差一样容易破坏样本的可信度。也就是说,即使你找不到任何破坏性的误差来源,但只要有产生误差的可能性,你就有必要对结果保留一定的怀疑。
  ◆最基本的样本是随机样本,它是指完全遵循随机原则从总体中选出的样本。总体即形成样本的母体。
  ◆随机样本的检验方法是:总体中的每个名字或每个事物是否具有相同的几率被选进样本?
  纯随机样本是惟一有足够把握经受统计理论审查的样本。但它也有不足之处,在很多情况下,获得这种样本的难度很大并且十分昂贵,以至于单纯考虑成本就会排除它。分层随机抽样是一个更经济的替代品,目前在民意调查和市场研究等领域中得到了广泛的应用。
  ◆一般而言,民意调查都带有一定程度的误差。
  。 最好的txt下载网

精心挑选的平均数(1)
第二章   精心挑选的平均数
  我相信你不是一个势利小人,而我也并不做房地产生意。但请让我们作这样的假定,并且假设,此刻你正在一条我熟知的街上看房子。对你的情况进行了初步判断后,我巧舌如簧、费尽心思地让你相信附近居民的平均年收入大约有10000英镑。也许这坚定了你要在此居住的信心,不管怎样,买卖最终成交了,那美妙的数字也被牢记在你的脑海。而且,既然你已经买下了房子——你有那么一点势利,当与朋友聊天时,你就会不经意地流露出你居住的地点:我住在一个相当棒的高收入小区。
  一年左右过后,我们又见面了。作为某纳税者委员会的成员,我正在四处奔走,为降低税率、降低财产估价,或降低公共交通费用而呼吁。我的理由很简单,我们支付不起各种上涨的费用,毕竟,附近居民的平均年收入只有2000英镑。也许你会加入到我们委员会的工作中来——你不仅势利,而且还挺吝啬。但是,当听到那可怜的2000英镑时,你也禁不住大吃一惊。到底是我现在撒谎了呢?还是一年前撒了谎?
  其实这两次你都无法怪罪于我,利用统计撒谎的妙处被展现得淋漓尽致。无论是10000英镑,还是2000英镑,它们都是正规的平均数,计算方法也完全正确。两个数字都基于相同的数据,来自相同的居民,根据相同的收入。所有都是相同的,但显然其中有一个数据令人误解,足以与弥天大谎相媲美。
  我的花招就是两次分别使用了不同的平均数,“平均数”这个词宽泛的涵义帮了大忙。当一个家伙希望用数据影响公众观点,或者向其他人推销广告版面,平均数便是一个经常被使用的伎俩,虽然偶尔是出于无心,但更多的时候是明知故犯。所以,当你被告知某个数是平均数时,除非能说出它的具体种类——均值,中位数,还是众数,否则你对它的具体涵义仍知之甚少。
  在希望数值较大时,我使用的10000英镑是均值,也就是附近居民收入的算术平均数。你只要将所有家庭的收入加起来并除以家庭总户数便可得到这种算术平均数。数值相对较小的是中位数,它告诉我们一半家庭的年收入超过2000英镑,另一半家庭的年收入不及2000英镑。我还可以利用众数——所有家庭收入序列中出现次数最多的那个收入。例如,附近的居民中年收入为3000英镑的家庭数是最多的,那么收入的众数就是一年3000英镑。
  在这个例子中,不合适的“平均数”实际上是毫无意义的,只要碰到关于收入的数据,这种情况就经常出现。还有一个因素会让我们困惑不已——某种条件下,各种类型平均数的数值十分接近,如果出于一般的目的,根本没有必要区分它们。
  比方说,当你看到某个原始部落男性的平均身高为5英尺时,你对这些人的外形条件就能有很好的了解,根本不需要进一步询问这个平均数是均值、中位数或者众数,因为此时各种平均数的数值大致相等。(当然,如果你正在为非洲人赶制一批###,那么就需要比平均数更多的信息,你要用到全距和标准差,这些我们将在下一章进行介绍。)
  在处理诸如人类特征的数据时,各种平均数的数值十分接近。这些数据具有我们常说的正态分布的形态特点,在你用###绘制正态分布时,将看到一根钟形的###,均值、中位数和众数都落在相同的点上。书包 网 。 想看书来

精心挑选的平均数(2)
在描述人类身高时,用哪种平
返回目录 上一页 下一页 回到顶部 0 0
未阅读完?加入书签已便下次继续阅读!
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!