SurveyMonkey是否会忽略您获得非随机样本的事实?


11

SurveyMonkey提供了一些步骤和图表,可根据您的总体数量来确定在给定的误差范围或置信区间内需要的样本量。

SurveyMonkey样本大小

该图表是否只是忽略了这样一个事实,即您只会得到那些愿意回答调查问卷的人,因此不会获得随机样本?

当我输入此内容时,我会收到警告,问题似乎是主观的,所以也许我没有正确询问。它不是真的与SurveyMonkey有关,而是一个更笼统的问题-您是否可以使用一些我不知道的高级技术从自愿响应数据中实际计算出置信区间?

在出口民意测验或国家调查中,显然他们必须处理这个问题。我的教育并未深入探讨调查抽样技术,但我认为它涉及收集人口统计数据,并以此来了解您所代表的样本的代表性。

除此之外,对于一个简单的在线调查,他们是否只是假设那些愿意回答的人是整个人口的随机样本?

Answers:


10

简短的回答是:Survey Monkey完全忽略了您如何获取样本。Survey Monkey不够聪明,无法假设您收集的内容不是便利样本,但是实际上每个Survey Monkey调查都是便利样本。这会导致您在准确估计所要消除的绝对采样数量之间存在巨大差异。一方面,您可以定义将从SRS获得的总体(及其中的关联)。另外,你可以定义你的非随机抽样定义的人群中,联想可以估计(功率规则适用于此类值)。这是给你作为一个研究人员,讨论差异,让读者决定非随机抽样究竟如何有效的可能是在接近一个真正的趋势。

重点是,偏见一词的用法不一致。在概率论中,估计器的偏差由。但是,估算器可以有偏差,但可以保持一致,以便在大型样本中偏差“消失”,例如正态分布RV的标准差的最大似然估计偏差。即。没有消失偏差的估计量(例如)被称为不一致偏压ñ=θ-θ^ñθ^pθθ^pθ在概率论中。研究设计专家(例如流行病学家)已经养成了一种习惯,称不一致为“偏见”。在这种情况下,这是选择偏见或自愿偏见。这当然是一种偏见,但是不一致意味着没有任何抽样可以纠正该问题。

为了从便利样本数据中估计总体水平关联,您必须正确地识别采样概率机制,并在所有估计中使用逆概率加权。在极少数情况下,这是有道理的。在实践中,几乎不可能确定这种机制。可以完成的时间是在一群具有先前信息的人员中,他们被要求填写调查表。可以根据以前的信息(例如年龄,性别,SES等)来估计无应答概率。加权使您有机会推断无应答人口的结果。人口普查是此类分析涉及逆概率加权的一个很好的例子。


2
您能否详细说明一下便利样本可能被认为是不一致但又没有偏见的意义?从历史上看,许多便利样本都被严重偏重(“偏见”恰恰是人们用来描述它们的术语):1936年的《文学文摘》民意调查可能是最著名的例子。
ub

1
@whuber原谅我对术语的“不一致”使用。我认为偏差在大样本中会消失,而不一致的估计永远不会在大样本中收敛。在概率论中,估计量不一致的例子很少,而且相距甚远,但是从研究设计的角度来看,它们一直在出现。有趣的是,流行病学家倾向于称其为“偏见”(即选择偏见)。但是张贴者的问题似乎暗示“更多抽样”将减轻这种偏见,就像概率论类型的偏见就是这种情况。
AdamO 2014年

我不确定我是否了解所有这些内容,所以让我只关注一小部分:您(还是您不是)断言更大的[便利性]样本会减少偏差?我希望你不是,因为那肯定是错误的!(这是《文学文摘》民意测验臭名昭著的一个原因:它是有史以来进行的规模最大,也是最大偏见之一。)
Whuber

5
确实不是!进行更多采样并不能消除这种内在偏差。这就是这里的问题。张贴者对估计与非随机样本的人口关联的功效感兴趣,我的观点是,您总是有0的功效来进行估算(除非使用非常谨慎和复杂的加权机制)。
AdamO 2014年

1
谢谢您的最后评论;它清除了您的部分答案,否则我可能会误解了。(+1)
whuber
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.