调查:大型用户群中有25%是代表吗?


13

我的雇主目前正在对公司对办公室的态度(即情绪)进行全公司范围的调查。过去,他们对业务的各个领域(假设有10个非常不同的部门)和其中的所有员工(假设整个公司共有1000名员工)开放调查,每个部门的员工人数不相等,只有一个特定部门大概是组织总人口的50%。

今年,该调查仅对员工总数的25%开放,选择是“随机”的

因此,我有两个查询:

  • 如果这是对整个员工基础的真正随机选择,那么假设所有这些员工都做出了回应,那么该统计上如何有效的样本呢?

  • 如果在每个部门级别上是随机的,例如每个部门的25%,那么考虑一个部门的有效样本如何超过总人口的50%。

我本来以为要确定公司中的多数情绪,则每个部门至少需要50%的员工基础才能提供真实的阅读情绪。

更新:调查未执行。从所选择的25%中不能保证100%的响应率。如果没有填写调查表,则没有激励或惩罚手段。


2
我建议使调查尽可能小(问题的数量/类型),然后将其强制性化为您需要的数量,这样员工/经理就不会抱怨这是一个巨大的时间。如果人们进行自我选择,那将保证某种形式的系统偏差。
尼克·T

如果您正在测量,则表示正态分布的某个变量的平均值,则在大约20次响应后,+ /-间隔的大小将以大约5%的速率增长1/sqrt(# responses)。例如,您将获得20条回复+/- .468 * sigma。有了100条回应,它将是+/- .198 * sigma。如果有1000个响应,它将是+/- .062 * sigma
佩斯,

Answers:


22

考虑一下说美国的一般人群中的调查。如果我们需要50%的人口来确定多数意见,我们将需要大约1.6亿个样本,这确实令人望而却步。甚至1%的样本也是极端的(约320万),而且很少这样做。在美国进行的一项重要调查中,一般社会调查的样本量在1,500到近3,000之间。因此,只有25%的样品本身没有问题。

请记住,调查不是选举或全民投票。为了使后者合法,每个合格的人都必须有机会发表自己的意见。进行调查的目的是获得对平均意见的良好估计,您可以使用随机样本获得该估计。因此,公司需要决定调查的目的是:是员工发表意见并参与公司的一种方式,还是经理获得信息的方式?

两种抽样设计均确保要求25%的员工。后者可确保在调查中代表较小的部门。如果您关心标准误差,则应该考虑采样的嵌套性质,尽管我不认为在这种情况下这有很大关系。


2
+1,但值得强调的是,如果您对“平均意见”不感兴趣,但可能需要其他一些样本。
蒂姆

1
谢谢你的回答。但是,这是我的遗漏,没有执行调查。仅会询问25%,但没有义务回答。
科林

2
那也是正常的。如果我进行调查,将很难迫使人们回答其中任何一个。我可以尝试雇用一些暴徒来“说服”我的受访者,但这会产生一些道德和法律后果……尽管如此,不答复是一个问题,但这是大多数调查必须处理的问题。
Maarten Buis

7

用词源学来说,“ 勘测 ”(sur-来自“超级”,如“从上方”和“ -vey从视角”)意味着获得概览,而不是整体。

只要25%确实是随机的,而不是自选(选择加入),那么它就完全符合该术语的定义。如果调查是可选的,那么答案将仅代表那些需要回答的人。例如,假设有一家餐厅,可以在用餐后填写反馈卡。即使大多数用餐者都满意,大多数反馈都是负面的,因为满意的顾客几乎看不出提供反馈的理由。


1
您能否扩大“自我选择”的影响?此调查不是强制性的,它是完全可选的,如果您填写或不填写,则没有任何激励或惩罚性手段。我将更新我的开场问题。
科林

6
@Colin:如果调查是可选的,那么答案将仅代表那些需要回答的人。例如,假设有一家餐厅,可以在用餐后填写反馈卡。即使大多数用餐者都满意,大多数反馈都是负面的,因为满意的顾客几乎看不出提供反馈的理由。
dotancohen

1
@dotancohen我认为答案会因为包含在此注释中而受益匪浅。
佩雷,

@Pere:谢谢,我担心将评论放入答案中可能会偏离词源。但是您是对的,我正在添加
。– dotancohen

4

另一种观点来自实验设计理论。

统计功效是指发现真实效果的可能性(来源

影响功率的四个因素:

  1. 效果大小
  2. 特性标准偏差
  3. 更大的样本量
  4. 所需的显着性水平

基于这些元素,您可以编写一个正式的数学方程,将功效,样本量,效应量,标准差和显着性水平(来源)联系起来。

在一组假设下,您可以将调查定性为实验,并利用实验框架的设计(这里有几个示例)。有许多有根据的猜测。但是,不完善的模型可能总比没有模型要好。


3

我有两个问题。一个关于样本量(25%,为什么不是大多数),另一个关于抽样技术(它是真正随机的,在整个公司中随机抽样25%,在每个部门中随机抽样25%,或使用其他分布)。

1)样本数量不必为多数。对于给定的置信度或似然比,所需的样本量可以在0到100%之间,取决于所需的精度。

永远不会获得100%的确定性(也不会获得50%或更大的子集)。实现如此高的精度也不是采样和估计的重点。

查看更多有关样本量的信息:https : //en.wikipedia.org/wiki/Sample_size_determination

如果您了解大量定律,您可能也有一个直观的想法。

如果子集的大小增加,则所有可能子集的平均值的分布(您的样本将是其中之一)将变得更小,并且更接近于原始分布的均值。如果选择一个人,则有一定的机会找到例外,但是两次在同一方向上找到同一例外的可能性就较小。依此类推,采样子集的大小越大,出现异常子集的机会就越小。

最终,所有可能子集的平均值的分布的方差等于原始集的方差除以子集大小的。n

重要的提示!您的估计将不取决于您从中采样的人口规模,而是取决于该人口的分布

如果您的部门规模为500。随机子集的平均值(大小为125)的偏差将比原始偏差小11倍。注意,测量误差(随机选择的子集的平均值的偏差)与部门的规模无关。它可能是500、5000或50000,在所有情况下,只要它们具有相同的分布,估计数就不会受到影响(现在,一个很小的部门可能会有一些奇怪的分布,但是对于较大的组,它开始消失了)。

2)采样不需要完全随机。您可以考虑人口统计因素。

最终,您需要在这种分析中分别对待每个部门,并纠正部门之间的差异以及如何在这些大小不同的部门中进行抽样。

在此更正中,有两个重要区别。人们可能会认为组之间的分布是否为随机变量。如果将其视为随机变量,则分析会变得更强(在模型中消除一定程度的自由度),但是如果不同的组不能互换为随机实体而没有特定效果(这似乎是您的情况,就像我想像的那样,各部门的职能不同,可能会有很大不同的观点,这与各部门之间的关系并不是随机的。


1
谢谢你的回答。但是,这是我的遗漏,没有执行调查。仅会询问25%,但没有义务回答。
科林

1
再有一个关于采样技术以及如何收集数据的第三个问题。对于此类问题,如何处理数据的无响应和其他质量方面,没有一个答案。在任何情况下(询问50%或25%)响应是否存在大问题,那么有关统计分析的任何讨论都仅是次要的。您不会通过更多 (例如,要求> 50%)采样来改善这项研究,最好集中精力于良好的采样。
Sextus Empiricus

2

您的问题是关于有限总体的样本量。但是,您首先需要的是无限总体中所需的样本数量,然后可以将其用于计算有限总体的样本数量。

n=(z2pq)/d2
n
z2
p
q=1p
d2

(1.96×0.5×0.5)/0.032=1,068

m=n/(1+((n1)/N))
m
n
N

N=1,0001068/(1+((10681)/1000))=517

如果使用25%的人口,则错误级别为5.4%。根据以前的调查,此错误级别可能很好。在进行调查时,总会在您愿意接受的错误级别和进行调查的成本之间进行权衡。

517/0.65=796

如果要按部门划分人口(称为分层),事情会变得更加复杂。基本上,如果希望每个部门的数据准确,则需要将每个部门视为单独的有限总体,这可能不切实际。但是您可以进行分层的随机抽样,而不是简单的随机抽样,在这种抽样中,50%的抽样是从人口总数为50%的部门中随机选择的,而合适的百分比是从其他部门随机抽样的。这意味着您的样本量将略有增加,因为您需要将所有小数点后的位四舍五入(您无法调查一个人的0.1)。但是,应该在人口(公司)级别而不是部门级别检查结果,因为每个部门都不会给出足够的答复来保证准确性。


1

在谈论有效样本时,基本概念通常是表示形式之一。样本是否足够“代表”了总体?为了获得代表性样本,需要确保样本量足够大(以减少估计的方差),并且样本中包含属于表现出不同类型行为的总体子集的成员在考虑中。

首先,与选择的绝对用户数相比,为调查选择的用户比例要小得多。所需的样本量将取决于给出答案的准确性或置信区间的要求。您可以阅读文章以获取更多信息。

您提到公司由几个部门组成。部门对调查的回应是否可能有所不同?如果他们这样做(或者您可能不确定),则最好在各个部门“分层”您的样本。以最简单的形式,这意味着从每个部门中选出相等比例的人员。例如:公司规模为1000,样本规模为100。那么您可以从规模为500的部门中选择50,从规模为100的部门中选择10,以此类推。这是为了避免某个特定部门的代表性不足任何特定的“随机”样本。

您还提到并非所有人都能对调查做出回应。如果您知道大约有一半的人会回答,那么为了获得100条回应,您必须将调查发送给200人。您将不得不考虑这种回应可能存在偏见的可能性。有特定反应的人可能或多或少倾向于回答。


1

如果这是对整个员工基础的真正随机选择,那么假设所有这些员工都做出了回应,那么该统计上如何有效的样本呢?

只要是从旨在描述的总体中抽取的,它就是有效的样本。也就是说,如果仅对老板进行抽样调查,其他员工就无话可说。您所描述的设置中不会发生这种情况。但是,它可能是由于无响应而发生的(更多信息见下文)。

如果在每个部门级别上是随机的,例如每个部门的25%,那么考虑一个部门的有效样本如何超过总人口的50%。

这不再是样本有效性的问题,而是抽样误差之一。显然,最精确的估计值将从分层随机抽取中获得,该层次至少包含部门级别。在这种情况下,每个部门都有一个有效的样本,但是由于大部门的绝对样本量较大,因此小部门的估计数通常不如大部门的估计数精确。对于整个组织,较大部门较高的样本代表率只是反映了组织的实际情况,丝毫不会降低样本的有效性。

该调查未执行。从所选择的25%中不能保证100%的响应率。如果没有填写调查表,则没有激励或惩罚手段。

您将无法强迫任何人提供良好的答案,但实施响应提醒计划是最低要求。另外,您应该向员工解释调查的相关性以及由于调查而对员工产生的影响:例如,何时发布结果?该组织根据调查采取了哪些潜在行动?为什么每个答案都很重要?

一旦收集了数据,就应该解决无响应问题。处理它意味着您应该首先分析无响应的行为以发现任何潜在的模式:没有老板响应吗?某个部门根本没有回应吗?然后采用必要的策略(后分层,重新加权,归因等)。


1

我正在扩展@ICannotFixThis的答案,并举例说明所涉及的四个因素如何影响:

  1. 效果大小
  2. 特性标准偏差
  3. 更大的样本量
  4. 所需的显着性水平

这些因素如何影响您的结果将取决于您使用的统计信息。例如,如果您想猜测某个变量的均值,则可以使用Student T检验

假设您想通过此调查计算出员工的平均身高。您实际上并不知道公司中所有员工的身高标准差(无需测量所有人),但是您可以做一些研究并猜测3英寸长(这大约是美国男性身高的标准差)。

如果您仅调查了5个人,那么95%的时间您在调查中观察到的平均身高将在真实平均身高的3.72英寸以内。

现在,我们的因素如何影响这一点:

  1. 如果您需要非常精确地知道平均高度(例如,效果大小非常小),则将需要大量的样本。例如,要知道2.66英寸内的真实平均高度,您需要调查100个人。

  2. 如果标准偏差很大,那么您将获得的精度将受到限制。如果标准偏差是6英寸而不是3英寸,并且您仍然有5个响应,则您只会知道在7.44英寸而不是3.72英寸内的真实平均高度。

  3. 跳过这一点,因为这是整个讨论的重点。

  4. 如果您确实需要确定答案正确,那么您将需要调查更多的人。在我们的示例中,我们看到有5个响应,我们可以在95%的时间内获得3.72英寸以内。如果我们想确保我们的答案在99%的时间内处于正确的范围内,那么我们的范围将是6.17英寸而不是3.72英寸。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.