Questions tagged «sample-size»

这个标签是非常模糊的。当问题与样本大小有关且以下任何一项都不更合适时,请使用它:[小样本],[大数据],[功效分析],[功效],[不确定]或[不平衡类别]。

1
插入符glmnet与cv.glmnet
在glmnet内部caret使用搜索最佳lambda和cv.glmnet执行相同任务的比较中似乎有很多困惑。 提出了许多问题,例如: 分类模型train.glmnet与cv.glmnet? 在插入符号中使用glmnet的正确方法是什么? 使用`caret`交叉验证`glmnet` 但是没有给出答案,这可能是由于问题的可重复性。在第一个问题之后,我给出了一个非常相似的示例,但确实存在相同的问题:为什么估计的lambda如此不同? library(caret) library(glmnet) set.seed(849) training <- twoClassSim(50, linearVars = 2) set.seed(849) testing <- twoClassSim(500, linearVars = 2) trainX <- training[, -ncol(training)] testX <- testing[, -ncol(testing)] trainY <- training$Class # Using glmnet to directly perform CV set.seed(849) cvob1=cv.glmnet(x=as.matrix(trainX),y=trainY,family="binomial",alpha=1, type.measure="auc", nfolds = 3,lambda = seq(0.001,0.1,by = 0.001),standardize=FALSE) …

3
为什么/应该为政治(例如盖洛普)进行统计抽样?
与人口规模相比,在那里进行的民意测验(例如盖洛普)抽样的人数极少(例如,亿万人口中有千人)。 现在,对我而言,当您有充分理由相信样本可以代表人口(或类似地,代表其他样本)时,对人口进行抽样作为估算人口统计数据的一种方法就很有意义。 例如,采样显然对医学研究有意义,因为我们先验地知道人类都有非常相似的基因组,并且这个因素使他们的身体表现出相似的行为。 注意这不是某种松散的耦合-基因组是一个非常强大的决定性因素。 但是,我只是不明白使用低样本量进行政治民意测验的理由。 我可以买到在任何给定社区中大约80-90%的人都为总统投票(由于相似的社会经济/教育背景),但是这似乎不足以证明如此少的样本数是合理的。从字面上看,没有(至少对我而言)没有令人信服的理由,为什么有1000个随机选民的举止应该像其他2亿选民的举止一样。 对我来说,您至少需要(例如)该金额的100倍。为什么?我可以想到很多原因,例如: 仅加利福尼亚州就有约22,000个专用区。人们在经济和教育背景上成长的差异如此之大,以至于规模为1000的民意调查似乎很小。您如何平均用不到1个人来概括整个区域? 人们通常无法改变其身体对医学的反应,但是他们可以仅通过思考就改变对政治的看法。我的看法是,与政治打交道时,没有像医学中的DNA那样的强迫因素。在最好的我想像应该有相关的小口袋。 但是无论如何,这样的民意调查似乎仍然有效?或者至少人们似乎认为他们这样做? 但是为什么要这样呢?也许我只是根本不了解采样?有人可以解释吗? 我只是不能认真对待我所看到的任何民意调查,但我觉得我或多或少地独自一人。

1
如何确定重复测量方差分析所需的样本量?
我需要有关重复测量方差分析的一些帮助。 我们正在调查某些病房中某些干预措施对降低血流感染(BSI)率的影响。我们计划每月获取一次BSI费率信息,首先是在没有干预的情况下12个月,然后在有干预的情况下12个月。 我们正在考虑进行时间序列或重复测量方差分析,在我对第一个方法没有太多想法之前,我希望使用后一个方法(额外的问题:时间点太少了吧?),但是接下来另一个问题是,我们需要多少病房才能证明干预对BSI率确实有统计学上的显着影响? 我想我要进行两个ANOVA,一个用于“干预之前”,一个用于“干预期间”,并且我认为“ ANOVA”在“干预之前”不应进行显着的F比率检验。 我二维地考虑“样本量”一词,无论是病房数还是重复测量数。


3
Fisher的z转换何时合适?
我想使用p值测试样本相关性的显着性,即[Rrr H0:ρ = 0 ,H1个:ρ ≠ 0。H0:ρ=0,H1:ρ≠0.H_0: \rho = 0, \; H_1: \rho \neq 0. 我了解我可以使用Fisher的z变换来计算 žÒ b 小号= n - 3-----√2ln(1 + r1 − r)zobs=n−32ln⁡(1+r1−r)z_{obs}= \displaystyle\frac{\sqrt{n-3}}{2}\ln\left(\displaystyle\frac{1+r}{1-r}\right) 然后通过找到p值 p = 2 P(Z> zÒ b 小号)p=2P(Z>zobs)p = 2P\left(Z>z_{obs}\right) 使用标准正态分布。 我的问题是:要使它适合转换,应将设为多少?显然,ñ必须大于3,我的教科书没有提到任何限制,但对幻灯片29 本演示它说,ň必须大于10.我会考虑数据较大,我会像5 ≤ ñ ≤ 10。ñnnñnnñnn5 ≤ Ñ ≤ 105≤n≤105 \leq n …


3
如果事先声明,可以动态增加样本数量吗?
我将研究一种刺激与受试者内部设计相比另一种刺激的优点。我有一个排列方案,旨在减少研究某些部分的顺序影响(任务类型顺序,刺激顺序,任务集顺序)。排列方案规定样本大小可被8整除。 要确定样本数量,我必须大胆猜测(在我的领域中是一个很好的传统),或者为我所需的功效计算样本数量。现在的问题是,我没有丝毫线索要观察多大的效果(这也是我所在领域的良好传统)。这意味着功率计算有些困难。另一方面,大胆猜测可能也是不好的,因为我要么得出的样本量太小,要么向参与者支付太多的钱,而在实验室中花费了太多的时间。 是否可以预先声明我分8个人加入参与者,直到我离开两个p值的通道?例如0.05 <p <0.30?或者,您会建议我如何继续?

2
在结构方程模型中拥有非常小的样本的复杂性
我正在Amos 18中运行结构方程模型(SEM)。我正在为我的实验寻找100名参与者(宽松使用),这可能不足以进行成功的SEM。反复告诉我,SEM(以及EFA,CFA)是一种“大样本”统计程序。长话短说,我没有参加100名参与者(这真是令人惊讶!),并且在排除两个有问题的数据点之后只有42个参与者。出于兴趣,我还是尝试了该模型,令我惊讶的是,它看起来非常合适!CFI> .95,RMSEA <.09,SRMR <.08。 该模型并不简单,实际上我会说它相对复杂。我有两个潜在变量,一个有两个观测变量,另一个有5个观测变量。我在模型中还有四个观察到的变量。间接变量和直接变量之间存在许多关系,例如,某些变量是其他四个变量内生的。 我对SEM有点陌生;但是,我认识的两个非常熟悉SEM的人告诉我,只要拟合指标良好,效果是可以解释的(只要它们很重要),并且该模型没有任何明显的“错误”。我知道某些适合度指标在暗示良好适合度方面偏向或反对小样本,但我前面提到的三个指标似乎不错,而且我相信也没有类似偏见。为了测试间接影响,我使用引导程序(2000个样本左右),90%的偏差校正了信心,蒙特卡洛。另外需要注意的是,我针对三种不同的条件运行三种不同的SEM。 我有两个问题,我希望一些人可以考虑,如果您有贡献,请回答: 我的模型是否存在没有通过拟合指数证明的重大弱点?小样本将突出显示该研究的弱点,但我想知道是否存在一些我完全没有注意到的巨大统计问题。我计划将来再增加10至20名参与者,但这仍将为我提供相对较小的样本进行此类分析。 给我很小的样本,或者在使用它的上下文中,我使用引导程序是否有任何问题? 我希望这些问题对本论坛来说不是太“基本”。我已经阅读了许多关于SEM和相关问题的章节,但是我发现人们在这方面的观点非常分散! 干杯

3
伯努利试验中估计“成功”可能性所需的样本量
假设一个游戏提供了一个事件,该事件在完成时要么给出奖励,要么什么都不给出。确定是否给出奖励的确切机制尚不清楚,但我假设使用了随机数生成器,并且如果结果大于某个硬编码值,则可以获得奖励。 如果我想对工程师进行什么逆向工程以决定奖励的获得频率(估计为15%至30%),我该如何计算所需的样本数量? 我从这里的“真实概率估计器”部分开始:Checking_whether_a_coin_is_fair,但不确定我是否正朝正确的道路前进。我得到了〜1000个样本的结果,在95%置信度下最大误差为3%。 最终,这是我要解决的问题: 事件#1的X%给予奖励1.0R 事件#2的奖励率为1.4R,有%的时间 我想足够准确地估算X和Y,以确定哪个事件更有效。大样本量是一个问题,因为我最多每20分钟只能获取1个样本。

3
不同样本大小下p值的相对大小
在不同样本量下ap值的相对大小如何变化?就像如果在得到进行相关,然后在时得到相同的p值0.20,那么与原始p值相比,第二次测试的p值的相对大小是多少当?n = 45 n = 120 n = 45p=0.20p=0.20p=0.20n=45n=45n=45n=120n=120n=120n=45n=45n=45

5
在开始实验或无限期进行实验之前确定样本量?
几年前,我研究了统计学,却忘记了这一切,因此这些似乎比一般的问题更像是一般的概念性问题,但这是我的问题。 我在电子商务网站上以UX设计师的身份工作。我们有一个几年前建立的A / B测试框架,我对此表示怀疑。 我们做出所有决策所依据的指标称为转化,它基于访问该网站并最终购买商品的用户百分比。 因此,我们要测试将“购买”按钮的颜色从绿色更改为蓝色。 该控件就是我们已经拥有的控件,绿色按钮是我们知道平均转化率是多少。实验是将绿色按钮替换为蓝色按钮。 我们同意95%的显着性是我们满意的置信度,我们开启了实验,使其继续运行。 当用户访问网站时,在后台,他们有50/50的机会会被发送到对照版本(绿色按钮)与实验版本(蓝色按钮)。 经过7天的实验后,我发现转化率提高了10.2%,而样本量为3000(对照组为1500,实验为1500),统计学意义为99.2%。我认为很好。 实验继续进行,样本量增加,然后我发现转化率增加了9%,显着性为98.1%。好的,让实验运行更长的时间,现在实验仅显示出5%的提升,统计显着性仅为92%,框架告诉我在达到95%的显着性之前我还需要4600个样本? 那么实验在什么时候得出结论? 如果我想说一个临床试验过程,您需要事先就样本量达成共识,并完成实验,则无论何种度量标准都能将其提高10%,达到99%的显着性,然后就决定将该药物投放市场。但是,如果他们对4000人进行了实验,并且发现无论将哪种指标提高5%,只有92%的显着性,那么该药就不会被允许投放市场。 我们是否应该事先就样本量达成一致并在达到该样本量后立即停止并对结果满意(如果在关闭实验时的显着性为99%)?

1
距离差的统计意义
我在二维网格上有3000多个矢量,具有近似均匀的离散分布。一些向量对满足一定条件。注意:该条件仅适用于向量对,不适用于单个向量。我有大约1500个这样的对的列表,我们称其为组1。组2包含所有其他向量对。我想找出第1组中一对向量之间的距离是否明显小于两个向量之间的平均距离。我怎样才能做到这一点? 统计检验:中心极限定理适用于我的情况吗?也就是说,我可以采用距离样本的方法,并使用学生的t检验比较满足条件的样本的方法与不满足条件的样本的方法吗?否则,什么统计检验适用于此? 样本数量和样本数量:我知道这里有两个变量,对于两个组中的每一个,我需要获取n个大小为m的样本,并取每个样本的平均值。有没有选择n和m的原则方法?它们应该尽可能大吗?还是只要它们具有统计意义,就应该尽可能地少?这两个组的名称是否应该相同?还是对于包含更多向量对的第2组,它们应该更大?


1
F检验的样本量公式?
我想知道是否有像Lehr公式这样的样本量公式适用于F检验?Lehr的t检验公式为,其中是效果大小(例如)。可以将其推广为,其中是一个常数,取决于类型I速率,所需功率以及是执行单面测试还是双面测试。 Δ Δ = (μ 1 - μ 2)/ σ Ñ = c ^ / Δ 2 çn=16/Δ2n=16/Δ2n = 16 / \Delta^2ΔΔ\Delta Δ=(μ1−μ2)/σΔ=(μ1−μ2)/σ\Delta = (\mu_1 - \mu_2) / \sigman=c/Δ2n=c/Δ2n = c / \Delta^2ccc 我正在寻找F检验的类似公式。在替代方案中,我的测试统计量分布为具有个自由度和非中心性参数的非中心F ,其中仅取决于总体参数,该参数未知但假定具有一定价值。参数由实验确定,是样本大小。理想情况下,我正在寻找形式为的(最好是众所周知的)公式, 其中仅取决于类型I速率和功率。Ñ λ λ ķ Ñ Ñ = Çk,nk,nk,nnλnλn \lambdaλλ\lambdakkknnn cn=cg(k,λ)n=cg(k,λ)n = \frac{c}{g(k,\lambda)}ccc 样本大小应满足 其中是具有 dof和非中心性参数的非中心F的CDF …

2
参数样本量计算和非参数分析
我很好奇,是否有人有特定的参考文献(文本或期刊文章)来支持医学文献中使用参数化方法(例如,假设正态分布和测量值有一定差异)执行样本量计算的惯例。当使用非参数方法进行主要试验结果的分析时。 例如:主要结果是服用某种药物后的呕吐时间,已知其平均值为20分钟(标准差为6分钟),但分布明显偏右。样本数量的计算是使用公式根据上面列出的假设进行的 n (每组)= f(α ,β)× (2 σ2/( μ1个- μ2)2)n(per-group)=f(α,β)×(2σ2/(μ1−μ2)2)n(\text{per-group})=f(\alpha,\beta) \times (2\sigma^2 /(\mu_1 - \mu_2)^2 ), 哪里 F(α ,β)f(α,β)f(\alpha, \beta) 根据所需的变化 αα\alpha 和 ββ\beta 错误。 但是,由于分布的偏斜性,主要结果的分析将基于等级(非参数方法,例如Mann Whitney U检验)。 统计学家是否可以支持这种模式,还是应该进行非参数的样本量估算(以及如何进行估算)? 我的想法是,为了便于计算,可以进行上述练习。毕竟,样本量估算值仅仅是(已经做出了多个假设的估算值)所有这些估算值可能都略微(或非常不精确)。但是,我很想知道其他人的想法,特别是想知道是否有任何引用来支持这种推理方法。 非常感谢您的协助。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.