Questions tagged «experiment-design»

研究如何在存在差异的情况下构建信息收集练习。

16
推荐的实验设计书籍?
小组对实验设计书有何建议? 理想情况下,书籍可能仍应印刷或以电子方式提供,尽管可能并不总是可行的。如果您想在这本书的优点上加些话,那也很好。 另外,针对每个答案准备一本书,以便投票可以帮助对建议进行分类。 (社区Wiki,如果可以做得更好,请编辑问题!)

4
二项式数据的方差分析
我正在分析实验数据集。数据由治疗类型和二项式结果的配对向量组成: Treatment Outcome A 1 B 0 C 0 D 1 A 0 ... 在结果列中,1表示成功,0表示失败。我想弄清楚治疗方法是否会显着改变结果。有4种不同的处理方式,每个实验重复多次(每种处理方式2000次)。 我的问题是,我可以使用ANOVA分析二进制结果吗?还是应该使用卡方检验来检查二项式数据?似乎卡方假设比例将被平均分配,事实并非如此。另一个想法是使用每种治疗成功与失败的比例来汇总数据,然后使用比例检验。 我很想听到您对这些二项式成功/失败实验有意义的测试建议。

3
如果您的随机样本显然没有代表性怎么办?
如果您随机抽取一个样本并且可以看到它显然不具有代表性,那会是怎么回事,就像最近的问题一样。例如,如果假设人口分布在0附近是对称的,而您随机抽取的样本具有不平衡的正负观测值,并且不平衡在统计上是显着的,那又会如何呢?您可以根据有偏见的样本对总体做出哪些合理的表述?在这种情况下,什么是合理的行动方针?在我们的研究中何时注意到这种不平衡情况是否重要?

4
实验设计中的陷阱:避免死实验
我无数次地引用了此报价: 在实验结束后咨询统计学家通常只是要求他进行验尸检查。他也许可以说实验是怎么死的。- 罗纳德·费舍尔(1938) 在我看来,这似乎有些冒昧。我所发现的唯一描述没有良好设计的实验是如何失败的例子就是缺乏控制或控制不力。例如,控制肥料施用但无法控制施用所需环境的实验。也许只有我一个人,但是快速浏览Wikipedia中有关Fisher的设计原理的部分似乎可以覆盖大多数基础知识。 作为统计学家,您多久会看到与实验相关的数据问题设计?它们是否总是与费舍尔提到的少数因素有关,还是与我们进行非统计培训的科学家应注意的其他严重陷阱有关?



4
(某些)伪随机化有什么问题
我遇到了一项研究,其中对50岁以上的患者按出生年份进行了伪随机分组。如果出生年份是偶数,则通常护理,如果是奇数,则进行干预。 它更容易实现,更难颠覆(很容易检查病人应该接受的治疗),很容易记住(任务进行了数年)。但是,我仍然不喜欢它,我觉得适当的随机化会更好。但我无法解释原因。 我是否感觉错了?还是有充分的理由倾向于“真正的”随机化?

4
如何将新向量投影到PCA空间上?
执行主成分分析(PCA)之后,我想将一个新向量投影到PCA空间上(即在PCA坐标系中找到其坐标)。 我已经使用R计算了R语言的PCA prcomp。现在,我应该可以将向量乘以PCA旋转矩阵。该矩阵中的主要成分应该按行还是按列排列?
21 r  pca  r  variance  heteroscedasticity  misspecification  distributions  time-series  data-visualization  modeling  histogram  kolmogorov-smirnov  negative-binomial  likelihood-ratio  econometrics  panel-data  categorical-data  scales  survey  distributions  pdf  histogram  correlation  algorithms  r  gpu  parallel-computing  approximation  mean  median  references  sample-size  normality-assumption  central-limit-theorem  rule-of-thumb  confidence-interval  estimation  mixed-model  psychometrics  random-effects-model  hypothesis-testing  sample-size  dataset  large-data  regression  standard-deviation  variance  approximation  hypothesis-testing  variance  central-limit-theorem  kernel-trick  kernel-smoothing  error  sampling  hypothesis-testing  normality-assumption  philosophical  confidence-interval  modeling  model-selection  experiment-design  hypothesis-testing  statistical-significance  power  asymptotics  information-retrieval  anova  multiple-comparisons  ancova  classification  clustering  factor-analysis  psychometrics  r  sampling  expectation-maximization  markov-process  r  data-visualization  correlation  regression  statistical-significance  degrees-of-freedom  experiment-design  r  regression  curve-fitting  change-point  loess  machine-learning  classification  self-study  monte-carlo  markov-process  references  mathematical-statistics  data-visualization  python  cart  boosting  regression  classification  robust  cart  survey  binomial  psychometrics  likert  psychology  asymptotics  multinomial 

5
实验设计中有什么障碍?
关于实验设计中的块概念,我有两个问题:(1)块和因子之间有什么区别?(2)我试图阅读一些书,但有一些不清楚的地方:作者似乎总是认为“阻碍因素”与其他因素之间没有相互作用,这是对的,如果是,为什么?

2
您如何“控制”一个因素/变量?
据我了解,“控制”在统计中可以有两个含义。 对照组:在实验中,未对对照组成员进行任何治疗。例如:安慰剂与药物:您将药物分配给一组而不是另一组(对照组),这也称为“对照实验”。 变量控制:分离特定自变量影响的技术。赋予该技术的其他一些名称是“占”,“保持常数”,“控制”,一些变量。例如:在一项足球观看研究中(喜欢或不喜欢),您可能想要消除性别的影响,因为我们认为性别会导致偏见,也就是说,男性可能比女性更喜欢它。 所以,我的问题是针对第(2)点。两个问题: 通常,您如何“控制” /“考虑”变量。使用什么技术?(就回归而言,方差分析框架)。 在上面的示例中,随机选择男性和女性是否构成控制?也就是说,“随机性”是控制其他效果的技术之一吗?


3
有可用的通用方法来模拟公式或分析中的数据吗?
从实验设计数据框中对数据进行从头模拟。 着重于R(尽管其他语言解决方案会很棒)。 在设计实验或调查时,模拟数据并对该模拟数据进行分析可以提供对设计优点和缺点的深刻了解。 这种方法对于理解和正确使用统计检验也可能至关重要。 但是,此过程往往有些繁琐,并且导致许多人跳过了实验或调查中的这一重要步骤。 统计模型和检验包含模拟数据所需的大多数信息(包括假设或分布的明确表述)。 给定一个分析模型(及其关联的假设,例如正态和平衡),一个因素的水平和一个显着性的量度(例如p值),我想获得模拟数据(理想情况下具有类似于print(),predict(),simulate())。 这样的通用仿真框架可能吗? 如果可以,目前是否有这样的框架? 例如,我想要一个函数,例如: sim(aov(response~factor1+factor2*factor3), p.values=list(factor1=0.05, factor2=0.05, factor3=0.50, factor2:factor3=0.05), levels=list(factor1=1:10, factor2=c("A", "B", "C"), factor3=c("A", "B", "C"))) 即: sim.lm<-function(){ library(DoE.base) design<-fac.design(nlevels=c(10,3,3), factor.names=c("factor1", "factor2", "factor3"), replications=3, randomize=F) response<-with(design, as.numeric(factor1)+ as.numeric(factor2)+ as.numeric(factor3)+ as.numeric(factor2)*as.numeric(factor3)+ rnorm(length(factor1))) simulation<-data.frame(design, response)} 要么 sim(glm(response~factor1+factor2*factor3, family=poisson), p.values=list(factor1=0.05, factor2=0.05, factor3=0.50, factor2:factor3=0.05), levels=list(factor1=1:10, factor2=c("A", "B", "C"), …

4
梯度提升机的精度随着迭代次数的增加而降低
我正在通过caretR中的程序包尝试使用梯度增强机算法。 使用一个小的大学录取数据集,我运行了以下代码: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting machine algorithm. ### set.seed(123) fitControl <- trainControl(method = 'cv', number = 5, summaryFunction=defaultSummary) grid <- expand.grid(n.trees = seq(5000,1000000,5000), interaction.depth = 2, shrinkage = …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

4
无法创建理想实验时该怎么办的教科书/阅读材料?
我的统计培训扎根于数学统计,目前在我的MS上接受这些方法的课程有些震惊。由于我缺乏行业经验,因此目前我很难理解其中一些“应用”方法。 我们在方法类中一直谈论的主题之一是实验设计的思想。 举例来说,我想在一个声称提高K-12学生考试成绩的教育计划中进行有效性实验。 在方法课程中,他们教了以下方法来解决这一问题:确保您有一个好的研究问题,好的数据收集方法,随机实验,均质的治疗组(即,使用该程序治疗过的一组,也许不)理想地大小相等,然后运行检验(或某种非参数假设检验),一切都很好,对吗?ŤŤt 我几乎不相信这就是现实中的运作方式。 我了解到,当然,您可能需要进行一些方便的采样。除此之外,除了从教科书中学到的知识外,我不知道如何实现实验设计。 在实践中是否有教科书,阅读材料等探讨这些问题(理想情况下,不要掩饰数学-我不需要所有内容的详尽证明,但我不想被告知所有内容都是“明显”)?

3
费舍尔这句话是什么意思?
我到处都看到这个名言,但每次都无法理解重点。 一个人暂时拒绝假设的情况,作为惯常做法,当重要性达到1%或更高水平时,肯定会被误以为不超过1%的此类决定。因为当假设正确时,他只会在这些情况的1%中被误解,而当假设错误时,他在误解中永远不会被误解。[...]但是,这种计算是荒谬的学术研究,因为实际上没有科学工作者每年都有固定的意义水平,在任何情况下,他都拒绝假设。他宁愿根据自己的证据和想法对每一个具体案件都下定决心。不应忘记,为进行测试而选择的案例显然是一个高度选择的案例,并且即使对于一个工人也无法指定选择条件;同样,在所使用的论点中选择一个特定的审判所表明的实际重要性水平显然是不合法的,就好像使用这一水平是他一生的习惯。 (统计方法和科学推断,1956年,第42-45页) 更具体地说,我不明白 为什么选择用于“高度选择”测试的案例?假设您想知道一个区域内人员的平均身高是否小于165厘米,然后决定进行测试。据我所知,标准程序是从该区域抽取随机样本并测量其高度。如何高度选择? 假设案例是经过高度选择的,但是这与重要性级别的选择有什么关系?再次考虑上面的例子,如果您的抽样方法(我认为是费舍尔所说的选择条件)是歪斜的,并且以某种方式偏爱高个子,那么整个研究就会毁了,而对显着性水平的主观确定无法挽救它。 实际上,我什至不知道什么是“特定试验所表明的实际重要性水平”。它是该实验的值,还是一些著名的预设值(如著名的0.05),还是其他?ppp

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.