统计和大数据 degrees-of-freedom

1

注意：这个问题是一个转贴，因为我的上一个问题出于法律原因不得不删除。在比较SAS的PROC MIXED与R中lme的nlme软件包的功能时，我偶然发现了一些相当混乱的差异。更具体地说，不同测试的自由度在PROC MIXED和之间有所不同lme，我想知道为什么。从以下数据集（以下给出的R代码）开始： ind：指示进行测量的个人的因子 fac：进行测量的器官 trt：表示治疗的因素 y：一些连续响应变量这个想法是建立以下简单模型： y ~ trt + (ind)：ind作为随机因子 y ~ trt + (fac(ind))：fac嵌套在ind作为随机因子需要注意的是最后一个模型应引起奇异性，因为只有1的值y对每一个组合ind和fac。第一模型在SAS中，我建立以下模型： PROC MIXED data=Data; CLASS ind fac trt; MODEL y = trt /s; RANDOM ind /s; run; 根据教程，R中使用的相同模型nlme应为： > require(nlme) > options(contrasts=c(factor="contr.SAS",ordered="contr.poly")) > m2<-lme(y~trt,random=~1|ind,data=Data) 两种模型对系数及其SE均给出相同的估计，但是在对F的影响进行F检验时trt，它们使用的自由度不同： SAS : Type …

12 r mixed-model sas degrees-of-freedom pdf unbiased-estimator distance-functions functional-data-analysis hellinger time-series outliers c++ relative-risk absolute-risk rare-events regression t-test multiple-regression survival teaching multiple-regression regression self-study t-distribution machine-learning recommender-system self-study binomial standard-deviation data-visualization r predictive-models pearson-r spearman-rho r regression modeling r categorical-data data-visualization ggplot2 many-categories machine-learning cross-validation weka microarray variance sampling monte-carlo regression cross-validation model-selection feature-selection elastic-net distance-functions information-theory r regression mixed-model random-effects-model fixed-effects-model dataset data-mining

1

如果您的自由度超出了桌子的末端，该怎么办？

F表的自由度无法满足我的大样本要求。例如，如果我有一个自由度为5和6744的F，我如何找到方差分析的5％临界值？如果我在进行具有较大自由度的卡方检验该怎么办？ [这样的问题是在不久前发布的，但是OP出错了，实际上是一个较小的df，将其减少为重复的-但原来的大df问题应该在现场的某个地方有一个答案]

11 chi-squared degrees-of-freedom f-distribution tables

2

lmerTest :: anova中的自由度正确吗？它们与RM-ANOVA有很大不同

我正在分析R中反应时间实验的结果。我进行了重复测量方差分析（1个受试者内部因素具有2个水平，而1个受试者之间因素具有2个水平）。我运行了一个类似的线性混合模型，我想使用ANOVA表的形式总结lmer结果lmerTest::anova。不要误会我的意思：我没想到会有相同的结果，但是我不确定lmerTest::anova结果的自由度。在我看来，它反映的是ANOVA，而在主题级别上没有任何汇总。我知道以下事实：在混合效应模型中计算自由度是很棘手的，但lmerTest::anova在更新的?pvalues主题（lme4包）中被提及为一种可能的解决方案。这个计算正确吗？结果lmerTest::anova是否正确反映了指定的模型？更新：我使个体差异更大。自由度lmerTest::anova与简单的方差不同，但是我仍然不确定，为什么它们对于主体内因素/相互作用如此之大。 # mini example with ANT dataset from ez package library(ez); library(lme4); library(lmerTest) # repeated measures ANOVA with ez package data(ANT) ANT.2 <- subset(ANT, !error) # update: make individual differences larger baseline.shift <- rnorm(length(unique(ANT.2$subnum)), 0, 50) ANT.2$rt <- ANT.2$rt + baseline.shift[as.numeric(ANT.2$subnum)] anova.ez <- ezANOVA(data = …

10 anova mixed-model repeated-measures lme4-nlme degrees-of-freedom

1

我应该使用Welch（1947）的近似自由度还是Satterthwaite（1946）的近似度？

对于用于Welch t检验的近似自由度的正确公式，我感到困惑。Satterthwaite（1946）的公式是最常引用的公式，但是Welch在1947年提出了另一种公式。我不确定哪个更可取（或被大多数统计软件使用）。 Satterthwaite的公式：（s2X/ nX+ 秒2ÿ/ nÿ）2（s2X/ nX）2/（ nX− 1 ）+ （秒2ÿ/ nÿ）2/（ nÿ− 1 ）(sx2/nx+sy2/ny)2(sx2/nx)2/(nx−1)+(sy2/ny)2/(ny−1)\frac{\left(s_x^2/n_x +s_y^2/n_y\right)^2}{(s_x^2/n_x )^2/(n_x-1)+(s_y^2/n_y )^2/(n_y-1)} 韦尔奇公式： − 2 + （秒2X/ nX+ 秒2ÿ/ nÿ）2（s2X/ nX）2/（ nX+ 1 ）+ （小号2ÿ/ nÿ）2/（ nÿ+ 1 ）−2+(sx2/nx+sy2/ny)2(sx2/nx)2/(nx+1)+(sy2/ny)2/(ny+1)-2+ \frac{\left(s_x^2/n_x +s_y^2/n_y\right)^2}{(s_x^2/n_x )^2/(n_x+1)+(s_y^2/n_y )^2/(n_y+1)} 参考文献：宾夕法尼亚州萨特斯韦特（1946）。“方差成分估计的近似分布”。生物识别公告，第2卷，第6页，第110-114页。韦尔奇，BL（1947）。“当涉及几个不同的总体方差时，“学生”问题的推广”。Biometrika，34，1 / 2，第28-35页。

10 hypothesis-testing t-test degrees-of-freedom

2

为什么匹配对的自由度测试对数减去1？

我习惯知道“自由度”为，在这里有线性模型\ mathbf {Y} = \ mathbf {X} \ boldsymbol {\的β} + \ boldsymbol {\小量} 与\ mathbf {Y } \ in \ mathbb {R} ^ n，\ mathbf {X} \ in M_ {n \ times p}（\ mathbb {R}）具有等级r的设计矩阵，\ boldsymbol {\ beta} \ in \ mathbb { R} ^ p，\ boldsymbol {\ epsilon} …

9 t-test degrees-of-freedom

1

通用加性模型：R的输出中的ref.df是什么？

嗨，我在R的输出屏幕中难以理解Ref.df： Approximate significance of smooth terms: edf Ref.df F p-value s(meangrain) 1.779 2.209 3.193 0.0451 * s(depth) 2.108 2.697 3.538 0.0254 * 这是什么意思，有必要在论文中包括此术语以表示GAM的结果吗？它给我们提供预测所需的信息吗？

9 model gam degrees-of-freedom

1

如何比较观察到的事件与预期的事件？

假设我有一个频率为4个可能的事件的样本： Event1 - 5 E2 - 1 E3 - 0 E4 - 12 并且我具有发生事件的预期概率： p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 利用我四个事件的观测频率之和（18），我可以计算事件的预期频率，对吗？ expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …

9 r statistical-significance chi-squared multivariate-analysis exponential joint-distribution statistical-significance self-study standard-deviation probability normal-distribution spss interpretation assumptions cox-model reporting cox-model statistical-significance reliability method-comparison classification boosting ensemble adaboost confidence-interval cross-validation prediction prediction-interval regression machine-learning svm regularization regression sampling survey probit matlab feature-selection information-theory mutual-information time-series forecasting simulation classification boosting ensemble adaboost normal-distribution multivariate-analysis covariance gini clustering text-mining distance-functions information-retrieval similarities regression logistic stata group-differences r anova confidence-interval repeated-measures r logistic lme4-nlme inference fiducial kalman-filter classification discriminant-analysis linear-algebra computing statistical-significance time-series panel-data missing-data uncertainty probability multivariate-analysis r classification spss k-means discriminant-analysis poisson-distribution average r random-forest importance probability conditional-probability distributions standard-deviation time-series machine-learning online forecasting r pca dataset data-visualization bayes distributions mathematical-statistics degrees-of-freedom

Questions tagged «degrees-of-freedom»