Questions tagged «degrees-of-freedom»

术语“自由度”用于描述统计的最终计算中可以自由变化的值的数量。也可用于“有效自由度”。

1
PROC Mixed和LME / LMER在R自由度上的区别
注意:这个问题是一个转贴,因为我的上一个问题出于法律原因不得不删除。 在比较SAS的PROC MIXED与R中lme的nlme软件包的功能时,我偶然发现了一些相当混乱的差异。更具体地说,不同测试的自由度在PROC MIXED和之间有所不同lme,我想知道为什么。 从以下数据集(以下给出的R代码)开始: ind:指示进行测量的个人的因子 fac:进行测量的器官 trt:表示治疗的因素 y:一些连续响应变量 这个想法是建立以下简单模型: y ~ trt + (ind):ind作为随机因子 y ~ trt + (fac(ind)):fac嵌套在ind作为随机因子 需要注意的是最后一个模型应引起奇异性,因为只有1的值y对每一个组合ind和fac。 第一模型 在SAS中,我建立以下模型: PROC MIXED data=Data; CLASS ind fac trt; MODEL y = trt /s; RANDOM ind /s; run; 根据教程,R中使用的相同模型nlme应为: > require(nlme) > options(contrasts=c(factor="contr.SAS",ordered="contr.poly")) > m2<-lme(y~trt,random=~1|ind,data=Data) 两种模型对系数及其SE均给出相同的估计,但是在对F的影响进行F检验时trt,它们使用的自由度不同: SAS : Type …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

1
如果您的自由度超出了桌子的末端,该怎么办?
F表的自由度无法满足我的大样本要求。 例如,如果我有一个自由度为5和6744的F,我如何找到方差分析的5%临界值? 如果我在进行具有较大自由度的卡方检验该怎么办? [这样的问题是在不久前发布的,但是OP出错了,实际上是一个较小的df,将其减少为重复的-但原来的大df问题应该在现场的某个地方有一个答案]

2
lmerTest :: anova中的自由度正确吗?它们与RM-ANOVA有很大不同
我正在分析R中反应时间实验的结果。 我进行了重复测量方差分析(1个受试者内部因素具有2个水平,而1个受试者之间因素具有2个水平)。我运行了一个类似的线性混合模型,我想使用ANOVA表的形式总结lmer结果lmerTest::anova。 不要误会我的意思:我没想到会有相同的结果,但是我不确定lmerTest::anova结果的自由度。在我看来,它反映的是ANOVA,而在主题级别上没有任何汇总。 我知道以下事实:在混合效应模型中计算自由度是很棘手的,但lmerTest::anova在更新的?pvalues主题(lme4包)中被提及为一种可能的解决方案。 这个计算正确吗?结果lmerTest::anova是否正确反映了指定的模型? 更新:我使个体差异更大。自由度lmerTest::anova与简单的方差不同,但是我仍然不确定,为什么它们对于主体内因素/相互作用如此之大。 # mini example with ANT dataset from ez package library(ez); library(lme4); library(lmerTest) # repeated measures ANOVA with ez package data(ANT) ANT.2 <- subset(ANT, !error) # update: make individual differences larger baseline.shift <- rnorm(length(unique(ANT.2$subnum)), 0, 50) ANT.2$rt <- ANT.2$rt + baseline.shift[as.numeric(ANT.2$subnum)] anova.ez <- ezANOVA(data = …

1
我应该使用Welch(1947)的近似自由度还是Satterthwaite(1946)的近似度?
对于用于Welch t检验的近似自由度的正确公式,我感到困惑。Satterthwaite(1946)的公式是最常引用的公式,但是Welch在1947年提出了另一种公式。我不确定哪个更可取(或被大多数统计软件使用)。 Satterthwaite的公式: (s2X/ nX+ 秒2ÿ/ nÿ)2(s2X/ nX)2/( nX− 1 )+ (秒2ÿ/ nÿ)2/( nÿ− 1 )(sx2/nx+sy2/ny)2(sx2/nx)2/(nx−1)+(sy2/ny)2/(ny−1)\frac{\left(s_x^2/n_x +s_y^2/n_y\right)^2}{(s_x^2/n_x )^2/(n_x-1)+(s_y^2/n_y )^2/(n_y-1)} 韦尔奇公式: − 2 + (秒2X/ nX+ 秒2ÿ/ nÿ)2(s2X/ nX)2/( nX+ 1 )+ (小号2ÿ/ nÿ)2/( nÿ+ 1 )−2+(sx2/nx+sy2/ny)2(sx2/nx)2/(nx+1)+(sy2/ny)2/(ny+1)-2+ \frac{\left(s_x^2/n_x +s_y^2/n_y\right)^2}{(s_x^2/n_x )^2/(n_x+1)+(s_y^2/n_y )^2/(n_y+1)} 参考文献: 宾夕法尼亚州萨特斯韦特(1946)。“方差成分估计的近似分布”。生物识别公告,第2卷,第6页,第110-114页。 韦尔奇,BL(1947)。“当涉及几个不同的总体方差时,“学生”问题的推广”。Biometrika,34,1 / 2,第28-35页。

2
为什么匹配对的自由度测试对数减去1?
我习惯知道“自由度”为,在这里有线性模型\ mathbf {Y} = \ mathbf {X} \ boldsymbol {\的β} + \ boldsymbol {\小量} 与\ mathbf {Y } \ in \ mathbb {R} ^ n,\ mathbf {X} \ in M_ {n \ times p}(\ mathbb {R})具有等级r的设计矩阵,\ boldsymbol {\ beta} \ in \ mathbb { R} ^ p,\ boldsymbol {\ epsilon} …

1
通用加性模型:R的输出中的ref.df是什么?
嗨,我在R的输出屏幕中难以理解Ref.df: Approximate significance of smooth terms: edf Ref.df F p-value s(meangrain) 1.779 2.209 3.193 0.0451 * s(depth) 2.108 2.697 3.538 0.0254 * 这是什么意思,有必要在论文中包括此术语以表示GAM的结果吗?它给我们提供预测所需的信息吗?

1
如何比较观察到的事件与预期的事件?
假设我有一个频率为4个可能的事件的样本: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 并且我具有发生事件的预期概率: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 利用我四个事件的观测频率之和(18),我可以计算事件的预期频率,对吗? expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 = 1.8 expectedE1 - …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.