Questions tagged «regression»

用于分析一个(或多个)“因变量”和“因变量”之间的关系的技术。

2
时间序列与回归之间的关系和差异?
时间序列和回归之间的关系和区别是什么? 对于模型和假设,回归模型假设输入变量的不同值在输出变量之间具有独立性,而时间序列模型不是,这是否正确?还有什么其他区别? 有关方法,请访问达灵顿网站 时间序列分析有多种方法,但是最著名的两种方法是回归方法和Box-Jenkins(1976)或ARIMA(自回归综合移动平均)方法。本文档介绍了回归方法。我认为回归方法远远优于ARIMA,主要有以下三个原因 我不太了解网站上的时间序列“回归方法”是什么,它与Box-Jenkins或ARIMA方法有何不同。我很高兴有人可以对这些问题发表一些见解。 感谢致敬!

1
测试某些对比:这是否确实是一个难题?
我将其发布到mathoverflow上,没有人回答: Scheffé的用于识别统计上显着差异的方法是众所周知的。甲对比度的装置中,我= 1 ,... ,- [R的ř种群是线性组合Σ ř 我= 1 c ^ 我μ 我其中Σ ř 我= 1 c ^ 我 = 0μ一世μi\mu_ii = 1 ,… ,ri=1,…,ri=1,\ldots,r[Rrr∑[R我= 1C一世μ一世∑i=1rciμi\sum_{i=1}^r c_i \mu_i∑[R我= 1C一世= 0∑i=1rci=0\sum_{i=1}^r c_i=0,并且对比度的标量倍数本质上是相同的对比度,因此可以说这组对比度是一个投影空间。Scheffé的方法测试了一个零假设,该假设表示这r个总体之间的所有对比均为0,并且在给定显着性水平α的情况下,假设零假设为真,则以概率α拒绝该零假设。而且,如果否定原假设被拒绝,Scheffé指出,他的测试告诉我们哪些对比与0明显不同(我不确定我链接到的Wikipedia文章指出了这一点)。[Rrr000αα\alphaαα\alpha000 我想知道在不同情况下是否可以做类似的事情。考虑一个简单的线性回归模型,其中ε 我〜我。我。d 。ÿ一世= α + βX一世+ ε一世Yi=α+βxi+εiY_i = \alpha + \beta x_i + \varepsilon_i,我= 1 ,... ,Ñ。ε一世〜我。我。d 。ñ(0 ,σ2)εi∼i.i.d.⁡N(0,σ2)\varepsilon_i\sim\operatorname{i.i.d.}N(0,\sigma^2)i=1,…,ni=1,…,ni=1,\ldots,n …



3
相关性或确定系数是否与沿回归线下降的值的百分比相关?
相关是两个变量之间线性关联的度量。确定系数r 2是一个变量的可变性可以由另一个变量的“解释”的量度。[Rrr[R2r2r^2 例如,如果是两个变量之间的相关性,则r 2 = 0.64。因此,一个方面的差异的64%可以通过另一个方面的差异来解释。对?r = 0.8r=0.8r = 0.8[R2= 0.64r2=0.64r^2 = 0.64 对于上述示例,我的问题是,以下任一陈述正确吗? 64%的值沿着回归线下降 80%的值沿着回归线下降

1
R中重复测量的线性回归
我无法弄清楚如何在R in中执行线性回归以进行重复测量设计。在上一个问题(仍未回答)中,建议我不要使用lm而是使用混合模型。我lm以以下方式使用: lm.velocity_vs_Velocity_response <- lm(Velocity_response~Velocity*Subject, data=mydata) (有关数据集的更多详细信息,请参见上面的链接) 但是,我无法在Internet上找到任何带有R代码的示例,该示例显示了如何执行线性回归分析。 我想要的是,一方面是数据的图,一条线与数据相吻合,另一方面,值与p值一起用于模型的显着性检验。[R2R2R^2 有没有人可以提供一些建议?任何R代码示例都可能有很大帮助。 编辑 根据我到目前为止收到的建议,分析我的数据以了解两个变量Velocity_response(源自调查表)和Velocity(源自绩效)之间是否存在线性关系的解决方案应为: library(nlme) summary(lme(Velocity_response ~ Velocity*Subject, data=scrd, random= ~1|Subject)) 摘要的结果如下: > summary(lme(Velocity_response ~ Velocity*Subject, data=scrd, random= ~1|Subject)) Linear mixed-effects model fit by REML Data: scrd AIC BIC logLik 104.2542 126.1603 -30.1271 Random effects: Formula: ~1 | Subject (Intercept) Residual StdDev: …

1
PROC Mixed和LME / LMER在R自由度上的区别
注意:这个问题是一个转贴,因为我的上一个问题出于法律原因不得不删除。 在比较SAS的PROC MIXED与R中lme的nlme软件包的功能时,我偶然发现了一些相当混乱的差异。更具体地说,不同测试的自由度在PROC MIXED和之间有所不同lme,我想知道为什么。 从以下数据集(以下给出的R代码)开始: ind:指示进行测量的个人的因子 fac:进行测量的器官 trt:表示治疗的因素 y:一些连续响应变量 这个想法是建立以下简单模型: y ~ trt + (ind):ind作为随机因子 y ~ trt + (fac(ind)):fac嵌套在ind作为随机因子 需要注意的是最后一个模型应引起奇异性,因为只有1的值y对每一个组合ind和fac。 第一模型 在SAS中,我建立以下模型: PROC MIXED data=Data; CLASS ind fac trt; MODEL y = trt /s; RANDOM ind /s; run; 根据教程,R中使用的相同模型nlme应为: > require(nlme) > options(contrasts=c(factor="contr.SAS",ordered="contr.poly")) > m2<-lme(y~trt,random=~1|ind,data=Data) 两种模型对系数及其SE均给出相同的估计,但是在对F的影响进行F检验时trt,它们使用的自由度不同: SAS : Type …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

1
为什么对
这可能是一个基本问题,但我想知道为什么可以简单地对回归模型中的值求平方以给出一个解释方差图?[RRR 我知道系数可以增强关系的强度,但是我不了解如何简单地平方该值即可说明所解释的方差。[RRR 有什么简单的解释吗? 非常感谢您的帮助!

1
如何在回归模型中选择变量?
传统的变量选择方法是找到对预测新响应贡献最大的变量。最近,我得知了一种替代方法。在确定治疗效果的变量建模中(例如在药物的临床试验中),该变量被定性地相互作用如果在其他条件不变的情况下进行治疗,则该变量的更改会导致最有效治疗的更改。这些变量并不总是有效的预测指标,但对于医师决定个体患者的治疗时可能很重要。莱西·甘特(Lacey Gunter)在其博士论文中开发了一种选择这些定性相互作用变量的方法,而这些变量可能会被基于预测的选择算法所遗漏。最近,我与她合作,将这些方法扩展到其他模型,包括逻辑回归和Cox比例风险回归模型。 我有两个问题: 您如何看待这些新方法的价值? 对于传统方法,您更喜欢哪种方法?诸如AIC,BIC,Mallows Cp,F测试之类的条件,用于逐步,向前和向后输入或删除变量... 有关此问题的第一篇论文发表在Gunter,L.,Zhu,J和Murphy,SA(2009)。定性相互作用的变量选择。统计方法论 doi:10,1016 / j.stamet.2009.05.003。 下一篇论文发表在Gunter,L.,Zhu,J.和Murphy,SA(2011)中。 在控制家庭错误率的同时个性化医学中定性相互作用的变量选择。Journal of Biopharmaceutical Statistics 21,1063-1078。 下一个出现在有关变量选择的特刊上,Gunter,L.,Chernick,MR和Sun,J.(2011)。关于治疗选择的回归变量选择的一种简单方法。巴基斯坦统计与运筹学杂志 7:363-380。 您可以在期刊网站上找到这些论文。您可能必须购买该物品。我可能有这些文章的pdf文件。莱西和我刚刚完成了有关此主题的专着,并将于今年晚些时候作为SpringerBrief出版。

2
分析逻辑回归系数
这是逻辑回归系数的列表(第一个是截距) -1059.61966694592 -1.23890500515482 -8.57185269220438 -7.50413155570413 0 1.03152408392552 1.19874787949191 -4.88083274930613 -5.77172565873336 -1.00610998453393 我发现截距如此之低如此奇怪,并且我的系数实际上等于0。我不确定如何解释这一点。0是否表示特定变量对模型完全没有影响?但是,通过输入某列进行的拦截真的很重要吗?还是我的数据只是废话而模型无法正确地适应它。

1
R中的偏最小二乘回归:为什么标准化数据上的PLS不等于最大化相关性?
我在偏最小二乘(PLS)非常新,我试着去了解R函数的输出plsr()的pls包。让我们模拟数据并运行PLS: library(pls) n <- 50 x1 <- rnorm(n); xx1 <- scale(x1) x2 <- rnorm(n); xx2 <- scale(x2) y <- x1 + x2 + rnorm(n,0,0.1); yy <- scale(y) p <- plsr(yy ~ xx1+xx2, ncomp=1) 我期望以下数字aaa和bbb > ( w <- loading.weights(p) ) Loadings: Comp 1 xx1 0.723 xx2 0.690 Comp 1 SS …

2
交叉验证和有序逻辑回归
我正在尝试了解有序逻辑回归的交叉验证。游戏的目的是验证分析中使用的模型。 我首先构造一个玩具数据集: set.seed(1) N <- 10000 # predictors x1 <- runif(N) x2 <- runif(N) x3 <- runif(N) # coeffs in the model a <- c(-2,-1) x <- -x1+2*x2+x3 # P( y ≤ i ) is given by logit^{-1} ( a[i]+x ) p <- outer(a,x, function(a,x) 1/(1+exp(-a-x)) ) # computing the …

1
Hosmer-Lemeshow与AIC进行逻辑回归
如果Hosmer-Lemeshow表示不合身,但AIC在所有模型中最低,请问您是否仍在使用该模型? 如果删除变量,则Hosmer-Lemeshow统计数据并不重要(这意味着完全不存在拟合度不足)。但是AIC增加了。 编辑:我认为通常,如果不同模型的AIC彼此接近(即),则它们基本上是相同的。但是AIC却大不相同。这似乎表明AIC最低的那个是我应该使用的那个,即使Hosmer-Lemeshow测试表明不是这样。&lt; 2&lt;2<2 也许HL测试仅适用于大样本?对于小样本量(我的样本量约为300),它具有较低的功耗。但是,如果我得到了显着的结果……这意味着即使功率很低,我也会遭到拒绝。 如果我使用AICc与AIC会有所不同吗?您如何在SAS中获得AICc?我知道多样性可能存在问题。但是我先验地假设这些变量对结果有影响。 任何意见? Edit2:我认为我应该使用变量少一个而模型AIC较高且HL不显着的模型。原因是因为其中两个变量相互关联。因此,摆脱一个很有意义。

2
线性回归中t检验和方差分析之间的差异
我想知道线性回归中t检验和ANOVA之间有什么区别? 是t检验来检验任何一个斜率和截距是否均值为零,而方差分析是用来检验所有斜率是否均均值为零吗?这是它们之间的唯一区别吗? 在简单的线性回归中,即只有一个预测变量的情况下,只有一个斜率可以估计。那么,t检验和ANOVA是否等效?如果是的话,假设它们使用不同的统计量(t检验使用t统计量,而ANOVA则使用F统计量),怎么做?

9
本书提供了统计方法的广泛而概念性的概述
我对统计分析在模拟/预测/功能估计等方面的潜力非常感兴趣。 但是,我对此并不太了解,我的数学知识仍然非常有限-我是软件工程专业的一名本科生。 我正在寻找一本可以让我开始不断学习的东西的书:线性回归和其他类型的回归,贝叶斯方法,蒙特卡洛方法,机器学习等。我也想开始使用R,所以如果有一本书将两者结合在一起,真是太棒了。 最好是,我希望这本书从概念上而不是过多的技术细节上进行解释-我希望统计数据对我来说非常直观,因为我知道统计数据存在很多风险。 我当然愿意阅读更多书籍,以增进对我认为有价值的主题的理解。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.