Questions tagged «multivariate-regression»

具有多个响应(因变量)的回归。

2
R中的多元多元回归
我有2个因变量(DV),每个因变量的得分可能受7个独立变量(IV)的影响。DV是连续的,而IV则由连续变量和二进制编码变量组成。(在下面的代码中,连续变量用大写字母写,二进制变量用小写字母写。) 该研究的目的是揭示IV变量如何影响这些DV。我提出了以下多元多元回归(MMR)模型: my.model <- lm(cbind(A, B) ~ c + d + e + f + g + H + I) 为了解释结果,我调用两个语句: summary(manova(my.model)) Manova(my.model) 这两个调用的输出都粘贴在下面,并且有很大的不同。有人可以解释一下应该适当选择总结MMR结果的两种说法中的哪一种吗?为什么?任何建议将不胜感激。 使用using的输出summary(manova(my.model)): > summary(manova(my.model)) Df Pillai approx F num Df den Df Pr(>F) c 1 0.105295 5.8255 2 99 0.004057 ** d 1 0.085131 4.6061 2 99 …


6
为什么我们需要多元回归(而不是一堆单变量回归)?
我刚刚浏览了这本精彩的书:Johnson和Wichern的应用多元统计分析。具有讽刺意味的是,我仍然无法理解使用多变量(回归)模型而不是单独的单变量(回归)模型的动机。我经历了stats.statexchange帖子1和2,它们解释了(a)多元回归和多元回归之间的差异和(b)多元回归结果的解释,但是我无法根据所有信息调整使用多元统计模型上网了解他们。 我的问题是: 为什么我们需要多元回归?为了得出推论,同时考虑结果而不是单独考虑结果的好处是什么。 何时使用多元模型以及何时使用多个单变量模型(针对多个结果)。 举一个在UCLA网站上给出的例子,它具有三个结果:控制源,自我概念和动机。关于1.和2.,当我们进行三个单变量多元回归与一个多元多元回归时,我们可以比较分析吗?如何证明彼此的正当性? 我还没有碰到很多利用多元统计模型的学术论文。这是因为存在多元正态性假设,模型拟合/解释的复杂性还是任何其他特定原因?

2
将多元线性模型转换为多元回归
将多元线性回归模型重铸为多元线性回归是否完全等效?我指的不是简单地运行单独的回归。ttt 我已经在几个地方(贝叶斯数据分析-Gelman等人,以及Multivariate Old School-Marden)中读到了这一点,可以很容易地将多元线性模型重新参数化为多元回归。但是,两个消息来源都没有对此进行详细说明。他们本质上只是提到它,然后继续使用多元模型。数学上,我将首先编写多元版本, Yn×t=Xn×kBk×t+Rn×t,Yn×t=Xn×kBk×t+Rn×t, \underset{n \times t}{\mathbf{Y}} = \underset{n \times k}{\mathbf{X}} \hspace{2mm}\underset{k \times t}{\mathbf{B}} + \underset{n \times t}{\mathbf{R}}, 其中粗体变量是矩阵,其大小在其下方。和往常一样,是数据,是设计矩阵,是正态分布的残差,而是我们感兴趣的推理对象。X R BYY\mathbf{Y}XX\mathbf{X}RR\mathbf{R}BB\mathbf{B} 要将其重新参数化为熟悉的多元线性回归,只需将变量重写为: ynt×1=Dnt×nkβnk×1+rnt×1,ynt×1=Dnt×nkβnk×1+rnt×1, \underset{nt \times 1}{\mathbf{y}} = \underset{nt \times nk}{\mathbf{D}} \hspace{2mm} \underset{nk \times 1}{\boldsymbol{\beta}} + \underset{nt \times 1}{\mathbf{r}}, 其中使用的重新参数化为y=row(Y)y=row(Y)\mathbf{y} = row(\mathbf{Y}) ,β=row(B)β=row(B)\boldsymbol\beta = row(\mathbf{B})和D=X⊗InD=X⊗In\mathbf{D} = \mathbf{X} \otimes \mathbf{I}_{n}。 row()row()row()表示矩阵的行首尾相连排列成一个长向量,⊗⊗\otimes是kronecker或外部乘积。 …

4
神经网络用于多重输出回归
我有一个包含34个输入列和8个输出列的数据集。解决问题的一种方法是采用34个输入并为每个输出列建立单独的回归模型。我想知道是否可以仅使用一种模型(特别是使用神经网络)解决该问题。 我使用了多层感知器,但是像线性回归一样需要多个模型。顺序学习1可以可行吗?我尝试使用TensorFlow,它似乎无法处理浮点值。 任何通过仅使用一个统一模型(特别是使用神经网络)解决该问题的建议将不胜感激。 Ilya Sutskever,Oriol Vinyals和Quoc V.Le(2014)。使用神经网络进行序列学习。神经信息处理系统进展,27。(pdf)

1
多元线性回归与几个单变量回归模型
在单变量回归设置中,我们尝试建模 y=Xβ+noisey=Xβ+noisey = X\beta +noise 其中的向量Ñ观察和X ∈ [R Ñ × 中号与设计矩阵米预测因子。该解决方案是β 0 = (X Ť X )- 1 X ý。y∈Rny∈Rny \in \mathbb{R}^nnnnX∈Rn×mX∈Rn×mX \in \mathbb{R}^{n \times m}mmmβ0=(XTX)−1Xyβ0=(XTX)−1Xy\beta_0 = (X^TX)^{-1}Xy 在多元回归设置中,我们尝试建模 Y=Xβ+noiseY=Xβ+noiseY = X\beta +noise 其中是矩阵Ñ观察和p不同潜在变量。该解决方案是β 0 = (X Ť X )- 1 X ý。y∈Rn×py∈Rn×py \in \mathbb{R}^{n \times p}nnnpppβ0=(XTX)−1XYβ0=(XTX)−1XY\beta_0 = (X^TX)^{-1}XY 我的问题是,与执行不同的单变量线性回归有何不同?我在这里读到,在后一种情况下,我们考虑了因变量之间的相关性,但我从数学上看不到它。ppp

1
如何在lme4中解释多元混合模型的系数而无需整体拦截?
我正在尝试在中拟合多变量(即多响应)混合模型R。除了ASReml-r和SabreR软件包(需要外部软件)之外,似乎只有在中才有可能MCMCglmm。Jarrod Hadfield 在包装随附的论文MCMCglmm(pp.6)中描述了拟合模型的过程,例如将多个响应变量重塑为一个长格式变量,然后抑制总体截距。我的理解是,抑制截距会使响应变量每个级别的系数解释变为该级别的平均值。鉴于以上所述,因此是否可以使用来拟合多元混合模型lme4?例如: data(mtcars) library(reshape2) mtcars <- melt(mtcars, measure.vars = c("drat", "mpg", "hp")) library(lme4) m1 <- lmer(value ~ -1 + variable:gear + variable:carb + (1 | factor(carb)), data = mtcars) summary(m1) # Linear mixed model fit by REML # Formula: value ~ -1 + variable:gear + variable:carb + (1 | …

3
大型数据集的高斯过程回归
我一直在从在线视频和讲义中学习有关高斯过程回归的知识,我的理解是,如果我们有一个包含个点的数据集,那么我们就假设数据是从维多元高斯模型中采样的。所以我的问题是在是百万分之一的情况下,高斯过程回归仍然有效吗?内核矩阵会不会很大,从而使过程完全无效?如果是这样,是否有适当的技术来处理此问题,例如多次重复从数据集中采样?处理这类案件有哪些好的方法? ññnññnññn

1
r中套索的多元线性回归
我正在尝试创建一个简化的模型来预测许多高度相关的因变量(DV)(〜450)。 我的自变量(IV)也很多(〜2000)并且高度相关。 如果我使用套索分别为每个输出选择一个简化的模型,那么当我遍历每个因变量时,不能保证获得相同的独立变量子集。 是否有在R中使用套索的多元线性回归? 这不是组套索。套索组IV。我想要多元线性回归(意味着DV是矩阵,而不是标量的向量),它也实现套索。(注意:正如NRH所指出的,这是不正确的。组套索是一个通用术语,它包括对IV进行分组的策略,但也包括对其他参数(如DV)进行分组的策略) 我发现本文进入了所谓的稀疏重叠集套索 这是一些进行多元线性回归的代码 > dim(target) [1] 6060 441 > dim(dictionary) [1] 6060 2030 > fit = lm(target~dictionary) 这是在单个DV上执行套索的一些代码 > fit = glmnet(dictionary, target[,1]) 这就是我想做的: > fit = glmnet(dictionary, target) Error in weighted.mean.default(y, weights) : 'x' and 'w' must have the same length 一次选择适合所有目标的特征

2
耦合来自具有多个空间分辨率/尺度的源的时间序列信息
我有许多来自不同传感器的卫星光栅图像。根据这些,较粗的那些具有非常丰富的时间分辨率。中分辨率栅格的采集日期往往较少,但仍可获得一定程度的信息。较高分辨率的时间分辨率非常低,在不到两年的时间内从2到6个观测日期跨越。我想知道是否有人以任何方式努力研究这种多尺度时间序列?我希望使用较粗略的可用信息来预测较细微的将来值。对我来说有意义的是,数据必须相关(是的,图像覆盖相同的区域),但是我不知道如何在预测模型中开始耦合此信息。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.