Questions tagged «linear»

对于涉及线性假设的统计主题,例如,线性回归或线性混合模型,或讨论应用于统计的线性代数。

1
高矩形矩阵对随机变量的线性变换
假设我们有一个随机向量,它是从概率密度函数为的分布中得出的。如果我们用一个完整的矩阵对其进行线性变换,得到,则的密度由X⃗ ∈RnX→∈Rn\vec{X} \in \mathbb{R}^nfX⃗ (x⃗ )fX→(x→)f_\vec{X}(\vec{x})n×nn×nn \times nAAAY⃗ =AX⃗ Y→=AX→\vec{Y} = A\vec{X}Y⃗ Y→\vec{Y}fY⃗ (y⃗ )=1|detA|fX⃗ (A−1y⃗ ).fY→(y→)=1|detA|fX→(A−1y→). f_{\vec{Y}}(\vec{y}) = \frac{1}{\left|\det A\right|}f_{\vec{X}}(A^{-1}\vec{y}). 现在说我们变换X⃗ X→\vec{X}代替由m×nm×nm \times n矩阵BBB,与m>nm>nm > n,给人Z⃗ =BX⃗ Z→=BX→\vec{Z} = B\vec{X}。显然,Z∈RmZ∈RmZ \in \mathbb{R}^m,但是它“存在于” nnn维子空间G⊂RmG⊂RmG \subset \mathbb{R}^m。已知Z⃗ Z→\vec{Z}位于G中,它的条件密度是GGG多少? 我的第一个本能是使用B的伪逆BBB。如果B=USVTB=USVTB = U S V^T是奇异值分解BBB,然后B+=VS+UTB+=VS+UTB^+ = V S^+ U^T是伪逆,其中S+S+S^+通过反转对角矩阵的非零项形成SSS。我猜想这会给fZ⃗ (z⃗ )=1∣∣det+S∣∣fX⃗ (B+z⃗ ),fZ→(z→)=1|det+S|fX→(B+z→), …

5
什么时候使用混合效果模型?
线性混合效应模型是线性回归模型的扩展,用于分组收集和汇总的数据。关键优势在于系数可以相对于一个或多个组变量而变化。 但是,我在何时使用混合效果模型方面感到困惑?我将通过在极端情况下使用玩具示例来阐述我的问题。 假设我们要为动物的身高和体重建模,并使用物种作为分组变量。 如果不同的群体/物种真的不同。说一只狗和大象。我认为没有必要使用混合效果模型,我们应该为每个小组建立一个模型。 如果不同的群体/物种真的很相似。说一只母狗和一只公狗。我认为我们可能希望将性别用作模型中的分类变量。 因此,我假设我们应该在中间情况下使用混合效果模型?可以说,该组是猫,狗,兔子,它们是大小相似的动物,但不同。 是否有任何正式的论据来建议何时使用混合效果模型,即如何在 为每个小组建立模型 混合效应模型 将组用作回归中的分类变量 我的尝试:方法1是最“复杂的模型” /更少的自由度,方法3是最“简单的模型” /更大的自由度。混合效果模型位于中间。我们可能会考虑根据Bais Variance Trade Off选择正确模型所需的数据量和复杂度。

1
添加线性回归预测变量可减小R平方
我的数据集()具有因变量(DV),五个独立的“基准”变量(P1,P2,P3,P4,P5)和一个独立的关注变量(Q)。N≈10,000N≈10,000N \approx 10,000 我为以下两个模型运行了OLS线性回归: DV ~ 1 + P1 + P2 + P3 + P4 + P5 -> R-squared = 0.125 DV ~ 1 + P1 + P2 + P3 + P4 + P5 + Q -> R-squared = 0.124 即,添加预测变量Q减少了线性模型中解释的方差量。据我了解,这不应该发生。 明确地说,这些是R平方值,而不是调整后的R平方值。 我已经使用Jasp和Python的statsmodels验证了R平方值。 有什么理由可以看到这种现象吗?也许与OLS方法有关的东西?

4
如何解释考克斯风险模型的生存曲线?
您如何从考克斯比例风险模型解释生存曲线? 在这个玩具示例中,假设我们对数据age变量有一个cox比例风险模型kidney,并生成了生存曲线。 library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() 例如,在时间,哪个说法是正确的?还是两者都不对?200200200 陈述1:我们将剩下20%的主题(例如,如果我们有人,那么到200天时,我们应该剩下200个左右), 100010001000200200200200200200 陈述2:对于一个给定的人,他/她有200 20%20%20\%机会在200天生存200200200。 我的尝试:我不认为这两个陈述是相同的(如果我错了,请纠正我),因为我们没有iid假设(所有人的生存时间不是独立地来自一个分布)。在这里我的问题类似于逻辑回归,每个人的危险率取决于该人的。βTxβTx\beta^Tx

2
仍然是同一族的两个随机非法线的线性组合
众所周知,两个随机正态变量的线性组合也是一个随机正态变量。是否有任何共同的非正态分布族(例如Weibull)也共享此属性?似乎有许多反例。例如,制服的线性组合通常不是均匀的。特别是,是否存在以下两个都成立的非正态分布族: 来自该族的两个随机变量的线性组合等效于该族中的某些分布。 可以根据原始参数和线性组合中的常数来确定结果参数。 我对这种线性组合特别感兴趣: Y=X1⋅w+X2⋅(1−w2)−−−−−−−√Y=X1⋅w+X2⋅(1−w2)Y = X_1 \cdot w + X_2 \cdot \sqrt{(1-w^2)} 其中和是从某个具有参数和非正常族中采样的,而来自同一个具有参数非正规族。X 2 θ 1 θ 2 Ŷ θ Ý = ˚F (θ 1,θ 2,瓦特)X1X1X_1X2X2X_2θ1θ1\theta_1θ2θ2\theta_2YYYθY=f(θ1,θ2,w)θY=f(θ1,θ2,w)\theta_Y = f(\theta_1, \theta_2, w) 为了简单起见,我将描述一个带有1个参数的发布系列,但是我愿意接受带有多个参数的发布系列。 另外,我正在寻找一个示例,其中和上有足够的参数空间可用于模拟目的。如果您只能找到一个适用于某些非常特定的和的示例,那将没有太大帮助。θ 2 θ 1 θ 2θ1θ1\theta_1θ2θ2\theta_2θ1θ1\theta_1θ2θ2\theta_2
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.