Questions tagged «linear-model»

指任何模型,其中随机变量通过在有限数量的参数中呈线性的函数与一个或多个随机变量相关。

3
为什么区分“线性”回归和“非线性”回归很重要?
区分线性模型和非线性模型的重要性是什么?问题非线性与广义线性模型:您如何指代逻辑回归,泊松等回归?它的答案是对广义线性模型的线性/非线性的非常有帮助的说明。区分线性模型和非线性模型似乎至关重要,但是我不清楚为什么?例如,考虑以下回归模型: Ë[ Y∣ X]Ë[ Y∣ X]Ë[ Y∣ X]Ë[ Y∣ X]= β0+ β1个X= β0+ β1个X+ β2X2= β0+ β21个X= { 1 + exp(− [ β0+ β1个X] }− 1(1)(2)(3)(4)(1)E[Y∣X]=β0+β1X(2)E[Y∣X]=β0+β1X+β2X2(3)E[Y∣X]=β0+β12X(4)E[Y∣X]={1+exp⁡(−[β0+β1X]}−1\begin{align} E[Y \mid X] & = \beta_0 + \beta_1 X \tag{1} \\ E[Y \mid X] & = \beta_0 + \beta_1 X + \beta_2 X^2 \tag{2} …

1
为什么高斯线性模型中的F检验功能最强大?
对于高斯线性模型,其中μ,假定为位于某些向量空间W ^和ģ对标准正态分布ř Ñ,所述的统计˚F -test为ħ 0:{ μ ∈ ù }其中ü ⊂ w ^是一个向量空间,是的增加一到一个功能偏差统计: ˚F = φ ( 2 日志SUP μ ∈ w ^ÿ= μ + σGY=μ+σGY=\mu+\sigma Gμμ\muw ^WWGGG[RñRn\mathbb{R}^nFFFH0:{ μ ∈ û}H0:{μ∈U}H_0\colon\{\mu \in U\}ü⊂ w ^U⊂WU \subset W 我们怎么知道这个统计数据为H0提供了最有力的检验(也许在丢弃了异常情况之后)?因为这个定理断言,似然比测试是最有力的对点的假设这并不奈曼皮尔森定理干ħ0:{μ=μ0,σ=σ0}和ħ1:{F= ϕ ( 2 对数SUPμ ∈ w ^,σ> 0L (μ ,σ| ÿ)SUPμ ∈ û,σ> …




2
使用lm()时R中权重参数背后的理论
在读研究生一年后,我的“加权最小二乘”的理解是这样的:让y∈Rny∈Rn\mathbf{y} \in \mathbb{R}^n,XX\mathbf{X}是一些n×pn×pn \times p设计矩阵,是一个参数向量中的是误差向量,使得,其中和。然后模型 β∈Rpβ∈Rp\boldsymbol\beta \in \mathbb{R}^pϵ∈Rnϵ∈Rn\boldsymbol\epsilon \in \mathbb{R}^nϵ∼N(0,σ2V)ϵ∼N(0,σ2V)\boldsymbol\epsilon \sim \mathcal{N}(\mathbf{0}, \sigma^2\mathbf{V})V=diag(v1,v2,…,vn)V=diag(v1,v2,…,vn)\mathbf{V} = \text{diag}(v_1, v_2, \dots, v_n)σ2>0σ2>0\sigma^2 > 0y=Xβ+ϵy=Xβ+ϵ\mathbf{y} = \mathbf{X}\boldsymbol\beta + \boldsymbol\epsilon 在该假设下的模型称为“加权最小二乘”模型。WLS问题最终是找到 argminβ(y−Xβ)TV−1(y−Xβ).arg⁡minβ(y−Xβ)TV−1(y−Xβ).\begin{equation} \arg\min_{\boldsymbol \beta}\left(\mathbf{y}-\mathbf{X}\boldsymbol\beta\right)^{T}\mathbf{V}^{-1}\left(\mathbf{y}-\mathbf{X}\boldsymbol\beta\right)\text{.} \end{equation} 假设y=[y1…yn]Ty=[y1…yn]T\mathbf{y} = \begin{bmatrix} y_1 & \dots & y_n\end{bmatrix}^{T},β=[β1…βp]Tβ=[β1…βp]T\boldsymbol\beta = \begin{bmatrix} \beta_1 & \dots & \beta_p\end{bmatrix}^{T}和 X=⎡⎣⎢⎢⎢⎢⎢x11x21⋮xn1⋯⋯⋮⋯x1px2p⋮xnp⎤⎦⎥⎥⎥⎥⎥=⎡⎣⎢⎢⎢⎢⎢xT1xT2⋮xTn⎤⎦⎥⎥⎥⎥⎥.X=[x11⋯x1px21⋯x2p⋮⋮⋮xn1⋯xnp]=[x1Tx2T⋮xnT].\mathbf{X} = \begin{bmatrix} x_{11} & \cdots …

3
如何讨论多条新兴线的散布图?
我们已经测量了两个变量,散点图似乎暗示了多个“线性”模型。有没有办法尝试提炼那些模型?事实证明,确定其他自变量是困难的。 这两个变量都向左偏斜(偏小),这是我们域中的预期分布。点的强度表示此处的数据点数量(以比例)。 &lt; x ,y &gt;日志10log10\log_{10}&lt; x ,y&gt;&lt;x,y&gt; 或者,是否有办法将这些点聚类? 在我们的领域中,声称这两个变量线性相关。我们正在尝试了解/解释为什么我们的数据不是这种情况。 (注意,我们有1700万个数据点) 更新:感谢您提供所有答案,以下是一些要求的说明: 这两个变量都是整数,这解释了对数散点图中的某些模式。 幸运的是,根据定义,两个变量的最小值均为1。 7M点位于(由数据的左偏度“解释”)&lt; 3 ,1 &gt;&lt;3,1&gt;<3,1> 以下是要求的地块: log-log散点图: (空格由整数值引起) 对数对数极坐标: θ = yθ=y\theta = y 比例直方图: 频率以对数刻度表示,因为条为7M点,并且会隐藏其他条。1 / 31/31/3

4
在统计中使用分贝
我正在从事一个涉及读取RFID标签并比较读者在更改天线配置(天线数量,位置等)时看到的信号强度的项目。作为项目的一部分,我需要比较设置以查看最有效的设置。 理想情况下,我将能够在两个天线位置(或多个天线位置)之间执行未配对t检验或ANOVA。但是,由于响应是以对数为分贝,所以我想知道最好的方法是什么? 最好将结果转换成线性比例,然后使用我提到的一种方法进行比较,还是应该使用分贝(按原样)以及其他统计检验来进行比较?

5
隐藏教授(回归战舰)的回归模型[关闭]
已关闭。这个问题需要细节或说明。它当前不接受答案。 想改善这个问题吗?添加细节并通过编辑此帖子来澄清问题。 2年前关闭。 我正在做一项家庭作业,我的教授希望我们创建一个真正的回归模型,模拟数据样本,他将尝试使用我们在课堂上学到的一些技术来寻找我们真正的回归模型。同样,我们将不得不对他给我们的数据集做同样的事情。 他说,过去的所有尝试去欺骗他的人,他都能产生出非常准确的模型。有一些学生创建了一些疯狂的模型,但是可以说他能够产生一个简单的模型就足够了。 我该如何为他找到一个棘手的模型?我不想做4个二次项,3个观测值和大量方差而变得超级便宜吗?我如何才能生成一个看起来无害的数据集,该数据集下面有一个艰难的小模型? 他只是遵循以下3条规则: 您的数据集必须有一个“ Y”变量和20个“ X”变量,分别标记为“ Y”,“ X1”,...,“ X20”。 您的响应变量必须来自满足以下条件的线性回归模型: 其中和。ÿ ' 我 = β 0 + β 1 X ' 我1 + ... + β p - 1 X ' 我,p - 1 + ε 我ε 我〜Ñ (0 ,σ 2)ÿYY ÿ′一世= β0+ β1个X′我1+ … + …

5
证明OLS估计量是尺度相等的吗?
我没有尺度等方差的正式定义,但是这是《统计学习入门》在p上对此的描述。217: 标准最小二乘系数...是等比例的:将乘以常数只会导致将最小二乘系数估计值按比例缩放。XĴXĴX_jCCc1 / c1个/C1/c 为简单起见,我们假设通用线性模型,其中,是矩阵(其中),其中,和是具有的实值随机变量的维向量。- [R β &Element; [R p + 1 ε Ñ ë [ ε ] = 0 Ñ × 1ÿ = X β+εÿ=Xβ+ϵ\mathbf{y} = \mathbf{X}\boldsymbol\beta + \boldsymbol\epsilonÿ ∈ řñÿ∈[Rñ\mathbf{y} \in \mathbb{R}^NXX\mathbf{X}ñ× (p + 1 )ñ×(p+1个)N \times (p+1)p + 1 &lt; Np+1个&lt;ñp+1 < N[R[R\mathbb{R}β &Element; [Rp + 1β∈[Rp+1个\boldsymbol\beta …

1
预测间隔=可信间隔?
我想知道预测间隔和可信间隔是否会评估同一件事。 例如,使用线性回归,当您估计拟合值的预测间隔时,您将估计期望值下降的间隔的极限。相反,与置信区间相反,您不会关注平均值等分布参数,而是会针对指定的X值(假设)来说明变量的取值。(1−α)%(1−α)%(1-\alpha)\% Y=a+b.X Y=a+b.X\ Y = a + b.X 当从后验概率分布中估计贝叶斯框架内给定值的拟合值时,可以估计可信区间。这个间隔是否为您提供了有关拟合值的相同信息?XXX

1
如何解释已记录的结果变量的负线性回归系数?
我有一个线性回归模型,其中记录了因变量,而自变量是线性的。关键自变量的斜率系数为负: .。不确定如何解释。− .0564−.0564-.0564 我是否使用绝对值然后将其变为负值,如下所示: (exp(0.0564 )- 1 )⋅ 100 = 5.80(exp⁡(0.0564)−1)⋅100=5.80(\exp(0.0564)-1) \cdot 100 = 5.80 要么 我是否要像这样插入负系数: (exp(- 0.0564 )- 1 )⋅ 100 = - 5.48(exp⁡(−0.0564)−1)⋅100=−5.48(\exp(-0.0564)-1) \cdot 100 = -5.48 换句话说,我是使用绝对数字然后将其变为负数还是插入负系数?我如何用X的单位增加与Y的__%减少相关的方式表达我的发现?如您所见,这两个公式产生两个不同的答案。

2
lm的默认诊断图的可能扩展(在R中和一般而言)?
我开始深入研究plot.lm函数,该函数给出了lm的六个图,它们是: 残差与拟合值的关系图 sqrt(|残差|)对拟合值的比例位置图 普通QQ图,库克距离与行标签的图 残差与杠杆的关系图 库克距离与杠杆/(1-杠杆)的关系图 我想知道线性图还存在电流图的其他常见/有用扩展,以及它们如何在R中完成?(也欢迎链接到包装的文章) 因此,boxcox函数(来自{MASS})是另一个有用的诊断图的示例(这样的答案会很好),但是,我对R中lm的现有默认诊断图的变化/扩展感到好奇(尽管一般始终欢迎您对此主题发表其他评论)。 这是我的意思的一些简单示例: #Some example code for all of us to refer to set.seed(2542) x1 &lt;- rnorm(100) x2 &lt;- runif(100, -2,2) eps &lt;- rnorm(100,0,2) y &lt;- 1 + 2*x1 + 3*x2 + eps y[1:4] &lt;- 14 # adding some contaminated points fit &lt;- lm(y~x1+x2) …

1
线性回归中的正态性假设
作为线性回归的假设,误差分布的正态性有时被错误地“扩展”或解释为需要y或x的正态性。 是否可以构造一个场景/数据集,其中X和Y是非正态的,但误差项是,因此获得的线性回归估计值是有效的?

3
如何计算两个斜率之差?
有没有一种方法可以了解两条线(或多或少)是否平行?我有两条线是从线性回归生成的,我想了解它们是否平行。换句话说,我想得到这两条线的斜率的不同。 是否有R函数来计算? 编辑: ...,以及如何获得线性回归线的斜率(以度为单位)?

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.