Questions tagged «interpretation»

通常指从统计分析结果中得出实质性结论。

3
如何解释GARCH参数?
我使用标准的GARCH模型: rtσ2t=σtϵt=γ0+γ1r2t−1+δ1σ2t−1rt=σtϵtσt2=γ0+γ1rt−12+δ1σt−12\begin{align} r_t&=\sigma_t\epsilon_t\\ \sigma^2_t&=\gamma_0 + \gamma_1 r_{t-1}^2 + \delta_1 \sigma^2_{t-1} \end{align} 我对系数有不同的估计,需要解释它们。因此,我想知道一个很好的解释,那么,和代表什么?γ0γ0\gamma_0γ1γ1\gamma_1δ1δ1\delta_1 我看到就像是不变的部分。因此,这代表了一种“环境波动”。该代表调整过去的冲击。另外,对我来说不是很直观:它表示对波动的调整。但我想对这些参数有更好,更全面的解释。γ0γ0\gamma_0γ1γ1\gamma_1δ1δ1\delta_1 因此,谁能给我一个很好的解释,说明这些参数代表什么以及如何解释参数的变化(例如,如果增加,这意味着什么?)。γ1γ1\gamma_1 另外,我在几本书中(例如在Tsay中)进行了查询,但是找不到很好的信息,因此,任何有关这些参数解释的文献建议都将受到赞赏。 编辑:我也将对如何解释持久性感兴趣。那么持久性到底是什么? 在我读过的一些书中,GARCH(1,1)的持久性是,但是例如在Carol Alexander第283页的书中,他仅谈到参数(我的)是持久性参数。那么,波动率的持续性()和震荡的持续性()之间有区别吗?γ1+δ1γ1+δ1\gamma_1+\delta_1ββ\betaδ1δ1\delta_1σtσt\sigma_trtrtr_t


1
当包含分类变量之间的交互时,解释混合模型的回归输出
我对使用混合模型/ lmer有疑问。基本模型是这样的: lmer(DV ~ group * condition + (1|pptid), data= df) 组和条件都是两个因素:组具有两个级别(组A,组B),条件具有三个级别(条件1,条件2,条件3)。它是来自人类受试者的数据,因此pptid对每个人都是随机效应。 该模型找到以下带有p值的输出: Estimate MCMCmean HPD95lower HPD95upper pMCMC Pr(>|t|) (Intercept) 6.1372 6.1367 6.0418 6.2299 0.0005 0.0000 groupB -0.0614 -0.0602 -0.1941 0.0706 0.3820 0.3880 condition2 0.1150 0.1151 0.0800 0.1497 0.0005 0.0000 condition3 0.1000 0.1004 0.0633 0.1337 0.0005 0.0000 groupB:condition2 -0.1055 -0.1058 …

4
“适度”还是“互动”?
我遇到了在很多情况下可以互换使用的这两个术语。 基本上,调节者(M)是影响X和Y之间关系的因素。调节分析通常使用回归模型进行。例如,性别(M)会影响“产品研究”(X)和“产品购买”(Y)之间的关系。 在交互中,X1和X2交互以影响Y。此处的相同示例是“产品研究”(X1)受“性别”(X2)影响,并且一起影响“产品购买”(Y)。 我可以看到,适度时,M影响XY关系,但在交互作用中,M(在这种情况下为性别)影响其他IV。 问题:如果我的项目目的是看性别如何影响X和Y之间的关系,我应该使用节制还是互动? 注意:我的项目是关于X和Y之间的相关性,而不是X和Y之间的因果关系。

1
Logistic回归中有无截距模型之间的区别
我想了解逻辑回归中有或没有拦截模型之间的区别 它们之间有什么区别,除了截距系数是相对于基线组的对数(奇数比),无截距系数是相对的(logs)奇数?从我看到的情况来看,两种情况下的系数都相同,但是重要性并不总是相同,并且不明白为什么会这样。此外,在哪些情况下使用无截距的模型是否正确? 这是我的模型:glm(NeverReturn ~ factor(Network) * TotalPrice , family = binomial)而且我不确定是否要保留拦截,因为在“实词”上,总价格无论如何都不能低于50,但是概率是1而不是0,所以我很困惑。

1
Kolmogorov–Smirnov检验与t检验
我在理解2个样本KS检验的解释以及与2组之间的常规t检验有何不同方面遇到一些困难。 可以说我有男性和女性在做一些任务,而我从这项任务中收集了一些分数。我的最终目标是确定男性和女性在这项任务上的表现是否不同 因此,我可以做的一件事就是在两组之间进行测试。我可以做的另一件事是计算男性和女性的ECDF,绘制它们,然后进行2个样本KS测试。我会得到这样的东西: KS测试 KS检验的原假设是2组连续得分分布来自同一人群 进行KS测试时,我得到:D = 0.18888,p值= 0.04742 首先,我想检查一下我对结果的解释是否正确。在这里,我将拒绝原假设,并说男性和女性得分分布来自不同的人群。换句话说,男性和女性得分的分布彼此不同。 更具体地说,男性在此任务上获得较低分数的可能性更高,这就是我从情节中得出的两种性别之间的差异 T检验 现在在测试中,将在得分变量上测试男性和女性均值之间的差异。 让我们想象一下在此任务中男性表现比女性差的情况。在这种情况下,男性得分的分布将以低均值为中心,而女性得分的分布将以高均值为中心。这种情况与上面的情节是一致的,因为男性获得较低分数的可能性更高。 如果t检验显着,我可以得出结论,女性平均得分明显高于男性。或从人口角度而言,女性分数是从平均数高于男性人口的人口中得出的,这听起来与堪萨斯州得出的结论是来自不同人口的结论非常相似。 有什么不同? 因此,我在KS和t测试用例中得出的结论是相同的。男性相对于女性表现较差。那么,使用一种测试优于另一种测试有什么好处?使用KS测试是否可以获得任何新知识? 我认为,男性的分布以低均值为中心,女性的分布以高均值为中心是导致显着t检验的原因。但是,基于同样的事实,男性得分较低值的可能性更高,这将使该图看起来像上面,并进行有效的KS检验。因此,两种检验的结果都具有相同的根本原因,但也许有人可能会说,KS检验不仅考虑了分布的均值,而且还考虑了分布的形状,但是有可能解析出原因仅从测试结果中得出哪些重要的KS测试? 那么在测试中运行KS测试有什么价值呢?并假设我可以满足这个问题的t检验的假设

2
如何解释泊松GLM结果中的参数估计值[关闭]
关闭。这个问题是题外话。它当前不接受答案。 想改善这个问题吗? 更新问题,使它成为交叉验证的主题。 5年前关闭。 Call: glm(formula = darters ~ river + pH + temp, family = poisson, data = darterData) Deviance Residuals: Min 1Q Median 3Q Max -3.7422 -1.0257 0.0027 0.7169 3.5347 Coefficients: Estimate Std.Error z value Pr(>|z|) (Intercept) 3.144257 0.218646 14.381 < 2e-16 *** riverWatauga -0.049016 0.051548 -0.951 0.34166 …

4
什么是随机性?
在概率和统计中,经常使用“随机”和“随机”的概念。通常,随机变量的概念用于对由于偶然而发生的事件进行建模。 我的问题是关于“随机”一词的。什么是随机的?随机性真的存在吗? 我很好奇那些在处理随机事件方面有丰富经验的人会想到并相信随机性。

3
Logistic回归中的拦截项
假设我们有以下逻辑回归模型: logit(p)=β0+β1x1+β2x2logit(p)=β0+β1x1+β2x2\text{logit}(p) = \beta_0+\beta_{1}x_{1} + \beta_{2}x_{2} 是事件时的赔率和?换句话说,当和处于最低级别(即使它不为0)时,这是事件的几率吗?例如,如果和仅采用值和则我们不能将它们设置为0。β0β0\beta_0x1=0x1=0x_1 = 0x2=0x2=0x_2=0x1x1x_1x2x2x_2x1x1x_1x2x2x_2222333

2
解释发生率比
因此,我想拟合一个随机效应负二项式模型。对于这种模型,STATA可以产生指数系数。根据帮助文件,这些系数可以解释为发生率。不幸的是,我不是英语为母语的人,我也不是很了解什么是发病率比率或如何翻译它们。 所以我的问题是,我该如何解释发生率。例如: 如果模型给我一个变量的发生率比为0.7。这将意味着依赖变数的预期观察数(计数)。如果独立var改变一个单位,则改变.7吗? 有人可以帮忙吗?


1
用分类数据解释负二项式GLM的.L和.Q输出
我只是运行负二项式GLM,这是输出: Call: glm.nb(formula = small ~ method + site + depth, data = size.dat, init.theta = 1.080668549, link = log) Deviance Residuals: Min 1Q Median 3Q Max -2.2452 -0.9973 -0.3028 0.3864 1.8727 Coefficients: Estimate Std. Error z value Pr(>|z|) (Intercept) 1.6954 0.1152 14.720 < 2e-16 *** method.L -0.6828 0.1637 -4.171 …

2
预测是判断统计学家能力的“黄金标准”吗?
上周末,我正在阅读Faraway的带有R(第一版)的线性模型教科书。Faraway有一章称为“统计策略和模型不确定性”。他描述(第158页)时,他使用非常复杂的模型人工生成了一些数据,然后要求学生对数据进行建模,并将学生的预测结果与读取结果进行比较。不幸的是,大多数学生过度拟合了测试数据,并给出了完全超出预期的预测值。为了解释这种现象,他给我写了一些令人印象深刻的话: “模型之所以如此不同,是因为学生以不同的顺序应用了各种方法。有些人在变换之前进行了变量选择,而另一些则相反。有些人在模型更改后重复了一种方法,而其他人则没有。我研究了这些策略那几个用于学生和找不到什么明显的错误与他们所做的一切。有一个学生在计算犯了错误他或她的预测值,但没有什么明显错误的其余部分。在这个任务中的表现并没有表现出与考试有任何关系。 ” 我受过教育,模型预测的准确性是我们选择最佳模型性能的“黄金标准”。如果我没记错的话,这也是Kaggle比赛中常用的方法。但是在这里Faraway观察到了一些不同的性质,即模型预测性能可能与无关具有相关统计人员的能力。换句话说,我们能否根据预测能力建立最佳模型并不能真正取决于我们的经验。相反,它取决于巨大的“模型不确定性”(运气不佳?)。我的问题是:在现实生活中的数据分析中也是如此吗?还是我对基本的东西感到困惑?因为如果这是真的,那么对真实数据分析的意义是巨大的:在不知道数据背后的“真实模型”的情况下,经验丰富/经验不足的统计学家所做的工作之间就没有本质的区别:两者都只是前面的疯狂猜测。可用的培训数据。

1
为什么截距的标准
截距项的标准误差(β 0)在Ŷ = β 1 X + β 0 + ε由下式给出小号È (β 0 )2 = σ 2 [ 1β^0β^0\hat{\beta}_0y=β1x+β0+εy=β1x+β0+εy=\beta_1x+\beta_0+\varepsilon 其中ˉX是平均的X我的。SE(β^0)2=σ2[1n+x¯2∑ni=1(xi−x¯)2]SE(β^0)2=σ2[1n+x¯2∑i=1n(xi−x¯)2]SE(\hat{\beta}_0)^2 = \sigma^2\left[\frac{1}{n}+\frac{\bar{x}^2}{\sum_{i=1}^n(x_i-\bar{x})^2}\right]x¯x¯\bar{x}xixix_i 据我了解,在SE量化你的uncertainty-例如,在样本的95%,区间将包含真实β 0。我不明白的SE,不确定性的度量,如何与增加ˉ X。如果我只是转移我的数据,使ˉ X = 0,我的不确定性下降?那似乎是不合理的。[β^0−2SE,β^0+2SE][β^0−2SE,β^0+2SE][\hat{\beta}_0-2SE,\hat{\beta}_0+2SE]β0β0\beta_0x¯x¯\bar{x}x¯=0x¯=0\bar{x}=0 类似的解释是-在我的数据的非中心版本对应于我的预测在X = 0,而在中心的数据,β 0对应于我的预测在X = ˉ X。那么,这是否意味着,然后我讲我在预测的不确定性X = 0比我对我的预测在不确定性较大的X = ˉ X?这似乎也是不合理的,对于所有x值,误差ϵ具有相同的方差β^0β^0\hat{\beta}_0x=0x=0x=0β^0β^0\hat{\beta}_0x=x¯x=x¯x=\bar{x}x=0x=0x=0x=x¯x=x¯x=\bar{x}ϵϵ\epsilonxxx,所以我对所有预测值的不确定性都应该相同。xxx 我敢肯定,我的理解存在差距。有人可以帮助我了解发生了什么吗?

3
在Box-Cox转换后的数据中以原始单位表示答案
对于某些测量,分析结果会以转换后的比例适当显示。但是,在大多数情况下,最好以原始的度量标准显示结果(否则您的工作或多或少就毫无价值)。 例如,在对数转换的数据的情况下,由于记录值的均值不是均值的对数,因此会出现原始标度解释的问题。在对数刻度上取均值估计值的对数,而在原始刻度上不给出均值估计值。 但是,如果日志转换后的数据具有对称分布,则以下关系成立(因为日志保留顺序): 均值[ log(是)] = 中位数[ log(是)] = 日志[ 中位数(Y)]Mean[log⁡(Y)]=Median[log⁡(Y)]=log⁡[Median(Y)]\text{Mean}[\log (Y)] = \text{Median}[\log (Y)] = \log[\text{Median} (Y)] (对数值的对数是原始测量范围的中位数)。 因此,我只能对原始度量标准上的中位数差异(或比率)做出推断。 如果总体大致正常且具有大约标准偏差,则两样本t检验和置信区间最为可靠,因此我们可能会倾向于将Box-Cox变换用作正态假设成立(我也认为这也是方差稳定变换)。 但是,如果将t工具应用于Box-Cox转换后的数据,则会推断出转换后的数据在方式上的差异。我们如何以原始的测量尺度来解释那些?(转换后的值的平均值不是转换后的平均值)。换句话说,在转换后的尺度上对均值的估计值进行逆转换,不会在原始尺度上给出均值的估计值。 在这种情况下,我还可以仅推断中位数吗?有没有可以让我回到原始状态的方法的转换? 这个问题最初是在这里发表评论的

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.