Questions tagged «statistics»

2
当政策不是不变的时候,为什么要使用经验宏观经济模型(Lucas Critique)?
这个问题很可能是重复的,我试图在社区中找到一个问题,但是我没有成功。 按照卢卡斯批评的观点,从广义上讲,经验主义宏观经济模型的问题在于它们对政策变化没有不变性,因此我们不能从中得出任何政策结论。 那么我的问题是为什么我们仍然使用它们? 任何帮助,将不胜感激。

6
以前的研究人员是否仅仅因为统计上的谬误而未能检测到热手?
许多篮球迷/球员认为,连续拍摄好几次后,下一枪更有可能打进去。这有时被称为热手。 从(我认为)Gilovich,Mallone和Tversky(1985)开始,“证明”这实际上是一个谬论。即使连续拍摄了几张照片,也不会比您的平均拍摄百分比所指示的要拍摄下一张照片。 Miller and Sanjurjo(2015)指出,事实上确实存在大手笔,以前的研究人员只是将猎物陷于相当基本的统计谬误。他们的论点是这样的: 掷硬币四次。计算H跟随H的概率。举几个例子:HHTT的概率为1/2,HTHT的概率为0/2,TTHH的概率为0/1 1/1,TTTT和TTTH均为NA Miller和Sanjurjo的妙语是该概率的预期值不是0.5,而是≈0.4。以前的研究人员所犯的错误是错误地假定此概率的期望值为0.5。因此,例如,如果这些以前的研究人员进行了上述硬币翻转实验,并且发现平均概率为0.497,他们错误地得出结论,没有证据表明有热手迹象(与0.5并无显着差异),而实际上强手的有力证据(与0.4显着不同)。 我的问题是:Miller和Sanjurjo是否正确地认为以前的研究人员仅由于此错误而未能检测到热手?我只浏览了一篇或两篇论文,所以我想从这里的一些人那里得到一些确认,他们可能对这方面的文献了解得更多。这种错误持续了三十年甚至更长时间似乎是一个令人惊讶的愚蠢错误。

1
误区-根据时间和满意度得分确定最佳登机策略
大多数航空公司从飞机的后部开始登机,然后朝着前部工作(登上优先舱和乘客后)。 在Mythbusters的一集中,Adam和Jamie检验了一个神话,即大多数航空公司(从最前面开始)偏爱的登机策略效率最低。 神话得到证实,结果如下: 在随机的没有座位的策略是最快的,其次是WILMA直策略。但是,随机无座席策略给出的满意度最低。 最高满意度得分由反向金字塔策略给出,即使它是第四快的。 仅凭时间和满意度得分(不包括诸如计算预期过道或座位干扰之类的高级信息),如何确定最佳的登机策略? 除了将时间转换为秒,然后将其与满意度得分相乘,我似乎想不出任何一种单位转换,就好像我们正在尝试使时间与满意度得分的乘积最大化一样: f(t,s)=tsf(t,s)=tsf(t,s) = ts 这样做有哪些优点或缺点? 一个缺点似乎是,按时间和满意度得分乘积的排名给出的满意度排名相同。 还有什么可以做的?似乎所有想到的都是产品,所以也许我可能会最大化这些东西: f(t,s)=t2sf(t,s)=t2sf(t,s) = t^2s f(t,s)=ts1/2(eliminating random no seats)f(t,s)=ts1/2(eliminating random no seats)f(t,s) = ts^{1/2} \text{(eliminating random no seats)} f(t,s)=t(s−save)f(t,s)=t(s−save)f(t,s) = t(s-s_{ave}) 我认为我们将不得不将时间和满意度得分与某些单位(例如金钱)相关联。因此,必须在登机时间和费用之间找到某种关系(例如,通过线性回归建立线性关系),然后再找到今天登机的满意度得分与下个月的航班收入之间的某种关系? 一定要这样吗? 我被建议使用z分数之类的东西,所以我尝试进行标准化,我认为: 为什么z的平方和为6?我做错什么了吗?那是第四时刻还是什么?

0
部分R2和回归量的贡献
我在Cross Validated上问了一个类似的问题,但没有得到答案。以下问题完全不同。 考虑以下确定性关系:ÿŤ= C.Ť+ 我Ť+ G.Ť+ (XŤ- M.Ť)Yt=Ct+It+Gt+(Xt−Mt)Y_{t}=C_{t}+I_{t}+G_{t}+(X_{t}-M_{t}) 如果我们对协变量运行的Y的OLS回归,当然,我们得到了一个 的1,和系数等于其人口同行的载体,即β = β = 1[R2R2R^{2}β^=β=1β^=β=1\hat{\beta}= \beta=1 现在,这意味着每个回归量的边际效应是不变的。但是,每个回归量的贡献取决于它与y的相对方差。事实上,在单变量情况下,可以示出: 表明即使x 对y的边际效应 很大,它在部分R2 意义上的贡献只有在它变化很大时才会很高,导致y也随之变化。R2=β2var(x)var(y)R2=β2var(x)var(y)R^{2}=\beta^{2}\frac{var(x)}{var(y)}xxxyyyR2R2R^{2} 现在,考虑相同的上述表达式:Yt=Ct+It+Gt+(Xt−Mt)Yt=Ct+It+Gt+(Xt−Mt)Y_{t}=C_{t}+I_{t}+G_{t}+(X_{t}-M_{t}) 对于整个系数向量和设计矩阵,让我们将除以Y t。YtYtY_{t} 我们得到:1=CtYt+ItYt+GtYt+(Xt−Mt)Yt1=CtYt+ItYt+GtYt+(Xt−Mt)Yt1=\frac{C_{t}}{Y_{t}}+\frac{I_{t}}{Y_{t}}+\frac{G_{t}}{Y_{t}}+\frac{(X_{t}-M_{t})}{Y_{t}} YtYtY_{t} 现在我们对每个观察的每个回归量都有相对贡献,我们可以得到回归量在观察中的平均贡献。 R2R2R^{2}

2
条件独立,没有相关性
我有一个关于基本计量经济学的问题。 考虑一下模型 $$ y_i = \ alpha + \ beta x_i + u_i $$ 我理解线性回归模型的假设4表明 $$ [1] \ quad E(u | x)= 0 $$ 但是,我经常看到这种情况写成: $$ [2] \ quad E(ux)= 0 $$ 这两件事情是否相同?我看到如果[1]和$ E(u)= 0 $那么我们得到[2];但是我不明白为什么[2]会暗示[1]。

2
计量经济学:省略重要变量
我目前正在做一个项目来构建肉类和鱼类的需求函数。我的数据表明,水果和蔬菜价格具有统计学意义。然而,在省略了这个变量(以及其他3个无关紧要的变量)之后,F检验结果强调了拒绝Null的失败(这四个变量共同无关紧要)。 因此,我应该省略Fruit&Veg变量,尽管它具有独特的重要性,并且还具有直观的意义,可以包含在我的需求函数中。
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.