Questions tagged «mathematical-statistics»

统计的数学理论,涉及形式定义和一般结果。



2
p值的两个定义:如何证明它们的等价性?
我正在阅读拉里·瓦瑟曼(Larry Wasserman)的《所有统计》一书,目前正在阅读有关p值的信息(第187页)。首先让我介绍一些定义(我引用): 定义1的拒绝区域中的试验的幂函数RRR由下式定义 β(θ)=Pθ(X∈R)β(θ)=Pθ(X∈R)\beta(\theta)=P_{\theta}(X\in R) 的测试的大小被定义为 如果测试的大小小于或等于\ alpha,则称该测试具有\ alpha级别。α=supθ∈Θ0β(θ)α=supθ∈Θ0β(θ)\alpha = \sup_{\theta\in\Theta_0}\beta(\theta)αα\alphaαα\alpha 这基本上说αα\alpha,大小是类型I的错误的“最大”概率。然后通过(I quote)定义ppp值。 定义2假设对于每个α∈(0,1)α∈(0,1)\alpha\in(0,1)我们都有一个带有拒绝区域R_ \ alpha的大小αα\alpha测试。然后, p \ text {-value} = \ inf \ {\ alpha:T(X ^ n)\ in R_ \ alpha \} 其中X ^ n =(X_1,\ dots,X_n)。RαRαR_\alphap-value=inf{α:T(Xn)∈Rα}p-value=inf{α:T(Xn)∈Rα}p\text{-value}=\inf\{\alpha:T(X^n)\in R_\alpha\}Xn=(X1,…,Xn)Xn=(X1,…,Xn)X^n=(X_1,\dots,X_n) 对我来说,这意味着:给定特定的αα\alpha有一个测试和拒绝区域RαRαR_\alpha以便α=supθ∈Θ0(α)Pθ(T(Xn)∈Rα)α=supθ∈Θ0(α)Pθ(T(Xn)∈Rα)\alpha=\sup_{\theta\in\Theta_{0}(\alpha)}P_\theta(T(X^n)\in R_\alpha)。对于ppp值,我只需取所有\ alpha中的最小值即可αα\alpha。 问题1如果是这种情况,那么对于任意小的,我可以清楚地选择。我对定义2的错误解释是什么,即它的确切含义是什么?εα=ϵα=ϵ\alpha = \epsilonϵϵ\epsilon 现在,Wasserman连续并陈述了一个定理,以具有我所熟悉的值的“等效”定义(我引用):ppp 定理假设大小检验的形式为 然后, 其中,是的观测值。拒绝 H …

2
Python中的QQ图
我使用以下代码生成了一个qq图。我知道qq图用于检查数据是否正常分布。我的问题是x和y轴标签在qq图中指示什么,r平方值指示什么? N = 1200 p = 0.53 q = 1000 obs = np.random.binomial(N, p, size = q)/N import scipy.stats as stats z = (obs-np.mean(obs))/np.std(obs) stats.probplot(z, dist="norm", plot=plt) plt.title("Normal Q-Q plot") plt.show() 我知道已经有关于qq图的讨论,但是尽管进行了讨论,但我无法理解的概念。

1
最大似然估计的几何解释
我正在阅读富兰克林·费舍尔(Franklin M. Fisher)的《计量经济学中的识别问题》一书,对他通过可视化似然函数来演示识别的部分感到困惑。 该问题可以简化为: 对于回归,其中Ú 〜我。我。d 。Ñ (0 ,σ 2我), 一个和b是参数。假设Y的系数c等于1。然后,在c ,a ,b空间中的似然函数 将沿着射线具有与真实参数的向量及其标量倍数相对应的脊ÿ= a + Xb + uÿ=一种+Xb+üY=a+Xb+u你〜我。我。d。ñ(0 ,σ2一世)ü〜一世。一世。d。ñ(0,σ2一世)u \sim i.i.d. N(0,\sigma^2I)一种一种abbbÿÿYCCcc ,a ,bC,一种,bc, a,b。仅考虑给定的位置时,似然函数在光线与该平面相交的点处将具有唯一的最大值。c = 1C=1个c=1 我的问题是: 关于演示中提到的山脊和射线,应该如何理解和推理。 由于射线是真实的参数和标量,因此为什么射线不在给出的平面上,因为参数c的真实值为1。c = 1C=1个c=1CCc


1
不相关性对哪些分布表示独立?
统计由来已久的提醒是“uncorrelatedness并不能意味着独立”。通常,这种提醒是在心理上舒缓的(并且在科学上正确的)陈述中进行补充的:“尽管如此,这两个变量共同正态分布,但不相关的确意味着独立”。 我可以将快乐异常的数量从一增加到两个:当两个变量是伯努利分布时,那么不相关又意味着独立。如果和是两个Bermoulli rv,则,其中我们有,类似地对于,它们的协方差为XXXYYYX∼B(qx),Y∼B(qy)X∼B(qx),Y∼B(qy)X \sim B(q_x),\; Y \sim B(q_y)P(X=1)=E(X)=qxP(X=1)=E(X)=qxP(X=1) = E(X) = q_xYYY Cov(X,Y)=E(XY)−E(X)E(Y)=∑SXYp(x,y)xy−qxqyCov⁡(X,Y)=E(XY)−E(X)E(Y)=∑SXYp(x,y)xy−qxqy\operatorname{Cov}(X,Y)= E(XY) - E(X)E(Y) = \sum_{S_{XY}}p(x,y)xy - q_xq_y =P(X=1,Y=1)−qxqy=P(X=1∣Y=1)P(Y=1)−qxqy=P(X=1,Y=1)−qxqy=P(X=1∣Y=1)P(Y=1)−qxqy = P(X=1,Y=1) - q_xq_y = P(X=1\mid Y=1)P(Y=1)-q_xq_y =(P(X=1∣Y=1)−qx)qy=(P(X=1∣Y=1)−qx)qy= \Big(P(X=1\mid Y=1)-q_x\Big)q_y 对于不相关性,我们要求协方差为零,因此 Cov(X,Y)=0⇒P(X=1∣Y=1)=P(X=1)Cov⁡(X,Y)=0⇒P(X=1∣Y=1)=P(X=1)\operatorname{Cov}(X,Y) = 0 \Rightarrow P(X=1\mid Y=1) = P(X=1) ⇒P(X=1,Y=1)=P(X=1)P(Y=1)⇒P(X=1,Y=1)=P(X=1)P(Y=1)\Rightarrow P(X=1,Y=1) = P(X=1)P(Y=1) 这也是变量独立所需要的条件。 所以我的问题是:您是否知道其他任何分布(连续或离散)的不相关性意味着独立性? 含义:假设两个随机变量具有边际属于相同的分布(或许与所涉及的分布参数不同的值)的分布,但让我们用同样支持如说。两个指数,两个三角形等。方程所有解是否都由于所涉及的分布函数的形式/性质而隐含着独立性?正态边际(也假定它们具有二元正态分布)和伯努利边际都是这种情况-还有其他情况吗?X,YX,YX,YCov(X,Y)=0Cov⁡(X,Y)=0\operatorname{Cov}(X,Y) = 0 这样做的动机是,与检查独立性是否成立相比,通常更容易检查协方差是否为零。因此,如果在给定理论分布的情况下,通过检查协方差,您还在检查独立性(例如伯努利或正态情况),那么这将是一件有用的事情。 …

1
预期平均值将超过一个值的预期次数
给定一系列iid随机变量,例如,对于,为,我试图限制经验均值的预期次数会超过一个值,因为我们继续绘制样本,即: Xi∈[0,1]Xi∈[0,1]X_i \in [0,1]i=1,2,...,ni=1,2,...,ni = 1,2,...,n1n∑ni=1Xi1n∑i=1nXi\frac{1}{n}\sum_{i=1}^n X_ic≥0c≥0c \geq 0T=def∑j=1nP({1j∑i=1jXi≥c})T=def∑j=1nP({1j∑i=1jXi≥c}) \mathcal{T} \overset{def}{=} \sum_{j=1}^n \mathbb{P} \left(\left\{ \frac{1}{j}\sum_{i=1}^j X_i \geq c\right\}\right) 如果我们假设对于,我们可以使用Hoeffding不等式得出c=a+E[X]c=a+E[X]c = a + \mathbb{E}[X]a>0a>0a > 0 T≤∑j=1ne−2ja2=1−e−2a2ne2a2−1T≤∑j=1ne−2ja2=1−e−2a2ne2a2−1\begin{align} \mathcal{T} & \leq \sum_{j=1}^n e^{-2ja^2} \\ & = \frac{1 - e^{-2 a^2 n}}{e^{2 a^2}-1} \end{align} 哪个看起来不错(也许),但实际上是一个松散的界限,是否有更好的方法来限制此值?我希望可能会有一种方法,因为不同的事件(每个)显然不是独立的,我不知道有任何方法可以利用这种依赖性。同样,最好删除大于平均值的限制。jjjccc 编辑:如果我们使用马尔可夫不等式,可以消除对大于均值的限制:ccc T≤∑j=1n1jE[X]c=E[X]HncT≤∑j=1n1jE[X]c=E[X]Hnc\begin{align} \mathcal{T} & \leq \sum_{j=1}^n \frac{\frac{1}{j}\mathbb{E}[X]}{c} \\ …

5
神经网络的数学背景
不知道这是否适合本网站,但是我正在开始我的计算机科学硕士学位(应用数学学士学位),并希望拥有强大的机器学习背景(我很可能会攻读博士学位)。我的次级兴趣之一是神经网络。 人工神经网络的良好数学背景是什么?像在机器学习的其他领域一样,我认为线性代数很重要,但是数学的其他哪些领域也很重要? 我计划阅读《神经网络:系统介绍或用于模式识别的神经网络》。是否有人提出任何建议或替代建议?

1
回归系数的抽样分布
之前,我了解了采样分布,这些分布根据未知参数给出了供估计器使用的结果。例如,对于线性回归模型中和的采样分布β^0β^0\hat\beta_0β^1β^1\hat\beta_1Yi=βo+β1Xi+εiYi=βo+β1Xi+εiY_i = \beta_o + \beta_1 X_i + \varepsilon_i β^0∼N(β0, σ2(1n+x¯2Sxx))β^0∼N(β0, σ2(1n+x¯2Sxx)) \hat{\beta}_0 \sim \mathcal N \left(\beta_0,~\sigma^2\left(\frac{1}{n}+\frac{\bar{x}^2}{S_{xx}}\right)\right) 和 β^1∼N(β1, σ2Sxx)β^1∼N(β1, σ2Sxx) \hat{\beta}_1 \sim \mathcal N \left(\beta_1,~\frac{\sigma^2}{S_{xx}}\right) 其中Sxx=∑ni=1(x2i)−nx¯2Sxx=∑i=1n(xi2)−nx¯2S_{xx} = \sum_{i=1}^n (x_i^2) -n \bar{x}^2 但是现在我在书中看到了以下内容: 假设我们以通常的方式用最小二乘法拟合模型。考虑贝叶斯后验分布,并选择先验,这样就等于通常的常客抽样分布,即…… (β0β1)∼N2[(β^1β^2), σ^2(n∑ni=1xi∑ni=1xi∑ni=1x2i)−1](β0β1)∼N2[(β^1β^2), σ^2(n∑i=1nxi∑i=1nxi∑i=1nxi2)−1] \left( \begin{matrix} \beta_0 \\ \beta_1 \end{matrix} \right) \sim \mathcal N_2\left[\left(\begin{matrix} \hat{\beta}_1 \\ \hat{\beta}_2 \end{matrix} …

1
直观了解协方差,互协方差,自相关/互相关和功率谱密度
我目前正在为我的ECE学士学位学习基础统计学的决赛。 虽然我认为我的数学大部分都处于下降状态,但我缺乏直觉上的理解数字的实际含义。 我知道E [X]是X的所有结果按其概率加权的“加权平均值”。 Var [X]给出与E [X]平方的期望方差,因此告诉我们有关分布“模糊性”的一些信息。 我知道公式的其他属性,但缺乏任何直觉。有人有很好的解释/资源来帮助您吗?


7
如果相关性并不意味着因果关系,那么知道两个变量之间的相关性有什么价值?
假设某位企业主(或市场营销人员或了解散点图的任何人)显示了两个变量的散点图:过去5年(或其他时间范围)的广告数量与每月产品销售数量的比较还有更多样本。我只是制作了一个)。 现在,他/她看到了散点图,并被告知相关系数(corr)为: 1或 0.5或 0.11或 0或 -0.75或 -1 基本上任何有效值 corr 问题:这甚至对散点图的决策者或任何消费者意味着什么?仅以此为基础就可以做出哪些决定? 即:看到任何两个变量之间的相关性有什么用?一个人可以孤立地处理这些信息吗?仅仅是看什么而不考虑将其包括在回归分析中还是有更实际的用途? 很好奇,我一直都在使用这种技术,但是有人告诉我,关联本身并没有多大用处-那么“ IS”有什么用?


1
如何以封闭形式计算?
如何评估封闭形式的正常CDF平方的期望? E[Φ(aZ+b)2]=∫∞−∞Φ(az+b)2ϕ(z)dzE[Φ(aZ+b)2]=∫−∞∞Φ(az+b)2ϕ(z)dz\mathbb{E}\left[\Phi\left(aZ+b\right)^{2}\right] = \int_{-\infty}^{\infty}\Phi\left(az+b\right)^{2}\phi(z)\,dz 这里,,是实数,,和是标准正态随机变量的密度和分布函数,分别。aaabbbZ∼N(0,1)Z∼N(0,1)Z\sim\mathcal{N}(0,1)ϕ(⋅)ϕ(⋅)\phi(\cdot)Φ(⋅)Φ(⋅)\Phi(\cdot)

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.