Questions tagged «notation»

对于统计中使用的统计符号和数学符号的问题。

1
期望中的下标符号
在量度理论框架下的条件期望中,下标符号的确切含义是什么?这些下标没有出现在条件期望的定义中,但是例如,我们可能会在Wikipedia的此页面中看到。(请注意,并非总是如此,几个月前是同一页)。EX[f(X)]EX[f(X)]\mathbb{E}_X[f(X)] 例如,具有和的的含义是什么?X〜 Ñ(0,1)ÿ=X+1EX[X+Y]EX[X+Y]\mathbb{E}_X[X+Y]X∼N(0,1)X∼N(0,1)X\sim\mathcal{N}(0,1)Y=X+1Y=X+1Y=X+1

4
概率符号
在许多书籍和论文中常用的符号和在含义上有什么区别?P(z;d,w)P(z;d,w)P(z;d,w)P(z|d,w)P(z|d,w)P(z|d,w)

2
为什么会有两种不同的逻辑损失表述/符号?
我已经看到两种类型的逻辑损失公式。我们可以轻松地表明它们是相同的,唯一的区别是标签的定义。yyy 公式/符号1,:y∈{0,+1}y∈{0,+1}y \in \{0, +1\} L(y,βTx)=−ylog(p)−(1−y)log(1−p)L(y,βTx)=−ylog⁡(p)−(1−y)log⁡(1−p) L(y,\beta^Tx)=-y\log(p)-(1-y)\log(1-p) 其中p=11+exp(−βTx)p=11+exp⁡(−βTx)p=\frac 1 {1+\exp(-\beta^Tx)},其中逻辑函数将实数\ beta ^ T x映射βŤXβŤX\beta^T x到0.1区间。 公式/符号2,ÿ∈ { − 1 ,+ 1 }ÿ∈{-1个,+1个}y \in \{-1, +1\}: 大号(ÿ,βŤx )= 对数(1 + 经验(- ÿ·&βŤx))大号(ÿ,βŤX)=日志⁡(1个+经验值⁡(-ÿ⋅βŤX)) L(y,\beta^Tx)=\log(1+\exp{(-y\cdot \beta^Tx})) 选择一种表示法就像选择一种语言一样,使用一种或另一种是有利有弊。这两种表示法的优缺点是什么? 我试图回答这个问题的尝试是,统计学界似乎喜欢第一种表示法,而计算机科学界似乎喜欢第二种表示法。 第一种表示法可以用术语“概率”来解释,因为逻辑函数将实数βŤXβŤX\beta^Tx为0.1区间。 第二种表示法更简洁,可以更轻松地与铰链损失或0-1损失进行比较。 我对吗?还有其他见解吗?

3
在机器学习中,为什么使用上标而不是下标?
我正在通过Coursera上Andrew Ng的机器学习课程。对于方程式,使用上标代替下标。例如,在以下等式中,使用代替: x ix(i)x(i)x^{(i)}xixix_i J(θ0,θ1)=12m∑i=1m(hθ(x(i))−y(i))2J(θ0,θ1)=12m∑i=1m(hθ(x(i))−y(i))2J(\theta_0, \theta_1) = \frac{1}{2m} \sum\limits_{i=1}^{m}{(h_\theta(x^{(i)}) - y^{(i)})^2} 显然,这是惯例。我的问题是为什么要使用上标而不是下标?上标已用于求幂。当然,通过注意括号是否存在,我似乎能够区分上标和取幂用例,但这仍然令人困惑。





1
R中混合模型公式中随机效应的威尔金森式表示法的起源,例如(1 | id)
R中的模型公式,例如 y ~ x + a*b + c:d 基于所谓的Wilkinson表示法:Wilkinson和Rogers 1973,用于方差分析的阶乘模型的符号描述。 本文没有讨论混合模型的符号(那时可能还不存在)。那么R中的混合模型公式lme4以及相关程序包中使用了什么,例如 y ~ x + a*b + c:d + (1|school) + (a*b||town) 来自?谁是第一次引入它们,何时引入?是否有针对他们的“ Wilkinson表示法”之类的商定术语?我专门指的是 (model formula | grouping variable) (model formula || grouping variable)


1
估算器的符号(波浪号与帽子)
1.统计中是否有关于帽子和代字号的命名约定?我发现β被描述为一个估计β(维基百科),但我也发现了〜β被描述为一个估计β(钨)。含义有什么不同吗? 在Web上,我发现有所不同,但对于“统计符号”的含义我不确定。此处,在“参数估计”和“变量估计”之间进行区分。有人能解释在哪种情况下使用代字号和帽子吗? β^β^\hat{\beta}ββ\betaβ~β~\tilde{\beta}ββ\beta 2.关于期望运算符,关于括号,以及E [ X ]和E { X }有什么区别吗?我得到了使用大括号的建议。但是我不确定其含义。我以前只将括号用于阅读/可视化,而不是指出某些含义。有什么建议吗?E(X)E(X)E(X)E[X]E[X]E[X]E{X}E{X}E\{X\}
15 notation 

2
逻辑回归的矩阵符号
在线性回归(平方损失)中,使用矩阵,我们对目标有一个非常简洁的表示法 minimize ∥Ax−b∥2minimize ‖Ax−b‖2\text{minimize}~~ \|Ax-b\|^2 其中AAA是数据矩阵,xxx是系数,bbb是响应。 Logistic回归目标是否有类似的矩阵符号?我见过的所有符号都不能消除所有数据点的总和(像∑dataLlogistic(y,βTx)∑dataLlogistic(y,βTx)\sum_{\text data} \text{L}_\text{logistic}(y,\beta^Tx))。 编辑:感谢joceratops和AdamO的出色回答。他们的回答使我意识到线性回归具有更简洁的表示法的另一个原因是因为规范的定义封装了平方和或。但是在逻辑损失中,没有这样的定义,这使表示法有点复杂。e⊤ee⊤ee^\top e

4
如何消化统计背景?
首先,我想并不是这个有趣站点的所有活跃成员都是统计学家。否则,以下问题将毫无意义!我当然尊重他们,但是我需要一个更实际而不是概念上的解释。 我首先从Wikipedia定义一个示例point process: 令S为配备有Borelσ代数B(S)的局部紧凑的第二个可数Hausdorff空间。为S上的局部有限计数量度集写为N上的最小σ代数写N,N使得所有点计数都可测量。NN\mathfrak{N}NN\mathcal{N}NN\mathfrak{N} 对我来说,这没有任何意义。我更容易理解工程方面的解释。 评论:大多数时候,由于类似的复杂文本(至少对我而言),我发现Wikipedia的解释毫无用处。根据我的经验,只有两种类型的统计参考书:a)非常简化b)非常复杂! 读这两个书对我完全没有好处! 题: 您有解决此问题的方法吗?或类似的经历? 对于那些认为这篇文章有用的人,还可以检查一下好处:咨询统计学家以向其客户提供参考的参考,这些参考从不同角度讨论了相关主题。

4
回归残差分布假设
为什么有必要将分布假设置于误差上,即 ,具有 ε 我〜Ñ(0 ,σ 2)。ÿ一世= Xβ+ ϵ一世yi=Xβ+ϵiy_i = X\beta + \epsilon_{i}ϵ一世〜ñ(0 ,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) 为什么不写 ,与 ÿ 我〜Ñ(X β,σ 2),ÿ一世= Xβ+ ϵ一世yi=Xβ+ϵiy_i = X\beta + \epsilon_{i}ÿ一世〜ñ(Xβ^,σ2)yi∼N(Xβ^,σ2)y_i \sim \mathcal{N}(X\hat{\beta},\sigma^{2}) 其中在任一情况下。 我已经看到它强调指出分布假设是基于错误而不是数据,但没有解释。 ϵ一世= y一世- ÿ^ϵi=yi−y^\epsilon_i = y_i - \hat{y} 我不太了解这两种说法之间的区别。在某些地方,我看到分布假设被放置在数据上(贝叶斯照明。它似乎主要是),但是大多数情况下,假设被放置在错误上。 在建模时,为什么/应该选择一个假设还是另一个假设开始?

3
从使用统计软件过渡到理解数学方程式?
内容: 我是心理学博士研究生。与许多心理学博士生一样,我知道如何使用统计软件进行各种统计分析,以及PCA,分类树和聚类分析等技术。但这并不能真正令人满意,因为尽管我可以解释为什么进行分析以及指标的含义,但无法解释该技术的工作原理。 真正的问题是,掌握统计软件很容易,但是却受到限制。要学习文章中的新技术,我需要了解如何阅读数学方程式。目前,我无法计算特征值或K均值。方程对我来说就像一门外语。 题: 是否有全面的指南可帮助您理解期刊文章中的方程式? 编辑: 我认为这个问题将更加自我解释:在一定的复杂性之上,统计符号对我来说变得毫无意义。假设我想用R或C ++编写自己的函数以了解一种技术,但是有一个障碍。我无法将方程式转换为程序。确实:我不知道美国博士学位学校的情况,但是在我的(法国),我唯一可以学习的课程是大约16世纪的文学运动...

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.