Questions tagged «terminology»

统计中特定技术用语/概念的用法和含义。


10
为什么两个随机变量之和是卷积?
长期以来,我不明白为什么两个随机变量的“和”是它们的卷积,而和的混合密度函数之和是f(x)f(x)f(x)g(x)g(x)g(x)pf(x)+(1−p)g(x)pf(x)+(1−p)g(x)p\,f(x)+(1-p)g(x); 算术和而不是它们的卷积。确切的短语“两个随机变量的总和”在Google中出现了146,000次,并且如下所示是椭圆形的。如果认为RV产生单个值,则可以将该单个值添加到另一个RV单个值,这与卷积无关,至少不是直接相关,所有都是两个数字的和。但是,统计数据中的RV结果是值的集合,因此更精确的短语类似于“来自两个RV的相关个体值对的协调总和的集合是它们的离散卷积”……并且可以通过以下方式近似:对应于那些RV的密度函数的卷积。更简单的语言: 2个RVnnn样本实际上是两个n维向量,它们相加作为向量和。 请详细说明两个随机变量的和如何是卷积和。

5
为什么会有“异方差”或“异方差”两个拼写?
我经常看到“ heteroskedastic”和“ heteroscedastic”这两个拼写,以及“ homoscedastic”和“ homoskedastic”的相似。“ c”和“ k”变体之间的含义似乎没有差异,只是与该词的希腊词源有关的正字法差异。 这两种不同的拼法的起源是什么? 一种用法是否比另一种用法更常见,它们是否反映了地区或研究领域之间的差异,还是仅反映了作者(或实际上是社论)的偏爱? 顺便说一句,其他语言在将希腊语根源拉丁化为英语方面也有不同的政策:我注意到,我认为法语中总是“hétéroscédasticité”,而德语中则总是“Heteroskedastizität”。因此,如果以英语为第二语言的作者可能偏爱与其母语相对应的英语拼写,我不会感到惊讶。也许真正的考验是希腊统计学家用英语书写时所说的!

5
了解LSTM单位与细胞
我学习LSTM已有一段时间了。我从较高的角度了解一切。但是,要使用Tensorflow实施它们,我注意到BasicLSTMCell需要许多单位(即num_units)参数。 从这个 LSTMs的非常详尽的解释,我已经收集单个LSTM单元是以下情况之一 实际上是GRU单位 我假设参数num_units的BasicLSTMCell指的是我们要多少,这些在层挂钩到对方。 这就提出了问题-在这种情况下什么是“单元”?“单元”是否等效于普通前馈神经网络中的一层?


6
为什么将期望值如此命名?
我知道我们如何获得3.5作为滚动6面模具的期望值。但从直觉上讲,我可以期望每张脸的机会均等为1/6。 那么,掷骰子的期望值是否不应该是1-6之间相等的概率? 换句话说,当被问到“投掷一个合理的6面骰子的预期价值是什么?”这个问题时,人们应该回答“哦,它可以是1-6之间的机会相等。” 相反,它是3.5。 在现实世界中,有人可以直观地解释我在掷骰子时的期望值是3.5吗? 同样,我不希望公式或期望的推导。

7
推断与估计?
在机器学习的背景下,“推理”和“估计”之间有什么区别? 作为一个新手,我觉得我们可以推断随机变量并估计模型参数。我的理解正确吗? 如果没有,确切的区别是什么,我应该何时使用? 另外,“ learn”的同义词是什么?

9
估计量和统计量有什么区别?
我了解到统计量是您可以从样本中获得的属性。以许多相同大小的样本为例,为所有样本计算该属性并绘制pdf,得出对应属性的分布或对应统计数据的分布。 我还听说统计数据是用来估算的,这两个概念有何不同?

2
术语“饱和非线性”是什么意思?
我正在阅读具有深度卷积神经网络的ImageNet分类论文,在第3节中,他们解释了卷积神经网络的体系结构,并解释了如何使用以下方法: 非饱和非线性f(x)=max(0,x).f(x)=max(0,x)。f(x) = max(0, x). 因为训练起来更快。在那篇论文中,他们似乎将饱和非线性称为CNN中使用的更传统的函数,S形和双曲正切函数(即F(X )= 吨一个Ñ ħ (X )F(X)=Ť一种ñH(X)f(x) = tanh(x)和F(x )= 11 + e− x= (1 + e− x)− 1F(X)=1个1个+Ë-X=(1个+Ë-X)-1个f(x) = \frac{1}{1 + e^{-x}} = (1 + e^{-x})^{-1}为饱和)。 他们为什么将这些功能称为“饱和”或“非饱和”?这些功能在什么意义上是“饱和”或“非饱和”的?这些术语在卷积神经网络的背景下意味着什么?它们是否用于其他机器学习(和统计)领域?

4
外推v。内插
外推法和内插法有什么区别,使用这些术语的最精确方法是什么? 例如,我在论文中看到了一个使用插值的语句: “该过程在bin点之间插入估计函数的形状” 同时使用外推法和内插法的句子例如: 在上一步中,我们使用内核方法将内插函数外推到左侧和右侧的温度尾部。 有人可以提供一种清晰易用的方法来区分它们,并通过示例指导如何正确使用这些术语吗?

3
什么是歧管?
在降维技术(例如主成分分析,LDA等)中,经常使用术语歧管。非技术术语是什么?如果点属于我要减小尺寸的球体,并且存在噪声且和不相关,则实际点会由于噪声而彼此分离。因此,将需要噪声过滤。因此,将在上执行尺寸缩减。因此,在这里和属于不同的流形吗?xxxyyyxxxyyyxxxz=x+yz=x+yz = x+yxxxyyy 我正在处理机器人视觉中经常使用的点云数据;由于采集中的噪声,点云很吵,我需要在减小尺寸之前减小噪声。否则,我会得到不正确的尺寸缩小。那么,这里的流形是什么?噪声是属于同一流形的一部分吗?xxx

5
测量两个多元分布之间的“距离”
我正在寻找一些好的术语来描述我正在尝试做的事情,以使查找资源变得更加容易。 因此,假设我有两个点A和B的群集,每个群集与两个值X和Y相关联,并且我想测量A和B之间的“距离”,即从同一分布中对它们进行采样的可能性有多大(我可以假设分布是正态的)。例如,如果X和Y在A中相关,而在B中不相关,则分布是不同的。 凭直觉,我将得到A的协方差矩阵,然后看一下B中每个点适合在那里的可能性,反之亦然(可能使用马氏距离之类的方法)。 但这有点“临时”,可能有一种更为严格的描述方式(当然,在实践中,我有两个以上的数据集和两个以上的变量-我正在尝试确定我的哪个数据集是离群值)。 谢谢!

6
用外行的话来说,模型和分布之间有什么区别?
维基百科上定义的答案(定义)对于那些不熟悉高等数学/统计学的人来说可能有点神秘。 用数学术语来说,统计模型通常被认为是一对(),其中是可能的观测值的集合,即样本空间,而是概率分布的集合在。小号P小号小号,PS,PS, \mathcal{P}小号SSPP\mathcal{P}小号SS 在概率和统计中,概率分布将概率分配给随机实验,调查或统计推断程序的可能结果的每个可测量子集。发现样本空间非数字的示例,其中的分布为分类分布。 我是一名高中生,在业余爱好这一领域非常感兴趣,目前正在努力解决a statistical model和a 之间的差异probability distribution 我目前的并且非常基本的理解是: 统计模型是对测得分布进行近似的数学尝试 概率分布是对实验的测量描述,将概率分配给随机事件的每个可能结果 文献中倾向于互换使用“分布”和“模型”一词,或者至少在非常相似的情况下(例如,二项式分布与二项式模型),这种混淆进一步加剧了混乱。 有人可以验证/纠正我的定义,也许可以为这些概念提供更正式的方法(尽管仍然用简单的英语表达)?



By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.