Questions tagged «terminology»

统计中特定技术用语/概念的用法和含义。


1
方差的反义词
有没有一个词是“方差的倒数”?也就是说,如果方差高,则低。对近义词(例如“协议”或“相似性”)不感兴趣,但具体含义是?X ... 1 / σ 2XXXXXX……\dots1 / σ21个/σ21/\sigma^2

5
名称中的内容:超参数
因此,在正态分布中,我们有两个参数:均值和方差。在《模式识别与机器学习》一书中,突然出现了误差函数的正则化项中的超参数。μμ\muσ2σ2\sigma^2λλ\lambda 什么是超参数?为什么这样命名?它们在直观上与一般参数有何不同?

6
数据挖掘和统计分析之间有什么区别?
数据挖掘和统计分析之间有什么区别? 在某些背景下,我认为我的统计教育很传统。提出一个特定的问题,设计研究,并收集和分析数据以提供对该问题的一些见解。结果,我一直对我认为的“数据挖掘”持怀疑态度,即在大型数据集中寻找模式并使用这些模式得出结论。我倾向于将后者与数据挖掘相关联,并且一直认为这有点原则(以及诸如算法变量选择例程之类的东西)。 但是,关于数据挖掘的文献越来越多。通常,我看到这个标签指的是诸如聚类,基于树的分类等特定技术。但是,至少从我的角度来看,这些技术可以在一组数据上“设置为松散”或以结构化方式用于解决题。我将前者称为数据挖掘,而将后者称为统计分析。 我从事学术管理工作,被要求做一些“数据挖掘”以发现问题和机会。与我的背景相一致,我的第一个问题是:您想学习什么?您认为有助于事情发展的是什么?从他们的回答中可以明显看出,我和提出问题的人对数据挖掘的性质和价值有不同的看法。

1
为什么将James-Stein估计量称为“收缩”估计量?
我一直在阅读有关James-Stein估计器的信息。在本注释中,其定义为 θ^=(1−p−2∥X∥2)Xθ^=(1−p−2‖X‖2)X \hat{\theta}=\left(1 - \frac{p-2}{\|X\|^2}\right)X 我已经阅读了证明,但不理解以下说法: 在几何上,James–Stein估计器将每个分量向原点方向收缩。XXX “将每个分量缩小到原点”到底是什么意思?我在想类似 在这种情况下,只要,因为 XXX∥θ^−0∥2&lt;∥X−0∥2,‖θ^−0‖2&lt;‖X−0‖2,\|\hat{\theta} - 0\|^2 < \|X - 0\|^2,(p+2)&lt;∥X∥2(p+2)&lt;‖X‖2(p+2) < \|X\|^2∥θ^∥=∥X∥2−(p+2)∥X∥2∥X∥.‖θ^‖=‖X‖2−(p+2)‖X‖2‖X‖.\|\hat{\theta}\| = \frac{\|X\|^2 - (p+2)}{\|X\|^2} \|X\|. 人们说“缩小为零”是什么意思,因为从范式来看,JS估计量比X更接近零?L2L2L^2XXX 截至2017年9月22日的更新:今天我意识到也许我使事情变得过于复杂。似乎人们真的是说,一旦将乘以小于,即,X的每个分量都将比以前小。1 ‖ X ‖ 2 - (p + 2 )XXX111 X∥X∥2−(p+2)∥X∥2‖X‖2−(p+2)‖X‖2\frac{\|X\|^2 - (p + 2)}{\|X\|^2}XXX

5
“转移学习”和“领域适应”之间有什么区别?
“转移学习”和“领域适应”之间有什么区别吗? 我不了解上下文,但是我的理解是,我们有一些数据集1并对其进行训练,之后我们又有了另一个数据集2,我们希望针对该数据集2适应我们的模型而无需从头进行重新训练,为此我们需要进行“转移学习”和“域自适应”有助于解决此问题。 根据卷积神经网络领域: “转移学习”是指“微调” [1] 在这种情况下,[2]是不受监督的,但是“域自适应”是否应始终不受监督?

1
当被字“偏见”杜撰的意思
当被字“偏见”杜撰的意思 E[θ^−θ]E[θ^−θ]\mathbb{E}[\hat{\theta}-\theta]? 我现在正在考虑这个问题的原因是因为我似乎想起了Jaynes,在他的概率论课本中,批评了使用“ bias”一词来描述该公式,并提出了另一种选择。 根据Jaynes的概率论,第17.2节“无偏估计”: 为什么东正教徒这么偏重偏见?我们怀疑其主要原因仅仅是因为他们陷入了自己制造的心理狂陷阱中。当我们调用量(⟨β⟩−α)(⟨β⟩−α)(\langle\beta\rangle-\alpha)“偏见”,这听起来像是应该谴责的,我们必须不惜一切代价消除它。如果按照毕达哥拉斯式(17.2)的建议,将其称为“与方差正交的误差分量”,则很明显,这两个对误差的贡献是相等的;减少一个以牺牲另一个为代价是愚蠢的。这只是选择一种技术术语所付出的代价,该术语承载着情感上的负担,暗示着价值的判断;正统思想不断陷入这种战术错误。

11
矩阵“列数”的术语
是否有一个英文单词表示矩阵的“列数”? 例如,2 × 32×32\times 3 × 3矩阵的“维数”是2 × 2 × 32×32\times 3。在此示例中,我需要3项333。当然,我总是可以说“列数”,但是我可以说一个字吗?


1
在PCA中到底是什么叫做“主要组件”?
假设是使设计矩阵的数据投影的方差最大化的向量。uüuXXX 现在,我已经看到了将称为数据的(第一)主成分的材料,这也是具有最大特征值的特征向量。uuu 但是,我也看到数据的主要成分是。XuXuX u 显然,和是不同的。谁能在这里帮助我,告诉我这两个主要成分定义之间的区别是什么?uuuXuXüXu

5
这个与独立性有关的数量有名字吗?
显然,事件A和B是独立的,如果Pr Pr = Pr Pr。让我们定义一个相关的数量Q:(甲)(乙)(A∩B)(A∩B)(A\cap B)(A)(A)(A)(B)(B)(B) Q≡Pr(A∩B)Pr(A)Pr(B)Q≡Pr(A∩B)Pr(A)Pr(B)Q\equiv\frac{\mathrm{Pr}(A\cap B)}{\mathrm{Pr}(A)\mathrm{Pr}(B)} 因此,如果Q = 1(假设分母为非零),则A和B是独立的。Q实际上有名字吗?我觉得它指的是一些基本概念,这些概念现在正在逃避我,即使问这个问题,我也会感到很傻。

4
“随机样本”和“ iid随机变量”是同义词吗?
我一直很难理解“随机样本”和“ iid随机变量”的含义。我试图从几个方面找出含义,但是却越来越困惑。我将在此发布的内容尝试并了解: Degroot的概率与统计说: 随机样本/ iid /样本大小:考虑真实行上的给定概率分布,该概率分布可以用pf或pdf。据说有随机变量如果这些随机变量是独立的,并且每个变量的边际pf或pdf为从该分布形成一个随机样本。这种随机变量也被认为是独立且均等分布的,简称iid。我们将随机变量的数量n称为样本量。FFfññnX1个,。。。, XñX1个,。。。,XñX_1 , . . . , X_nFFf 但是我写过的另一本统计书说: 在随机抽样中,我们保证总体中的每个个体单元都有相等的被选择的机会(概率)。 因此,我觉得iid是构成随机样本的元素,而拥有随机样本的过程就是随机抽样。我对吗? PS:我对这个话题非常困惑,因此,我感谢您详尽的答复。谢谢。

3
“标准化”是什么意思,以及如何验证样本或分布是否已标准化?
我有一个问题要询问是否验证均匀分布(Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b))是否规范化。 首先,对任何分布进行规范化意味着什么? 第二,我们如何验证分布是否规范化? 我通过计算X理解 - 意思是X−meansdX−meansd \frac{X-\text{mean}}{\text{sd}} 我们得到归一化的数据,但是这里要求验证分布是否被归一化。



By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.