Questions tagged «terminology»

统计中特定技术用语/概念的用法和含义。

7
相关性等于关联吗?
我的统计学教授声称,“相关性”一词严格适用于变量之间的线性关系,而“关联性”一词则广泛适用于任何类型的关系。换句话说,他声称术语“非线性相关”是矛盾的。 从我在Wikipedia上有关“ 相关性和依赖性 ”的文章中可以理解的这一点来看,Pearson相关系数描述了两个变量之间关系的“线性”程度。这表明术语“相关”实际上确实仅适用于线性关系。 另一方面,谷歌快速搜索“ 非线性相关性 ”会发现许多使用该术语的已发表论文。 我的教授是正确的,还是“关联”只是“关联”的同义词?



4
数理统计和统计之间有什么区别?
数理统计与统计有什么区别? 我读过这个: 统计是对数据的收集,组织,分析和解释的研究。它涉及所有方面,包括根据调查和实验设计进行数据收集计划。 与此: 数理统计是从数学的角度对统计进行的研究,它使用概率论以及其他数学分支,例如线性代数和分析。 那么它们之间的区别是什么?我可以理解收集的过程可能不是数学的,但是我想组织,分析和解释是我遗漏的东西吗?

2
如何理解“非线性降维”中的“非线性”?
我试图了解线性降维方法(例如PCA)和非线性降维方法(例如Isomap)之间的差异。 在这种情况下,我不太了解(非线性)含义。我从维基百科上得知 相比之下,如果使用PCA(线性降维算法)将同一数据集缩小为二维,则结果值的组织就不太好。这表明采样此歧管的高维向量(每个代表字母“ A”)以非线性方式变化。 是什么 采样此歧管的高维向量(每个代表字母“ A”)以非线性方式变化。 意思?或更广泛地说,在这种情况下,我如何理解(非线性)?


1
F1 / Dice-Score vs IoU
我对F1分数,Dice分数和IoU(联合上方的交集)之间的差异感到困惑。到目前为止,我发现F1和Dice的含义相同(对吗?),IoU的公式与其他两个公式非常相似。 F1 /骰子:2TP2TP+FP+FN2TP2TP+FP+FN\frac{2TP}{2TP+FP+FN} IoU / Jaccard:TPTP+FP+FNTPTP+FP+FN\frac{TP}{TP+FP+FN} 除了F1赋予真实正数更高的权重之外,是否存在任何实际差异或其他值得注意的东西?有一种情况我会用一种而不用另一种吗?

10
编造数据的最佳术语?
我正在写一个示例,并整理了一些数据。我想让读者清楚这不是真实数据,但我也不想给人留下恶意的印象,因为它只是一个例子。 此特定数据没有(伪)随机成分,因此在我看来“模拟”不合适。如果我称其为虚构或捏造,是否给人以欺诈性数据的印象?“虚构”这个词是否适合科学背景? 统计文献中非模拟虚构数据的术语是什么?

3
此发行版有名称吗?
今天我想到,分布 可以看作是高斯和拉普拉斯之间的折衷分布,对于和这样的分布有名称吗?它是否有一个标准化常数的表达式?结石树桩我,因为我不知道如何甚至开始求解在积分 1 = c ^ ·&∫ ∞ - ∞ EXP ( - | X - μ | pX∈[R ,p∈[1,2]β>0Çf(x)∝exp( - |x−μ|pβ)f(x)∝exp⁡(-|X-μ|pβ) f(x)\propto\exp\left(-\frac{|x-\mu|^p}{\beta}\right) x∈R,p∈[1,2]x∈R,p∈[1,2]x\in\mathbb{R}, p\in[1,2]β>0.β>0.\beta>0.CCC1=C⋅∫∞−∞exp(−|x−μ|pβ)dx1=C⋅∫−∞∞exp⁡(−|x−μ|pβ)dX 1=C\cdot \int_{-\infty}^\infty \exp\left(-\frac{|x-\mu|^p}{\beta}\right) dx

2
“基准”是什么意思(在统计中)?
当我为 "fisher" "fiducial" ...我肯定会收到很多成功,但我一直关注的所有事情都超出了我的理解范围。 所有这些命中似乎确实有一个共同点:它们都是为染羊毛的统计学家而写的,这些人对统计的理论,实践,历史和知识都非常了解。(因此,这些陈述都没有费心去解释或说明费舍尔的“基准”的意思,而不求助于术语的大行其道和/或不给某些经典或其他数学统计文献带来损失。) 好吧,我不属于可以从我这个主题的发现中受益的特定目标受众,这也许可以解释为什么我每次试图理解费舍尔“基准”的含义的尝试都撞到了墙上。难以理解的胡言乱语。 有谁知道向非专业统计学家解释费舍尔“基准”是什么意思的尝试? PS:我意识到费舍尔在确定他的“基准”的含义时是一个移动的目标,但是我认为该术语必须具有一定的“恒定核心”含义,否则它将无法正常工作(因为它很明显确实是本领域内通常理解的术语。

2
我应该将英式英语中“正态分布”中的“ N”大写吗?
这个问题有些遗漏,但是我认为这里的社区可能对此主题有强烈的见解! 我正在写我的博士学位论文。始终如一地,当谈论与高斯分布正式相关的数量时,我将“正态”中的“ N”大写以表示它们。例如,“ [...在这种情况下,所得的分布不是正态分布,而是由[...]描述”。 我的主管已阅读了相关章节,并用小写的“ n”代替了其中的每一个。我找不到关于该主题的权威文献-Springer 显然希望名称适当地大写,并且根据互联网上的另一个随机消息,将发行名称大写是个好主意。 缺乏针对论文的权威风格指南,我认为我将转向专家社区-经常做什么,为什么?


2
为什么在统计数据和ML中使用“内核”这个名字?
在操作系统和线性代数的上下文中,其他SE网站也对此提出了要求,但是对于统计和机器学习中使用的内核方法,同样的问题使我感到困惑。 人们通常说内核(例如在内核密度估计或SVM中)代表某种相似性,但我不知道“内核”的名称来自何处以及它的象征意义。 那么,在统计和机器学习的背景下,内核的词源是什么? 明确地说,我很清楚内核是什么以及内核的主要属性,我只是对名称感到好奇,因为我不知道它与种子或核心有什么关系,因为它主要是在内核中定义的。字典。或者至少我看不到比“方法的基本部分”更深的含义。

4
是50%100%高于25%还是25%高于25%?
如果我有两个值A和B都表示为C的百分比,并且我想用百分比D表示A和B之间的大小差异,那么将D表示为C的百分比是否更正确?占B(或实际上是A)的百分比? 50个失业者显然比25个失业者大50%,因为很明显,这里的“%”表示“ 25个失业者中的%”。但是50%的失业率比25%的失业率大多少?这是25%失业率的100%增长,但仅占潜在总失业率的25%。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.