Questions tagged «terminology»

统计中特定技术用语/概念的用法和含义。

1
流形学习和非线性降维有什么区别?
流形学习和非线性降维有什么区别? 我已经看到这两个术语可以互换使用。例如: http://www.cs.cornell.edu/~kilian/research/manifold/manifold.html: 流形学习(通常也称为非线性降维)追求的目标是在保持特征特性的同时,将原来位于高维空间中的数据嵌入到低维空间中。 http://www.stat.washington.edu/courses/stat539/spring14/Resources/tutorial_nonlin-dim-red.pdf: 在本教程中,“流形学习”和“降维”可互换使用。 https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3337666/: 降维方法是一类算法,该算法使用数学定义的流形对多维类进行统计采样,以生成保证统计准确性的判别规则。 但是,http ://scikit-learn.org/stable/modules/manifold.html更为细微: 流形学习是非线性降维的一种方法。 我看到的第一个区别是流形可以是线性的,因此应该比较非线性流形学习和非线性降维。


1
普通的最小二乘是什么?
我的一个朋友最近问什么是普通的,关于普通最小二乘。我们似乎没有在讨论中取得任何进展。我们都同意OLS是线性模型的特例,它具有许多用途,众所周知,并且是许多其他模型的特例。但这真的是全部吗? 因此,我想知道: 名字的真正来源是什么? 谁是第一个使用这个名字的人?

1
数据空间,变量空间,观察空间,模型空间(例如,线性回归)
假设我们有一个数据矩阵(它是 ×)和标签矢量(它是 ×1)。在这里,矩阵的每一行都是一个观察值,每一列都对应一个维度/变量。(假设)XX\mathbf{X}ññnpppÿÿYññnÑ > pñ>pn>p 那么什么data space,variable space,observation space,model space是什么意思? 列向量跨越的空间是否是一个(退化的) -D空间,因为它具有坐标,而列为,又称为列可变空间,因为它被变量向量跨越了?还是因为每个维度/坐标都对应一个观测值,所以将其称为观测空间?ññnññnppp 行向量跨越的空间又如何呢?

2
哪个科学领域研究人们如何解释定量总结和可视化?
有大量的知名资源提供有关数据可视化的建议。(例如,Tufte,Stephen Few等人,Nathan Yau。)但是,对于诸如此类的问题,答案可能会转向哪个领域: 饼图批评在实践中是否有意义?人们在解释线性标尺长度方面比在弧长方面要好得多吗? 假设我构建了一组基础变量的指数摘要,并向一般观众解释美国在2010年的价值为100,在2015年的价值为110。大多数人将如何解释这些数字?在介绍此指标时,我是否应该考虑自然的认知习惯,以便更好地解释或防止误解? 换句话说,定量信息的呈现者可以在哪些科学领域中寻找经验上可靠且经过测试的原理,这些原理可以帮助整理当今可用的大量可视化和设计建议? 目的不是要找到关于如何最佳地可视化数据或解决新颖的数据可视化问题的建议,想法或当前共识,而是要在哪里寻找人们如何解释定量和/或视觉信息的科学。 (对于引用该领域的期刊,会议和学者的额外感谢。)


1
在物流回归中使用“预测”一词有多公平?
我的理解是,即使回归也不能给出因果关系。它只能给出y变量和x变量以及可能的方向之间的关联。我对么?即使在大多数课程教科书和在线的各种课程页面上,我也经常发现类似于“ x预测y”的短语。您通常将回归变量称为预测变量,将y称为响应。 将其用于线性回归有多公平? 逻辑回归如何?(如果我确实有一个阈值t,可以与之比较概率?)

3
通过所谓的平均观测值归一化的RMSE是多少?
我一直在使用Root Mean Squared Error(RMSE)来衡量使用模型预测的值的准确性。我知道返回的值使用的是我的度量单位(而不是百分比)。但是,我想用百分比来表示我的值。我采用的方法是RMSE通过观察值的平均值标准化。 有RMSE/mean什么用吗?


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.