是模型适合数据还是数据适合模型?


20

将模型拟合至数据与将数据拟合至模型之间在概念或程序上有区别吗?第一个措词的示例可以在https://courses.washington.edu/matlab1/ModelFitting.html中找到,第二个可以在https://reference.wolfram.com/applications/eda/FittingDataToLinearModelsByLeast-SquaresTechniques.html中找到


7
+1我对第二个链接没有印象,但是我很开心。
Laconic

许多车型符合当前的数据,但数据通常适合最好的一个模型
Agnius Vasiliauskas

Answers:


35

除了链接的Wolfram来源,几乎我与之互动过的每个来源或人都称此过程为将模型拟合到数据。这是有道理的,因为模型是动态对象,而数据是静态的(又称固定和常量)。

要指出一点,我喜欢拉里·瓦瑟曼(Larry Wasserman)的方法。用他的话来说,统计模型是分布的集合。例如,所有正态分布的集合:

{正常μσμσ[Rσ>0}

或所有泊松分布的集合:

{泊松λλ[Rλ>0}

使分布适合数据的方法是将统计模型与一组数据(数据是固定的)结合在一起,并从模型中选择一个分布,作为“最佳”反映数据的一种算法。

模型是不断变化的事物(某种):我们正在将其从所有可能性的集合中分解为一个最佳选择。数据就是数据。完全没有任何反应。


16

在Rasch建模领域,通常将数据拟合到模型中。该模型被认为是正确的,找到符合该模型的数据是分析师的工作。Rasch上的Wikipedia文章包含有关如何以及为什么的更多详细信息。

但是我同意其他人的看法,即通常在统计数据中,我们可以使模型适合数据,因为我们可以更改模型,但是选择或修改数据被认为是不好的形式。


7

通常,在模型可变时(例如,因为估计了参数),观察到的数据是固定的,因此,要使模型适合数据,而不是相反。(通常人们在说任何一种表达时都表示这种情况。)

当人们说他们使数据适合模型时,我发现自己试图弄清楚他们对数据做了什么?

[现在,如果要转换数据,那可以说是'将数据拟合到模型中,但是在这种情况下,人们几乎永远不会这么说。”


5
消除异常值也(可以说)是“将数据拟合到模型中”。
Federico Poloni

1
如果他们认为短语是“拟合(数据到模型)”,则短语可能有意义。也就是说,您正在执行拟合过程,该拟合过程从数据开始并将其转换为模型。我同意,与“(将X拟合为Y)”解析相比,这是一种不太常见/不准确的解释,但是我把它解释为是为什么有人可能会逻辑地说它的理由。
RM

1
@FedericoPoloni离群值通常独立于以后要使用的模型而定义。因此,即使我们想称其为拟合数据,也不会是模型,而是其他模型。
BartoszKP

1
+1。有一个原因称为“数据”-它是给定的,请参见该词的拉丁语起源:latindictionary.wikidot.com/verb
Christoph Hanck

2

通常,我们假设我们的数据与“真实世界”相对应,并且进行任何修改就意味着我们将不再对“真实世界”建模。例如,一个人需要注意消除异常值,因为即使它使计算变得更好,但异常值仍然是我们数据的一部分。

当使用自举或其他重采样技术测试模型或估算器的属性时,我们可能会使用估算的模型和原始数据来模拟新数据。这假设模型是正确的,并且我们没有修改原始数据。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.