Questions tagged «curve-fitting»

用于将曲线拟合(如线性或非线性回归)以拟合数据的方法。


3
为什么高阶多项式有大系数
在Bishop的机器学习书中,它讨论了将多项式函数曲线拟合到一组数据点的问题。 令M为多项式拟合的阶数。它指出 我们看到,随着M的增加,系数的大小通常会变大。特别是对于M = 9的多项式,通过产生较大的正值和负值,系数已经微调到数据,因此相应的多项式函数恰好与每个数据点匹配,但与数据点之间(尤其是在数据点的末端附近)匹配范围)功能显示出较大的振荡。 我不明白为什么大值意味着更紧密地拟合数据点。我认为这些值会在小数点后变得更精确,而不是为了更好地拟合。

1
加法误差还是乘法误差?
我是统计学的新手,不胜感激可以帮助您更好地理解这一点。 在我的领域中,有以下形式的常用模型: PŤ= PØ(五Ť)αPt=Po(Vt)αP_t = P_o(V_t)^\alpha 当人们将模型拟合到数据时,他们通常将模型线性化并符合以下条件 日志(PŤ)= 日志(PØ)+ α 日志(五Ť)+ ϵlog⁡(Pt)=log⁡(Po)+αlog⁡(Vt)+ϵ\log(P_t) = \log(P_o) + \alpha \log(V_t) + \epsilon 这个可以吗?我在某处读到,由于信号中的噪声,实际模型应该是 PŤ= PØ(五Ť)α+ ϵPt=Po(Vt)α+ϵP_t = P_o(V_t)^\alpha + \epsilon 并且不能像上面那样线性化。这是真的?如果是这样,是否有人知道我可以阅读和参考的参考文献,并且可能在报告中引用?

1
从RMSE计算似然
我有一个模型来预测带有几个参数的轨迹(x作为时间的函数)。目前,我计算了预测轨迹与实验记录的轨迹之间的均方根误差(RMSE)。当前,我使用单纯形(matlab中的fminsearch)将这种差异(RMSE)最小化。虽然此方法可以很好地拟合,但我想比较几种不同的模型,所以我认为我需要计算似然性,以便可以使用最大似然估计而不是最小化RMSE(然后使用AIC或BIC比较模型)。有什么标准的方法可以做到这一点吗?

3
高度非线性函数的拟合策略
为了分析生物物理学实验的数据,我目前正在尝试使用高度非线性的模型进行曲线拟合。模型函数基本上看起来像: y=ax+bx−1/2y=ax+bx−1/2y = ax + bx^{-1/2} 在这里,尤其是的值引起了极大的兴趣。bbb 此函数的图解: (请注意,模型函数是基于对系统的全面数学描述,并且看起来效果很好---只是自动拟合很棘手)。 当然,模型函数是有问题的:到目前为止,我尝试过的拟合策略因处的渐近渐近线而失败,尤其是对于嘈杂的数据。x=0x=0x=0 我对这里问题的理解是,简单的最小二乘拟合(我在MATLAB中同时进行了线性和非线性回归;主要是Levenberg-Marquardt)对垂直渐近线非常敏感,因为x中的小误差被极大地放大了。 谁能指出我可以解决此问题的合适策略? 我有一些统计方面的基本知识,但是仍然很有限。我很想学习,如果我只知道从哪里开始的话:) 非常感谢您的建议! 编辑求您原谅忘记提及错误。唯一的显着噪声是,它是可加的。xxx 编辑2有关此问题背景的一些其他信息。上图对聚合物的拉伸行为进行了建模。正如@whuber在评论中指出的那样,您需要来获得如上的图形。b≈−200ab≈−200ab \approx -200 a 关于人们到目前为止如何拟合该曲线:似乎人们通常会切断垂直渐近线,直到找到合适的拟合为止。但是,截止选择仍然是任意的,这使拟合过程不可靠且不可重现。 编辑3&4固定图。

1
使用最小二乘法与广义线性模型与非线性最小二乘拟合指数函数
我有一个代表指数衰减的数据集。我想对这个数据拟合指数函数。我尝试对数转换响应变量,然后使用最小二乘法拟合一条线。使用具有对数链接函数和响应变量周围的伽马分布的广义线性模型;并使用非线性最小二乘法。尽管每种方法的两个系数都相似,但我得到的答案不同。我感到困惑的地方是我不确定哪种方法最适合使用以及为什么使用。有人可以比较和对比这些方法吗?谢谢。y=Beaxy=Beaxy = Be^{ax}

1
估计S型曲线笔直部分的斜率
我被赋予了这项任务,并感到沮丧。一位同事让我估算下图的和:Xü p p è [RXüppË[Rx_{upper}X升ø 瓦特Ë řX升ØwË[Rx_{lower} 曲线实际上是累积分布,而x是某种度量。他很想知道当累积函数开始变得笔直并偏离笔直时,x上对应的值是多少。 我知道我们可以使用微分来找到某个点的斜率,但是我不太确定如何确定何时可以将该直线称为直线。任何对某些已经存在的方法/文学的微调将不胜感激。 如果您碰巧知道此类调查的任何相关软件包或示例,我也知道R。 非常感谢。 更新 多亏了Flounderer,我得以进一步扩展工作,建立框架并在这里和那里修改参数。为了学习,这里是我当前的代码和图形输出。 library(ESPRESSO) x <- skew.rnorm(800, 150, 5, 3) x <- sort(x) meanX <- mean(x) sdX <- sd(x) stdX <- (x-meanX)/sdX y <- pnorm(stdX) par(mfrow=c(2,2), mai=c(1,1,0.3,0.3)) hist(x, col="#03718750", border="white", main="") nq <- diff(y)/diff(x) plot.ts(nq, col="#6dc03480") log.nq <- log(nq) low …

1
使分布适合空间数据
从mathoverflow交叉发布我的问题,以找到一些特定于统计信息的帮助。 我正在研究一个物理过程,该过程生成的数据可以很好地投影到具有非负值的两个维度中。每个过程都有 -点的(投影)轨迹-参见下图。xxxyyy 样本轨道为蓝色,麻烦的轨道类型以绿色绘制,而关注区域则以红色绘制: 每个轨道都是独立实验的结果。几年来已经进行了2000万次实验,但是从那开始只有2000项实验展现了我们绘制的轨迹特征。我们只关心产生轨迹的实验,因此我们的数据集是(大约)两千条轨迹。 这是可能的轨道,进入关注的区域,我们期望的顺序在曲目这样做。估算这个数字是眼前的问题:11110410410^4 我们如何计算一条任意轨道进入关注区域的可能性? 不可能足够快地进行实验,以查看进入关注区域的跟踪的产生频率,因此我们需要从可用数据中推断出结果。 例如,我们已经拟合了给定值,但这并不能充分处理绿色轨迹之类的数据-似乎需要一个包含两个维度的模型。xxxy≥200y≥200y\ge200 我们已经确定了从每个轨道到关注区域的最小距离,但是我们不相信这会产生合理的结果。 1)是否有已知的方法可以使分布适合此类数据进行外推? -要么- 2)是否有明显的方法使用此数据来创建用于生成轨道的模型?例如,使用轨道上的主成分分析作为较大空间中的点,然后对投影到这些成分上的轨道拟合分布(Pearson?)。

2
功能数据分析和高维数据分析有什么区别
在统计文献中,有很多关于“ 功能数据 ”(即曲线数据)的参考,也有许多关于“ 高维数据 ”(即当数据是高维向量时)的参考。我的问题是两种数据之间的区别。 当谈论在情况1中应用的应用统计方法时,可以理解为是从情况2通过投影到函数空间的有限维子空间中对方法进行的表述,它可以是多项式,样条,小波,傅立叶等。并将函数问题转化为有限维向量问题(因为在应用数学中,所有事情在某些时候都是有限的)。 我的问题是: 我们可以说适用于功能数据的任何统计程序也可以(几乎直接)适用于高维数据,而专用于高维数据的任何程序也可以(几乎直接)适用于功能数据吗? 如果答案是否定的,您能举例说明吗? 在Simon Byrne的答案的帮助下进行编辑/更新: 稀疏性(S-稀疏假设,球和弱升p球p &lt; 1)被用作在高维统计分析的结构的假设。升p升pl^p升p升pl^pp &lt; 1p&lt;1个p<1 “平滑度”在功能数据分析中用作结构假设。 另一方面,傅里叶逆变换和小波逆变换将稀疏性转换为平滑度,而通过小波和傅立叶变换将平滑度转换为稀疏度。这使得西蒙提到的关键差异不是那么关键吗?

4
是否有关于S形曲线的公式,其范围和范围为[0,1]
基本上,我想将相似性度量转换为用作预测变量的权重。相似之处将在[0,1]上,而我将权重也限制在[0,1]上。我想要执行此映射的参数函数,我可能会使用梯度下降对其进行优化。要求是0映射到0,1映射到1,并且严格增加。还可以理解一个简单的导数。提前致谢 编辑:感谢到目前为止的答复,这些都非常有帮助。为了使我的目的更清楚,任务是预测。我的观察结果是具有单个维度的极稀疏向量,可以对其进行预测。我的输入尺寸用于计算相似度。然后,我的预测是该预测变量的其他观察值的加权总和,其中权重是相似性的函数。为了简单起见,我将权重限制在[0,1]上。希望现在显而易见,为什么我要求0映射为0,要求1映射为1,并要求它严格增加。正如whuber指出的那样,使用f(x)= x可以满足这些要求,并且实际上效果很好。但是,它没有要优化的参数。我有很多观察,所以我可以容忍很多参数。我将手动编码梯度下降,因此我偏爱简单的导数。 例如,给出的许多响应都是关于.5对称的。使参数向左/向右移动(例如使用beta分布)会很有用

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.