统计和大数据 curve-fitting

4

是否有像LOESS这样的建模技术这样允许零个，一个或多个不连续性，而这些不连续性的时间先验未知？如果存在一种技术，R中是否存在现有的实现？

14 r regression curve-fitting change-point loess

3

在Bishop的机器学习书中，它讨论了将多项式函数曲线拟合到一组数据点的问题。令M为多项式拟合的阶数。它指出我们看到，随着M的增加，系数的大小通常会变大。特别是对于M = 9的多项式，通过产生较大的正值和负值，系数已经微调到数据，因此相应的多项式函数恰好与每个数据点匹配，但与数据点之间（尤其是在数据点的末端附近）匹配范围）功能显示出较大的振荡。我不明白为什么大值意味着更紧密地拟合数据点。我认为这些值会在小数点后变得更精确，而不是为了更好地拟合。

13 regression least-squares curve-fitting polynomial

1

加法误差还是乘法误差？

我是统计学的新手，不胜感激可以帮助您更好地理解这一点。在我的领域中，有以下形式的常用模型： PŤ= PØ（五Ť）αPt=Po(Vt)αP_t = P_o(V_t)^\alpha 当人们将模型拟合到数据时，他们通常将模型线性化并符合以下条件日志（PŤ）= 日志（PØ）+ α 日志（五Ť）+ ϵlog⁡(Pt)=log⁡(Po)+αlog⁡(Vt)+ϵ\log(P_t) = \log(P_o) + \alpha \log(V_t) + \epsilon 这个可以吗？我在某处读到，由于信号中的噪声，实际模型应该是 PŤ= PØ（五Ť）α+ ϵPt=Po(Vt)α+ϵP_t = P_o(V_t)^\alpha + \epsilon 并且不能像上面那样线性化。这是真的？如果是这样，是否有人知道我可以阅读和参考的参考文献，并且可能在报告中引用？

13 modeling model error curve-fitting measurement-error

1

从RMSE计算似然

我有一个模型来预测带有几个参数的轨迹（x作为时间的函数）。目前，我计算了预测轨迹与实验记录的轨迹之间的均方根误差（RMSE）。当前，我使用单纯形（matlab中的fminsearch）将这种差异（RMSE）最小化。虽然此方法可以很好地拟合，但我想比较几种不同的模型，所以我认为我需要计算似然性，以便可以使用最大似然估计而不是最小化RMSE（然后使用AIC或BIC比较模型）。有什么标准的方法可以做到这一点吗？

13 maximum-likelihood curve-fitting

3

高度非线性函数的拟合策略

为了分析生物物理学实验的数据，我目前正在尝试使用高度非线性的模型进行曲线拟合。模型函数基本上看起来像： y=ax+bx−1/2y=ax+bx−1/2y = ax + bx^{-1/2} 在这里，尤其是的值引起了极大的兴趣。bbb 此函数的图解：（请注意，模型函数是基于对系统的全面数学描述，并且看起来效果很好---只是自动拟合很棘手）。当然，模型函数是有问题的：到目前为止，我尝试过的拟合策略因处的渐近渐近线而失败，尤其是对于嘈杂的数据。x=0x=0x=0 我对这里问题的理解是，简单的最小二乘拟合（我在MATLAB中同时进行了线性和非线性回归；主要是Levenberg-Marquardt）对垂直渐近线非常敏感，因为x中的小误差被极大地放大了。谁能指出我可以解决此问题的合适策略？我有一些统计方面的基本知识，但是仍然很有限。我很想学习，如果我只知道从哪里开始的话:) 非常感谢您的建议！编辑求您原谅忘记提及错误。唯一的显着噪声是，它是可加的。xxx 编辑2有关此问题背景的一些其他信息。上图对聚合物的拉伸行为进行了建模。正如@whuber在评论中指出的那样，您需要来获得如上的图形。b≈−200ab≈−200ab \approx -200 a 关于人们到目前为止如何拟合该曲线：似乎人们通常会切断垂直渐近线，直到找到合适的拟合为止。但是，截止选择仍然是任意的，这使拟合过程不可靠且不可重现。编辑3＆4固定图。

12 curve-fitting nonlinear

1

使用最小二乘法与广义线性模型与非线性最小二乘拟合指数函数

我有一个代表指数衰减的数据集。我想对这个数据拟合指数函数。我尝试对数转换响应变量，然后使用最小二乘法拟合一条线。使用具有对数链接函数和响应变量周围的伽马分布的广义线性模型；并使用非线性最小二乘法。尽管每种方法的两个系数都相似，但我得到的答案不同。我感到困惑的地方是我不确定哪种方法最适合使用以及为什么使用。有人可以比较和对比这些方法吗？谢谢。y=Beaxy=Beaxy = Be^{ax}

12 modeling generalized-linear-model least-squares nonlinear-regression curve-fitting

1

估计S型曲线笔直部分的斜率

我被赋予了这项任务，并感到沮丧。一位同事让我估算下图的和：Xü p p è [RXüppË[Rx_{upper}X升ø 瓦特Ë řX升ØwË[Rx_{lower} 曲线实际上是累积分布，而x是某种度量。他很想知道当累积函数开始变得笔直并偏离笔直时，x上对应的值是多少。我知道我们可以使用微分来找到某个点的斜率，但是我不太确定如何确定何时可以将该直线称为直线。任何对某些已经存在的方法/文学的微调将不胜感激。如果您碰巧知道此类调查的任何相关软件包或示例，我也知道R。非常感谢。更新多亏了Flounderer，我得以进一步扩展工作，建立框架并在这里和那里修改参数。为了学习，这里是我当前的代码和图形输出。 library(ESPRESSO) x <- skew.rnorm(800, 150, 5, 3) x <- sort(x) meanX <- mean(x) sdX <- sd(x) stdX <- (x-meanX)/sdX y <- pnorm(stdX) par(mfrow=c(2,2), mai=c(1,1,0.3,0.3)) hist(x, col="#03718750", border="white", main="") nq <- diff(y)/diff(x) plot.ts(nq, col="#6dc03480") log.nq <- log(nq) low …

11 estimation pdf curve-fitting logistic-curve

1

使分布适合空间数据

从mathoverflow交叉发布我的问题，以找到一些特定于统计信息的帮助。我正在研究一个物理过程，该过程生成的数据可以很好地投影到具有非负值的两个维度中。每个过程都有 -点的（投影）轨迹-参见下图。xxxyyy 样本轨道为蓝色，麻烦的轨道类型以绿色绘制，而关注区域则以红色绘制：每个轨道都是独立实验的结果。几年来已经进行了2000万次实验，但是从那开始只有2000项实验展现了我们绘制的轨迹特征。我们只关心产生轨迹的实验，因此我们的数据集是（大约）两千条轨迹。这是可能的轨道，进入关注的区域，我们期望的顺序在曲目这样做。估算这个数字是眼前的问题：11110410410^4 我们如何计算一条任意轨道进入关注区域的可能性？不可能足够快地进行实验，以查看进入关注区域的跟踪的产生频率，因此我们需要从可用数据中推断出结果。例如，我们已经拟合了给定值，但这并不能充分处理绿色轨迹之类的数据-似乎需要一个包含两个维度的模型。xxxy≥200y≥200y\ge200 我们已经确定了从每个轨道到关注区域的最小距离，但是我们不相信这会产生合理的结果。 1）是否有已知的方法可以使分布适合此类数据进行外推？ -要么- 2）是否有明显的方法使用此数据来创建用于生成轨道的模型？例如，使用轨道上的主成分分析作为较大空间中的点，然后对投影到这些成分上的轨道拟合分布（Pearson？）。

10 distributions modeling predictive-models fitting curve-fitting

2

功能数据分析和高维数据分析有什么区别

在统计文献中，有很多关于“ 功能数据 ”（即曲线数据）的参考，也有许多关于“ 高维数据 ”（即当数据是高维向量时）的参考。我的问题是两种数据之间的区别。当谈论在情况1中应用的应用统计方法时，可以理解为是从情况2通过投影到函数空间的有限维子空间中对方法进行的表述，它可以是多项式，样条，小波，傅立叶等。并将函数问题转化为有限维向量问题（因为在应用数学中，所有事情在某些时候都是有限的）。我的问题是：我们可以说适用于功能数据的任何统计程序也可以（几乎直接）适用于高维数据，而专用于高维数据的任何程序也可以（几乎直接）适用于功能数据吗？如果答案是否定的，您能举例说明吗？在Simon Byrne的答案的帮助下进行编辑/更新：稀疏性（S-稀疏假设，球和弱升p球p < 1）被用作在高维统计分析的结构的假设。升p升pl^p升p升pl^pp < 1p<1个p<1 “平滑度”在功能数据分析中用作结构假设。另一方面，傅里叶逆变换和小波逆变换将稀疏性转换为平滑度，而通过小波和傅立叶变换将平滑度转换为稀疏度。这使得西蒙提到的关键差异不是那么关键吗？

10 data-mining signal-processing curve-fitting wavelet

4

是否有关于S形曲线的公式，其范围和范围为[0,1]

基本上，我想将相似性度量转换为用作预测变量的权重。相似之处将在[0,1]上，而我将权重也限制在[0,1]上。我想要执行此映射的参数函数，我可能会使用梯度下降对其进行优化。要求是0映射到0，1映射到1，并且严格增加。还可以理解一个简单的导数。提前致谢编辑：感谢到目前为止的答复，这些都非常有帮助。为了使我的目的更清楚，任务是预测。我的观察结果是具有单个维度的极稀疏向量，可以对其进行预测。我的输入尺寸用于计算相似度。然后，我的预测是该预测变量的其他观察值的加权总和，其中权重是相似性的函数。为了简单起见，我将权重限制在[0,1]上。希望现在显而易见，为什么我要求0映射为0，要求1映射为1，并要求它严格增加。正如whuber指出的那样，使用f（x）= x可以满足这些要求，并且实际上效果很好。但是，它没有要优化的参数。我有很多观察，所以我可以容忍很多参数。我将手动编码梯度下降，因此我偏爱简单的导数。例如，给出的许多响应都是关于.5对称的。使参数向左/向右移动（例如使用beta分布）会很有用

10 optimization curve-fitting

1

Beta分布的两个分位数是否确定其参数？

如果我在开放时间间隔给出了两个分位数及其对应的位置（每个，我是否总能找到在指定位置具有那些分位数的beta分布的参数？（q 1，q 2）（升1，升2）（0 ，1 ）(q1,q2)(q_1,q_2)(l1,l2)(l_1,l_2)(0,1)(0,1)

9 quantiles curve-fitting beta-distribution

Questions tagged «curve-fitting»