首先:据 我了解,引导残差的工作方式如下:
- 使模型适合数据
- 计算残差
- 重新采样残差并将其添加到1。
- 使模型适合3中的新数据集。
- 重复
n
次数,但始终将重新采样的残差添加到从1开始的拟合中。
到目前为止,对吗?
我想做的是稍微不同的事情:
我想为估计一些环境变量的算法估计参数和预测不确定性。
我所拥有的是该变量的无错误时间序列(来自模拟)x_true
,在其中添加了一些噪声,x_noise
以生成综合数据集x
。然后,我尝试通过将平方和sum((x_estimate - x_true)^2)
(!not x_estimate - x
!)作为目标函数拟合我的算法来找到最佳参数。为了查看我的算法如何执行并创建参数分布的样本,我想重新采样x_noise
,将其添加到x_true
,再次拟合我的模型,冲洗并重复。这是评估参数不确定性的有效方法吗?我可以将自举数据集的拟合解释为预测不确定性,还是必须遵循上面发布的过程?
/ edit:我认为我还没有真正弄清楚模型的作用。可以认为它本质上类似于降噪方法。它不是预测模型,而是一种试图提取嘈杂的环境数据时间序列的基础信号的算法。
/ edit ^ 2:对于在那里的MATLAB用户,我写下了一些我所要表达的快速且肮脏的线性回归示例。
我认为这是残差的“常规”自举(如果我错了,请纠正我):http : //pastebin.com/C0CJp3d1
这就是我想做的:http : //pastebin.com/mbapsz4c