从mathoverflow交叉发布我的问题,以找到一些特定于统计信息的帮助。
我正在研究一个物理过程,该过程生成的数据可以很好地投影到具有非负值的两个维度中。每个过程都有 -点的(投影)轨迹-参见下图。
样本轨道为蓝色,麻烦的轨道类型以绿色绘制,而关注区域则以红色绘制:
每个轨道都是独立实验的结果。几年来已经进行了2000万次实验,但是从那开始只有2000项实验展现了我们绘制的轨迹特征。我们只关心产生轨迹的实验,因此我们的数据集是(大约)两千条轨迹。
这是可能的轨道,进入关注的区域,我们期望的顺序在曲目这样做。估算这个数字是眼前的问题:
我们如何计算一条任意轨道进入关注区域的可能性?
不可能足够快地进行实验,以查看进入关注区域的跟踪的产生频率,因此我们需要从可用数据中推断出结果。
例如,我们已经拟合了给定值,但这并不能充分处理绿色轨迹之类的数据-似乎需要一个包含两个维度的模型。
我们已经确定了从每个轨道到关注区域的最小距离,但是我们不相信这会产生合理的结果。
1)是否有已知的方法可以使分布适合此类数据进行外推?
-要么-
2)是否有明显的方法使用此数据来创建用于生成轨道的模型?例如,使用轨道上的主成分分析作为较大空间中的点,然后对投影到这些成分上的轨道拟合分布(Pearson?)。