2
直观地汇总一堆有向线段
我有一个数百万有向线段的数据集。线段是连续的-这是一个气候变量(显热),每半小时就有观察和模拟的值。我正在尝试寻找模拟执行方式的模式。我正在查看obs与仿真值的散点图,并将它们与线段链接(箭头表示时间方向)。如果我绘制它们,我将得到一个无法解释的模糊混乱,就像这样: 这是10000行的子集,绘制得很好并且具有低不透明度: ggplot(d, aes(x=Qh_obs, xend=lead(Qh_obs), y=Qh_sim, yend=lead(Qh_sim))) + geom_segment(size=0.1, alpha=0.2, arrow=arrow(length=unit(2, units='mm'))) dput() 前700行数据(受发布长度限制): structure( list( Qh_sim = c( 56.401439666748, 33.9568634033203, 16.2147789001465, 0.797790050506592, -3.19529962539673, -10.3250732421875, -11.6082448959351, -21.5074787139893, -21.5963478088379, -21.4389324188232, -19.8912830352783, -18.5908279418945, -19.2523441314697, -19.663516998291, -19.1126575469971, -18.4237308502197, -16.6181221008301, -14.7601175308228, -14.5604763031006, -14.3527803421021, -14.6219816207886, -14.791407585144, -15.452392578125, -15.8962726593018, -11.9349966049194, -7.97028636932373, 12.4507570266724, 32.1654815673828, 56.9330673217773, 82.0748443603516, 110.501235961914, …