对于贝叶斯逻辑回归问题,我创建了后验预测分布。我从预测分布中进行采样,对于每个观测值,我都会收到数千个(0,1)的采样。可视化拟合优度并不有趣,例如:
此图显示了1万个样本+观察到的基准点(左侧的一条可以画出一条红线:是的,是观察值)。问题在于该图很难提供信息,我将使用其中的23个,每个数据点一个。
是否有更好的方法可视化23个数据点以及后面的样本。
另一尝试:
基于纸张的另一种尝试这里
1
有关上述数据可视化技术有效的示例,请参见此处。
—
Cam.Davidson.Pilon
那是很多浪费的IMO。您是否真的只有3个值(低于0.5,高于0.5和观察值),或者这仅仅是您给出的示例的人工产物?
—
安迪W
实际上更糟:我有8500 0和1500 1s。该图仅按这些值即可建立连接的直方图。但我同意:大量浪费的空间。实际上,对于每个数据点,我都可以将其缩小为一定比例(例如8500/10000)和一个观测值(0或1)
—
Cam.Davidson.Pilon 2013年
因此,您有23个数据点,有多少个预测变量?您是针对新数据点还是用于模型拟合的23个点的后验预测变形?
—
概率
您更新后的情节接近我的建议。x轴代表什么?看来您有一些重叠的要点-似乎只需要23点即可。
—
Andy W