我正在处理贝叶斯层次线性模型,这里是描述它的网络。
代表超市中某产品的每日销售额(已观察)。
是已知的回归矩阵,包括价格,促销,星期几,天气,假期。
1是每种产品的未知潜在库存水平,这会导致最多的问题,并且我认为是二进制变量的向量,每个产品一个,其中表示缺货,因此该产品不可用。 即使在理论上未知,我也通过HMM对每个产品进行了估算,因此可以将其视为X。我只是为了适当的形式主义而决定对它进行着色。
是任何单个产品的混合效果参数,其中考虑的混合效果是产品价格,促销和缺货。
b 1 b 2是固定回归系数的向量,而和是混合效应系数的向量。一组代表品牌,另一组代表风味(这是一个例子,实际上我有很多组,但是为了清楚起见,这里我只报告两个)。
Σ b 1 Σ b 2,和是混合效果的超参数。
因为我有计数数据,所以可以说我将每个产品的销售额都视泊松分布在回归变量上的条件而定(即使对于某些产品,线性近似成立,而对于其他产品,零膨胀模型更好)。在这种情况下,我将有一个乘积(这仅适用于那些对贝叶斯模型本身感兴趣的人,如果您发现它不感兴趣或不琐碎,请跳至该问题:)):
α 0,γ 0,α 1,γ 1,α 2,γ 2,已知。
Σ β,已知。
,
Ĵ ∈ 1 ,... ,米1 ķ ∈ 1 ,... ,米2,,
X p p š 我本人W¯¯ ž 我ž 我 = X 我σ 我Ĵ我Ĵ混合效应的矩阵,表示所考虑产品的价格,促销和缺货。表示逆Wishart分布,通常用于正态多元先验的协方差矩阵。但这在这里并不重要。一个可能的的示例可以是所有价格的矩阵,或者甚至可以说。关于混合效果方差-协方差矩阵的先验,我将尝试保留条目之间的相关性,这样,如果和是同一个品牌或其中一个品牌的产品,则将为正。同样的味道。
这种模型背后的直觉是,给定产品的销售取决于其价格,是否可获得,还取决于所有其他产品的价格和所有其他产品的缺货。由于我不想为所有系数都使用相同的模型(读取:相同的回归曲线),因此我引入了混合效应,该混合效应通过参数共享利用了数据中的某些组。
我的问题是:
- 有没有办法将此模型转换为神经网络体系结构?我知道有很多问题正在寻找贝叶斯网络,马尔可夫随机字段,贝叶斯层次模型和神经网络之间的关系,但是我没有找到从贝叶斯层次模型到神经网络的任何信息。 我问有关神经网络的问题,因为我的问题具有很高的维度(考虑到我有340个产品),通过MCMC进行参数估计需要花费数周的时间(我只尝试了20种在runJags中运行并行链的产品,这花费了几天的时间) 。但是我不想随意,而只是将数据作为黑匣子提供给神经网络。 我想利用我网络的依赖性/独立性结构。
在这里,我只是草绘了一个神经网络。如您所见,顶部的回归变量(和分别表示产品价格和缺货)和那些特定于产品的输入(在这里我考虑了价格和缺货)被输入到隐藏层。S i i (蓝色和黑色边缘没有特殊含义,仅是为了使图形更清晰)。此外,和可能高度相关,而Y 1 Y 2 Y 3可能是完全不同的产品(想像一下2个橙汁和红酒),但我不在神经网络中使用此信息。我想知道分组信息是仅用于体重减轻还是可以针对问题定制网络。
编辑,我的想法:
我的想法是这样的:和以前一样,和是相关产品,而是完全不同的产品。知道这是先验的,我做了两件事:Y 2 Y 3
- 我将隐藏层中的一些神经元预分配给我拥有的任何组,在这种情况下,我有2个组{(),()}。Y 3
- 我在输入和分配的节点(粗体边)之间初始化高权重,当然我构建其他隐藏节点以捕获数据中剩余的“随机性”。
预先感谢您的帮助