用逻辑函数转换的高斯随机变量的期望值


10

逻辑函数和标准差通常都表示为。我将使用和作为标准偏差。σσ(x)=1/(1+exp(x))s

我有一个逻辑输入随机输入的逻辑神经元,其均值和标准差我所知。我希望可以通过一些高斯噪声很好地估计出与平均值的差。因此,略微使用符号,假定它产生。的期望值是多少?与或相比,标准偏差可能大或小。理想值的良好闭合形式近似值几乎与闭合形式解决方案一样好。μsσ(μ+N(0,s2))=σ(N(μ,s2))σ(N(μ,s2))sμ1

我认为不存在封闭形式的解决方案。这可以看作是卷积,并且逻辑密度的特征函数是已知的(),但是我不确定有什么帮助。该逆符号计算器无法识别密度物流配送的密度的卷积和标准正态分布,这说明,但并不能证明没有简单的基本积分。更多的间接证据:在一些将高斯输入噪声添加到具有逻辑神经元的神经网络的论文中,这些论文也未给出封闭形式的表达式。πt csch πt0

这个问题产生于试图了解玻尔兹曼机中平均场近似的误差。

Answers:


5

以下是我最终使用的内容:

写其中。我们可以使用泰勒级数展开式。σ(N(μ,s2))=σ(μ+X)XN(0,s2)

σ(μ+X)=σ(μ)+Xσ(μ)+X22σ(μ)+...+Xnn!σ(n)(μ)+...

E[σ(μ+X)]=E[σ(μ)]+E[Xσ(μ)]+E[X22σ(μ)]+...=σ(μ)+0+s22σ(μ)+0+3s424σ(4)(μ)+...+s2k2kk!σ(2k)(μ)...

存在收敛问题。逻辑函数有一个极点,其中,所以在,奇数。发散与前缀无用不是一回事,但是当有效时,这种级数逼近可能不可靠。exp(x)=1x=kπikP(|X|>μ2+π2)

由于,我们可以写出的衍生物作为多项式。例如,和。该系数与OEIS A028246有关σ(x)=σ(x)(1σ(x))σ(x)σ(x)σ=σ3σ2+2σ3σ=σ7σ2+12σ36σ4


4

您这里拥有的是一个随机变量,它遵循对数正态(或对数正态)分布(请参阅Wikipedia),即。对数正态分布的时刻没有解析解。logit[x]N(μ,s2)

但是,当然可以通过数值积分获得它们。如果您使用R,则有logitnorm软件包可以满足您的所有需求。一个例子:

install.packages("logitnorm")
library(logitnorm)
momentsLogitnorm(mu=1, sigma=2)

这产生:

> momentsLogitnorm(mu=1, sigma=2)
      mean        var 
0.64772644 0.08767866

因此,甚至还有一个便利函数,可以直接为您提供均值和方差。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.