“深Noether定理”:建立对称约束


9

如果我有一个应该具有固有对称性的学习问题,是否有办法使我的学习问题受到对称性约束的影响而增强学习?

例如,如果我要进行图像识别,则可能需要2D旋转对称性。这意味着图像的旋转版本应获得与原始图像相同的结果。

或者,如果我正在学习玩井字游戏,那么旋转90度应该可以产生相同的游戏效果。

是否对此进行了研究?



@Emre谢谢!您知道CNN以外的工作吗?
aidan.plenert.macdonald '17

不,我对这个利基只有肤浅的认识。尽管如此,CNN似乎是自然的环境...
Emre

3
我还应该提到Risi Kondor的博士学位论文,机器学习中的组理论方法(pdf)
Emre,

Answers:


8

根据上面Emre的评论,Risi Kondor的机器学习中组理论方法的第4.4节提供了有关创建固有具有对称性的内核方法的详细信息和证据。我将以一种希望直观的方式进行总结(我是物理学家而不是数学家!)。

大多数机器学习算法都有一个矩阵乘法,例如 其中 是输入,是我们希望训练的权重。

si=jWij xj=jWij (ejx)
xWij

内核方法

输入内核方法的领域,然后让算法通过 ,现在我们将其推广为。

si=jWij k(ej, x)
x,ejX

考虑一组作用于经由为。使我们的算法在该组下不变的一种简单方法是使内核 与。GXxTg(x)gG

kG(x,y)=1|G|gGk(x,Tg(y))
k(x,y)=k(Tg(x),Tg(y))

因此,

kG(x,Th(y))=1|G|gGk(x,Tgh(y))=1|G|gGk(x,Tg(y))=1|G|gGk(Tg(x),y)

对于适用于所有unit表示的,k(x,y)=xy

kG(x,Th(y))=[1|G|gGTg(x)]y

它提供了可以使输入对称化的转换矩阵。

SO(2)示例

实际上,为简单起见,仅映射到旋转的组。π2

让我们对数据中的数据进行线性回归,我们期望旋转对称。(xi,yi)R2×R

我们的优化问题变为

minWji12(yiy~i)2y~i=jWjkG(ej,xi)+bi

内核满足。您还可以使用和各种内核。k(x,y)=xy2k(x,y)=k(Tg(x),Tg(y))k(x,y)=xy

因此,

kG(ej,xi)=14n=14R(nπ/2) ejxi2=14n=14(cos(nπ/2)xi1)2+(sin(nπ/2)xi2)2=14[2xi12+2xi22+(1xi1)2+(1xi2)2+(1+xi1)2+(1+xi2)2]=xi12+xi22+1

请注意,我们不需要对求和,因为两者都相同。这样我们的问题就变成了 j

minWi12(yiy~i)2y~i=W[xi12+xi22+1]+bi

产生预期的球对称性!

井字游戏

示例代码可以在这里看到。它显示了我们如何创建一个编码对称性的矩阵并使用它。请注意,这在我实际运行时真的很糟糕!目前正在与其他内核一起工作。


干得好,爱丹!如果有时间,您可以撰写更详细的博客文章。社区将最感兴趣。
Emre

1
不知道您指的是哪个社区,但我开始写更多。我想找到一种在给定数据集的情况下估计最佳内核的方法。因此,我优化了内核空间的熵,以直观地获得一组受对称约束且最大程度熵(即信息量大)的特征。现在,这是否是正确的方法。我不能说 只是警告,数学现在只是一项骇人听闻的工作,有点不符合统计标准。overleaf.com/read/kdfzdbyhpbbq
aidan.plenert.macdonald

当不知道对称群时,有什么有意义的方法吗?
leitasat

@leitasat如果您不认识该小组,您怎么知道它是对称的?
aidan.plenert.macdonald

来自数据的@ aidan.plenert.macdonald。假设我们有1000组,每组100张图片,并且每组中有一个对象从不同角度来看的图片。任何算法都可以“学习SO(3)对称性的思想”并将其用于以前看不见的对象吗?
leitasat

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.