“在要素和类之间共享参数”是什么意思


Answers:


22

我将尝试通过logistic回归(最简单的线性分类器之一)回答这个问题。

逻辑回归的最简单的情况是,如果我们有一个二元分类任务(y{0,1})和仅一个输入要素xR)。在这种情况下,逻辑回归的输出为:

y^=σ(wx+b)
其中和b均为标量。模型\ hat y \ in [0,1]的输出x属于类别1的概率相对应。bwbX1y^[0,1]x1

我们将尝试将短语“线性分类器在要素和类之间不共享参数”分解为两部分。我们将分别检查多个功能和多个类的情况,以查看逻辑回归是否共享任何任务的参数:

线性分类器是否在要素之间共享参数?

在这种情况下,对于每个示例,是采用二进制值的标量(如之前),而是长度为的向量(其中是特征数)。在此,输出是输入特征的线性组合(即这些特征加上偏差的加权总和)。XyxNNN

X 瓦特 Ñ X瓦特瓦特X

y^=σ(iN(wixi)+b)orσ(wx+b)
其中和是长度向量。乘积产生标量。从上面可以看到,每个输入要素都有一个单独的权重,并且这些权重是绝对独立的。由此可以得出结论,特征之间没有参数共享xwNxw wixi

线性分类器在类之间共享参数吗?

在这种情况下,是标量,但是是长度为的向量(其中是类别数)。为了解决这个问题,逻辑回归本质上为类别中的每个类别产生了单独的输出。每个输出都是标量并且对应于属于类的概率。ÿ 中号中号ý Ĵ中号ÿ Ĵ[ 0 1 ] X ĴxyMMyjMyj[0,1]xj

y^=wx+b,wherey^=y^1,y^2,...,yM

最简单的方法是将简单的独立 logistic回归输出为:M

y^j=σ(wjx+bj)

从以上内容可以明显看出,不同类别之间没有共享权重

多功能和多类

通过结合以上两种情况,我们最终可以得出具有多个功能和多个类的最普通的情况:

ÿ

y^=σ(Wx+b)
其中是一个大小为的向量,是一个大小为的向量,是大小的矢量和是大小的矩阵。y^X Ñ b中号w ^ Ñ × 中号MxNbMW(N×M)

无论如何,线性分类器在要素或类之间不共享任何参数

为了回答您的第二个问题,线性分类器确实有一个基本的假设,即功能需要独立,但这不是本文作者打算说的。


1
很好的解释。:)
joydeep bhattacharjee
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.