如何根据图像分辨率计算特征数量?


18

只是覆盖安德鲁Ng的神经网络在建筑物的非线性假说,我们必须确定选择题的特点数为分辨率的图像100×100grescale强度。

答案是5000万, x5107

但是,对于50 x 50像素的灰度图像,更早一些。功能数量为50x50(2500)

为什么是 x而不是?510710,000

但是,他确实表示将所有二次项()都包含为特征xixj

假设您正在学习从100×100像素图像(灰度而不是RGB)识别汽车。令特征为像素强度值。如果您将所有二次项()作为特征训练逻辑回归,那么您将拥有多少个特征?xixj

在有关100x100的较早幻灯片中,二次特征( x)= 3百万个特征,但我仍然无法。xixj

Answers:


16

也许一个简单的案例会使事情变得更清楚。假设我们选择的像素为1x2而不是100x100。

图像中的像素样本

+----+----+
| x1 | x2 |
+----+----+

想象一下在绘制训练集时,我们注意到它很难通过线性模型分离,因此我们选择添加多项式项以更好地拟合数据。

假设我们决定通过包含所有像素强度以及可以由此形成的所有可能倍数来构造多项式。

由于我们的矩阵很小,因此我们来枚举它们:

x1, x2, x12, x22, x1×x2, x2×x1

解释上述特征序列可以看到存在一个模式。前两个术语(第1组)是仅由其像素强度组成的特征。此后的以下两个术语,第2组,是由其强度的平方组成的特征。最后两项,第3组,是成对(两个)像素强度的所有组合的乘积。

组1:x1, x2

组2:x12, x22

群组3:x1×x2, x2×x1

但是,等等,这是一个问题。如果您查看序列中的第3组项(和),您会发现它们是相等的。记住我们的住房示例。想象一下,对于同一个房子,有两个特征x1 =平方英尺,x2 =平方英尺……这没有任何意义!好的,所以我们需要摆脱重复功能,让我们任意说。现在,我们可以将第三个组的功能列表重写为:x 2 × x 1 x 2 × x 1x1×x2x2×x1x2×x1

群组3:x1×x2

我们计算所有三个组中的特征,得到5。

但这是一个玩具例子。让我们推导出用于计算特征数量的通用公式。让我们以原始的功能组为起点。

s一世žËG[RØüp1个+s一世žËG[RØüp2+s一世žËG[RØüp3=×ñ+×ñ+×ñ=3××ñ

啊! 但是我们必须摆脱第3组中的重复产品。

因此,要正确计算组3的特征,我们将需要一种方法来计算矩阵中所有唯一的成对乘积。可以用二项式系数完成,这是一种从大小相等或更大的n个组中计算k个所有可能的唯一子组的方法。因此,要正确计算组3中的特征,请计算。C×ñ2

因此我们的通用公式为:

×ñ+×ñ+C×ñ2=2×ñ+C×ñ2

让我们用它来计算玩具示例中的特征数量:

2×1个×2+C1个×22=4+1个=5

而已!


2
希望在讲课中给出这个解释!
伊恩·沃克-史柏

我想知道我们如何在课程中不加解释地了解这一点
Mohammed Noureldin

6

如果使用所有线性和二次特征,则总数应为:

100*100 + 100*100 + C(100*100,2) = 50015000
10000   + 10000   + 49995000     = 50015000
xi         xi^2       xixj

1
您能否进一步解释一下?您是说xi + xi ^ 2 + xixi吗?xi = 100,xj = 100?为什么xi和xi ^ 2都为100 * 100?什么是C(100 * 100,2)?
Iancovici 2013年

4
(1)总共有100 * 100个像素,如果使用强度作为特征,则总共有100 * 100个特征,即xi;(ii)您还可以使用功率密度作为特征,即(xi,xi)或xi。^ 2,总计仍为100 * 100;最后(三)如果你使用两个像素之间的相关性,将有总共C像素对,那是(XI,XJ),C是数学组合(mathworld.wolfram.com/Combination.html
lennon310

谢谢,最后一个问题是为什么在这种情况下xi = xi ^ 2?
Iancovici

我使用xi表示单个像素,而xi ^ 2表示使用相同像素对(xi,xi)的对。单个像素的数量与相同像素对的数量相同。它与像素强度无关。对困惑感到抱歉。
lennon310

几年后,同样的问题。我们是否不应该考虑可能的强度值(从0到255)?
albus_c


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.