深度神经网络-仅用于图像分类?


14

我使用深度信念或卷积神经网络发现的所有示例都将它们用于图像分类,聊天者检测或语音识别。

对于没有结构化特征(例如,未按顺序或网格排列)的经典regresion任务,深度神经网络是否也有用?如果是,您可以举个例子吗?


3
您的第一句话提到了卷积神经网络。看来您是在将他们与深层的信念网络相混淆。尽管它们都是神经网络的形式,但它们并不相同。
MSalters 2015年

1
我会同意@msalters的观点,但会说深度信念网络是真正的深度网络,并且取得的成功有限,而卷积网络更像是在卷积层中紧随其后的nn的混合自适应图像滤波器s。
seanv507

您将“观测”设为“未结构化(未按顺序或网格排列)”是什么意思?在单个像素排列在网格上的意义上,您是否指的是“结构化”的图像?但是,然后是“结构化”的功能,而不是“观测”的功能(那些是单独的图像)?
变形虫说莫妮卡(

我想说所有的卷积网络都是深层的,并非所有的深层网络都是卷积的,类似地,所有的深层信念网络都是深层的,并非所有的深层网络都是深层的信念网络。确实,您可以拥有既不深又不卷积的深层网络,它们往往很难训练。当然,对术语的讨论毫无争议。
Lyndon White

您不能将卷积网络应用于非结构化(非序列/网格等)数据。基本上没有意义。卷积网络与对输入进行傅立叶变换密切相关,例如用于将其从时域转换为频域的序列。
Lyndon White

Answers:


8

图像的特征使其可以通过深度神经网络进行分类,其中包含大量功能(可能具有数百万个(如果不是数十亿个像素,则具有RGB,强度等),并且如果您具有准确的标签,则它不是嘈杂的数据。这些天的相机非常好,它们不会误测量任何东西。多亏了互联网,我们现在有了很多带有正确标签的图像。深度网络可以表达任意复杂的功能,这是嘈杂数据的问题,因为您很容易过度拟合噪声,因此为什么许多学习方法倾向于对复杂模型进行惩罚。但是,在图像识别的情况下,真正的功能实际上实际上非常复杂,我们不知道功能形式是什么样,甚至在很多情况下我们也不知道相关功能是什么。

这并不意味着您不能使用深层网络来学习与图像无关的功能。您只需要非常注意缺点,主要是它很容易过度拟合,而且它的计算量很大并且需要花费很长的时间来训练(如今,对于并行化的SGD和GPU而言,这已不再是一个问题)。另一个缺点是您几乎没有模型可解释性,这对于图像分类而言并不重要。我们只是想让计算机识别黑猩猩和猩猩之间的区别。人类对公式的理解并不重要。对于其他领域,尤其是医学诊断,政策研究等,您需要甚至可能需要人类的理解。


5

当然,除了图像或语音识别之外,您还可以使用深度神经网络解决许多问题。问题是您是否真的需要它。

深度神经网络比简单的MLP强大得多,但是它们也占用更多资源,并且更难以开发。因此,它们被用于非常复杂的领域。您可以使用它们来解决较简单的问题,但通常较简单的模型也可以获得良好的结果。

使用深度神经网络解决简单的问题就像用火箭筒杀死苍蝇一样,确定会杀死它们,但是找不到更简单的方法了吗?


2
这不是一个答案。什么容易,什么难?预测股票市场/从有限的例子中推算/ ......有很多困难的问题对所有人都有好处吗?
seanv507

我没有说过深度神经网络可以解决任何问题。我的意思是,它们用于您拥有大量条目的复杂域中。我知道他们不能解决所有问题,但这不是这个问题的重点。关键是要强调它们可以应用于除图像/语音识别之外的其他问题,但是在可以应用其他模型的情况下,它们还有一些缺点值得考虑。
davidivad

5

我同意大卫的回答。但是我也认为深度神经网络在图像上的应用是收集图像(更重要的是标记图像)相对便宜。在其他领域,大规模收集数据可能非常昂贵,尤其是在典型的工业或政府企业的约束下。使这个问题复杂化的是,在许多应用程序中,感兴趣的现象相对罕见,因此几乎没有什么值得借鉴的例子,因此,即使是相对大规模的数据收集工作也可能会产生少量的此类成员。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.