Questions tagged «image-recognition»


3
用Python提取图像特征
在我的课堂上,我必须使用两个分类器创建一个应用程序,以确定图像中的对象是多孔菌(seasponge)的示例还是其他一些对象。 但是,当我涉及python中的特征提取技术时,我完全迷失了。我的顾问说服我使用课堂上没有讲到的图像。 谁能指导我寻找有意义的文档或阅读或提出建议的方法?

5
卷积神经网络过度拟合。辍学没有帮助
我在玩卷积网络。具体来说,我使用的是kaggle cats-vs-dogs数据集,该数据集包含25000张标记为猫或狗的图像(每张图像12500张)。 我设法在测试集上实现了约85%的分类精度,但是我设定了达到90%的精度的目标。 我的主要问题是过度拟合。它总是以某种方式最终发生(通常在第8-10阶段之后)。我的网络体系结构受到VGG-16的大致启发,更具体地说,我的图像被调整为128x128x3128x128x3128x128x3,然后运行: Convolution 1 128x128x32 (kernel size is 3, strides is 1) Convolution 2 128x128x32 (kernel size is 3, strides is 1) Max pool 1 64x64x32 (kernel size is 2, strides is 2) Convolution 3 64x64x64 (kernel size is 3, strides is 1) Convolution 4 64x64x64 (kernel size …

3
CNN的图像大小调整和填充
我想训练CNN进行图像识别。用于训练的图像尺寸不固定。例如,我希望CNN的输入大小为50x100(高x宽)。当我将一些较小尺寸的图像(例如32x32)调整为输入尺寸时,图像的内容在水平方向上拉伸得太多,但是对于某些中等尺寸的图像而言,它看起来还不错。 在避免内容被破坏的同时调整图像大小的正确方法是什么? (我正在考虑将图像的大小调整到一定程度并保持宽度和高度的比率后,将图像以0s填充为完整大小。这种方法可以吗?)

1
深度学习中出现正方形图像的原因
大多数高级深度学习模型(例如VGG,ResNet等)都需要正方形图像作为输入,通常像素大小为224 x 224224X224224x224。 输入的形状必须相等是有原因的,还是可以建立一个100 x 200100X200100x200的convnet模型(例如,如果要进行面部识别并且有人像图像)? 更大的像素尺寸(例如512 x 512512X512512x512是否会增加收益?


5
机器学习中的维度跳跃
机器学习中的维数跳变问题是什么(在卷积神经网络和图像识别中发生)?我已经在谷歌上搜索了,但是我所得到的只是关于材料形状变形物理的信息。如果有人通过与机器学习有关的示例对它进行解释,这对我会更有帮助。任何人都可以帮我解决这个问题或向我指出可以使用的资源吗?
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.