Questions tagged «image-processing»

与数字图像处理有关的任何事物,即用于从数字图像中提取或操纵信息的理论和技术。


11
人脸识别库[关闭]
关闭。此问题不符合堆栈溢出准则。它当前不接受答案。 想改善这个问题吗?更新问题,使其成为Stack Overflow 的主题。 6年前关闭。 改善这个问题 我正在为大学项目寻找免费的人脸识别库。我不想要人脸检测。我正在寻找真正的认可。这意味着查找包含指定面部或计算特定面部之间距离的库的图像。 我目前正在使用OpenCV来检测人脸,并使用粗略的Eigenface算法进行识别。但是我认为应该有比自写的Eigenface算法更好的性能。我并不是说速度就是性能,而是在寻找一种比简单的Eigenface方法效果更好的库。 我看了一下Faint,但看来该库对于我自己的应用程序不是很可重用。 我对Python,Java,C ++,C之类的库感到满意。最好的办法是,它是否可以在Windows机器上运行,因为目前我依赖于某些仅用于Windows的外部代码。

7
使用node.js下载图像
已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 2年前关闭。 改善这个问题 我正在尝试编写一个脚本来使用node.js下载图像。这是我到目前为止的内容: var maxLength = 10 // 10mb var download = function(uri, callback) { http.request(uri) .on('response', function(res) { if (res.headers['content-length'] > maxLength*1024*1024) { callback(new Error('Image too large.')) } else if (!~[200, 304].indexOf(res.statusCode)) { callback(new Error('Received an invalid status code.')) } else if (!res.headers['content-type'].match(/image/)) { callback(new Error('Not an …

5
如何使用OpenCV2.0和Python2.6调整图像大小
我想使用OpenCV2.0和Python2.6显示调整大小的图像。我在http://opencv.willowgarage.com/documentation/python/cookbook.html上使用并采用了该示例,但是不幸的是,该代码是针对OpenCV2.1的,并且似乎不适用于2.0。这是我的代码: import os, glob import cv ulpath = "exampleshq/" for infile in glob.glob( os.path.join(ulpath, "*.jpg") ): im = cv.LoadImage(infile) thumbnail = cv.CreateMat(im.rows/10, im.cols/10, cv.CV_8UC3) cv.Resize(im, thumbnail) cv.NamedWindow(infile) cv.ShowImage(infile, thumbnail) cv.WaitKey(0) cv.DestroyWindow(name) 由于我不能使用 cv.LoadImageM 我用了 cv.LoadImage 而是在其他应用程序中没有问题。但是,cv.iplimage没有属性行,列或大小。谁能给我一个提示,如何解决这个问题?谢谢。

9
比较两个图像的算法
给定两个不同的图像文件(以我选择的任何格式),我需要编写一个程序来预测如果一个文件是另一个文件的非法复制的机会。副本的作者可能会做诸如旋转,制作负片或添加琐碎细节(以及更改图像尺寸)之类的事情。 您知道执行这种工作的算法吗?


9
提取文本OpenCV
我试图在图像中找到文本的边界框,并且目前正在使用这种方法: // calculate the local variances of the grayscale image Mat t_mean, t_mean_2; Mat grayF; outImg_gray.convertTo(grayF, CV_32F); int winSize = 35; blur(grayF, t_mean, cv::Size(winSize,winSize)); blur(grayF.mul(grayF), t_mean_2, cv::Size(winSize,winSize)); Mat varMat = t_mean_2 - t_mean.mul(t_mean); varMat.convertTo(varMat, CV_8U); // threshold the high variance regions Mat varMatRegions = varMat > 100; 当给出这样的图像时: 然后当我显示varMatRegions我得到此图像: 如您所见,它在某种程度上将文本的左侧部分与卡的标题结合在一起,对于大多数卡而言,此方法效果很好,但在繁忙的卡上会引起问题。 …

13
图像处理以提高tesseract OCR精度
我一直在使用tesseract将文档转换为文本。文档的质量千差万别,我正在寻找有关哪种图像处理可以改善结果的提示。我注意到,像素化程度很高的文本(例如,由传真机生成的文本)对于tesseract来说尤其难以处理-大概字符的所有那些锯齿状边缘都会混淆形状识别算法。 哪种图像处理技术可以提高准确性?我一直在使用高斯模糊对像素化的图像进行平滑处理,并且看到了一些小的改进,但是我希望有一种更具体的技术可以产生更好的结果。说一个调整为黑白图像的滤镜,它将平滑不规则的边缘,然后说一个滤镜,它将增加对比度以使字符更加清晰。 对图像处理新手有何一般提示?

14
高质量图像缩放库
关闭。此问题不符合堆栈溢出准则。它当前不接受答案。 想改善这个问题吗?更新问题,使其成为Stack Overflow 的主题。 5年前关闭。 改善这个问题 我想在C#中以与Photoshop一样好的质量缩放图像。是否有任何C#图像处理库可用于执行此操作?

9
将base 64字符串转换为图像并保存
这是我的代码: protected void SaveMyImage_Click(object sender, EventArgs e) { string imageUrl = Hidden1.Value; string saveLocation = Server.MapPath("~/PictureUploads/whatever2.png") ; HttpWebRequest imageRequest = (HttpWebRequest)WebRequest.Create(imageUrl); WebResponse imageResponse = imageRequest.GetResponse(); Stream responseStream = imageResponse.GetResponseStream(); using (BinaryReader br = new BinaryReader(responseStream)) { imageBytes = br.ReadBytes(500000); br.Close(); } responseStream.Close(); imageResponse.Close(); FileStream fs = new FileStream(saveLocation, FileMode.Create); BinaryWriter …

8
将RGB转换为灰度/强度
从RGB转换为灰度时,据说应该对通道R,G和B应用特定的权重。这些权重是:0.2989、0.5870、0.1140。 据说其原因是人类对这三种颜色的感知/敏感性不同。有时也有人说这些是用于计算NTSC信号的值。 但是,我在网上找不到很好的参考资料。这些值的来源是什么? 另请参阅以下先前的问题:在这里和这里。




3
如何分类我的爪子?
在我之前的问题中,我得到了一个很好的答案,可以帮助我检测出爪子在哪里压板,但是现在我很难将这些结果与相应的爪子联系起来: 我手动注释了爪子(RF =右前,RH =右后,LF =左前,LH =左后)。 正如您所看到的,显然有一个重复的模式,并且几乎在所有测量中都会返回。这是指向6条手动注释的试验的演示文稿的链接。 我最初的想法是使用启发式进行排序,例如: 前爪和后爪之间的负重比约为60-40%; 后爪的表面通常较小。 爪子(通常)在空间上分为左右两半。 但是,我对我的启发式方法有些怀疑,因为一旦遇到我从未想到的变化,它们就会对我失败。他们也将无法应付la狗的测量,la狗可能有自己的规则。 此外,乔建议的注释有时会弄乱,并且没有考虑到爪子的实际外观。 基于我对爪子内峰值检测问题的回答,我希望有更多高级解决方案可以对爪子进行分类。特别是因为每个单独的爪子的压力分布及其进程都不同,几乎就像指纹一样。我希望有一种方法可以用它来对我的爪子进行聚类,而不仅仅是按照发生的顺序对其进行排序。 因此,我正在寻找一种更好的方法来对结果和相应的爪进行排序。 对于要应对挑战的任何人,我都腌制了一个词典,其中包含所有包含每个爪的压力数据的切片切片(通过测量捆绑)以及描述其位置(切片在板上和时间上)的切片。 澄清一下:walk_sliced_data是一个字典,其中包含['ser_3','ser_2','sel_1','sel_2','ser_1','sel_3'],这是测量的名称。每个度量都包含另一个字典[0、1、2、3、4、5、6、7、8、9、10](来自“ sel_1”的示例),代表提取的影响。 还要注意,可以忽略“假”影响,例如对脚掌进行部分测量(在空间或时间上)。它们仅是有用的,因为它们可以帮助识别模式,但不会进行分析。 对于感兴趣的任何人,我都会保留一个博客,其中包含有关该项目的所有更新!

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.