Questions tagged «computer-vision»

计算机视觉包括处理,分析,图像和高维数据以形成对场景或图像的高级理解和识别的方法。

2
用于视觉跟踪和平面标记的分步相机姿势估计
我从事增强现实和视觉跟踪应用程序的相机姿态估计这一主题已有一段时间了,我认为尽管有很多关于此任务的详细信息,但仍然存在很多困惑和误解。 我认为接下来的问题值得详细的逐步解答。 什么是相机内在特性? 什么是相机外部性? 如何从平面标记计算单应性? 如果我有单应性,该如何获得相机姿势?

3
级联双二阶部分以实现高阶滤波器的工作原理?
我正在尝试实现8阶IIR滤波器,并且我阅读的每个应用笔记和教科书都说,最好将2阶以上的任何滤波器实现为二阶部分。我tf2sos在MATLAB中使用了二阶部分的系数,这与我预期的4个二阶部分的6x4系数有关。在实施为SOS之前,八阶滤波器需要存储7个先前的采样值(以及输出值)。现在,当实现为二阶部分时,流程如何从输入到输出工作,我是否仅需要存储2个先前的样本值?还是第一个滤波器的输出馈x_in入第二个滤波器,依此类推?
20 filters  filter-design  infinite-impulse-response  biquad  audio  image-processing  distance-metrics  algorithms  interpolation  audio  hardware  performance  sampling  computer-vision  dsp-core  music  frequency-spectrum  matlab  power-spectral-density  filter-design  ica  source-separation  fourier-transform  fourier-transform  sampling  bandpass  audio  algorithms  edge-detection  filters  computer-vision  stereo-vision  filters  finite-impulse-response  infinite-impulse-response  image-processing  blur  impulse-response  state-space  linear-systems  dft  floating-point  software-implementation  oscillator  matched-filter  digital-communications  digital-communications  deconvolution  continuous-signals  discrete-signals  transfer-function  image-processing  computer-vision  3d 

5
如何比较相机拍摄的两张图片并判断是否有足够的差异来检测运动?
我想将手机用作CCTV系统来控制房屋中的房间,并在有东西移动时显示警报。 现在,我成功完成的工作是每分钟抓一张图片,并通过PHP脚本将其上传到我的服务器。现在,我想比较当前图片和1分钟前的图片,并检测是否有人进入了房间。因此,基本上,我需要比较图片上像素的差异(但还要考虑到云可能只是打个招呼并在一分钟内改变了亮度) 有谁知道如何实现这一目标或阅读一些文档吗?

2
调整图像大小如何影响固有相机矩阵?
我有一个相机矩阵(我知道内在参数和外在参数),其尺寸为HxW。(我将此矩阵用于所需的一些计算)。 我想使用较小的图像,例如:H2×W2H2×W2\frac{H}{2}\times \frac{W}{2}(原件的一半)。为了保持相同的关系,我需要对矩阵进行哪些更改? 我有KKK作为内在参数,(RRR,TTT旋转和平移) cam=K⋅[RT]cam=K⋅[RT]\text{cam} = K \cdot [R T] K=⎛⎝⎜ax000ay0u0v01⎞⎠⎟K=(ax0u00ayv0001)K = \left( \begin{array}&a_x &0 &u_0\\0 &a_y &v_0 \\ 0 &0 &1\end{array} \right) KKK为3 * 3,我想乘上axaxa_x,ayaya_y,u0u0u_0和v0v0v_0 0.5(图像大小被调整的因素),但我不知道。


4
卡尔曼滤波器跟踪的直观解释
对于使用卡尔曼滤波器的(视觉)跟踪的直观解释,我将不胜感激。我知道的: 预测步骤: 动态系统状态:时间目标位置XŤXŤ\mathbf x_tŤŤt 度量:时间索引为(??)的图像žŤžŤ\mathbf z_tŤŤt 基于图像/测量我想预测状态吗?(使用动态方程式)正确吗?1 → (t − 1 )1个→(Ť-1个)1\rightarrow(t-1)XŤXŤ\mathbf x_t 如何将校正步骤解释为这些术语(图像,目标位置)?


2
对于这种特定的移位/比例不变模板匹配,哪种图像处理技术是理想的?
我最初在这里讨论的问题已经演变,并且在我研究更多并获得新信息后可能会变得更简单。 最重要的是,我希望能够使用计算机视觉/图像处理技术来检测此处显示的这种模式。如您所见,理想的模式由四个“ ping”组成。对象识别应该是: 移位不变 在水平方向上,图像将是周期性的。(即,向右推动,在左侧出现,反之亦然)。 (幸运的是)从纵向看,它不是周期性的。(即,推到顶部或底部,它将停止)。 比例尺不变(如您所见,ping的“厚度”可能有所不同。) 我可以继续进行下去,但是我已经附上了涵盖我意思的图像,请参见以下内容: 当然,从这个家庭可以看出,它们也可以处于不同的“规模”: 最后,这是一些我可能实际收到的“现实”场景,可能会有噪音,当您移到底部时,行可能会“褪色”,当然,图像上会有很多虚假的线条,伪像等 当然,作为最后的结局,这种“极端”场景很有可能出现: 因此,我想再次寻求一些指导,以指导我在这里应该使用哪些计算机机器视觉技术,以便获得最佳效果。 检测出图案的出现情况,如您所见,在这里我需要进行平移和缩放不变,并且在实际情况下也能获得不错的结果。(好消息是,我不需要它是旋转不变的)。到目前为止,我唯一能想到的想法就是二维关联。 我要补充一点,实际上,我没有彩色图像-我只会得到一个数字的数字,所以我想我们所说的是“灰度”。 提前致谢! PS对于它的价值,我可能会使用开放式CV。 编辑#1: 根据评论,我在此处添加了您要求的详细信息: 对于定义数据的特征,我们可以假设以下内容: 每个ping的水平长度可以变化,但是我知道它的上限和下限。在此范围内的任何事物为是,在外部事物为否。(例如,我知道ping的长度可以在1到3秒之间的任何位置)。 所有ping必须为“可见”(是),但是,最后一行可能会丢失,并且仍然要说“是”。否则否。 每个ping的垂直长度(“厚度”)可以变化,但同样,也要知道上下边界。(类似于您在这些图像中看到的内容)。在该范围内的任何事情都为是。外面没有东西。 如果是,则每个ping之间的高度应始终相同。如果不是,则为否。(例如,您可以看到所有ping相对于彼此的高度如何,在垂直轴上约为110)。因此110 +/- 5可以为是,其他任何条件都必须为否。 我想就是这样-但是,请让我知道我还能添加什么...(此外,此处显示的所有内容都应注册为YES,顺便说一句)。

3
轮廓匹配-查找轮廓位移
我在具有相同对象的两幅图像上找到了轮廓,我想找到该对象的位移和旋转。我尝试过使用该轮廓的旋转边界框,然后使用其角度和中心点,但是边界框的旋转不能正确显示轮廓旋转,因为角度a + 0,a + 90,a + 180等相同。度。还有其他寻找轮廓旋转和位移的好方法吗?也许有些使用凸包,凸缺陷?我已经在学习OpenCv中阅读过有关匹配轮廓的信息,但并没有帮助。有人可以举例吗? 例子: 我想检测例如粉红色的正方形,在第二种情况下使用笔。其他示例可能是带有一些孔,星星等的正方形。正如我所说,我想做一些全盘的事情。感谢任何建议,因为我想测试尽可能多的方法。

5
比例尺和旋转不变特征描述符
您是否可以列出一些比例和旋转不变特征描述符以用于特征检测。 该应用程序使用多分类器来检测无人机捕获的视频中的汽车和人。 到目前为止,我一直在研究SIFT和MSER(仿射不变)。我也看过LESH,LESH是基于局部能量模型的,但是其计算方式不是旋转不变的,我一直在尝试思考一种利用局部能量的方法来构建旋转不变的方法功能描述符,我在这里读到有哪些可以在商业应用中使用的SIFT / SURF的免费替代品?,即“如果您将方向分配给兴趣点并相应地旋转图像块,则可以免费获得旋转不变性”,但是不知道这是否可以缓解或我如何将其应用于我的问题,任何帮助都将是感谢,谢谢

4
上面的人检测
我试图找到一种方法,仅使用距离地面3米的一台摄像机来检测人员。这是相机返回的帧: 更新:视频测试-> http://dl.dropbox.com/u/5576334/top_head_shadow.avi 为了做到这一点,首先我了解我必须执行背景-前景分割。那是容易的部分。 使用前景蒙版,我可以进行简单的操作(例如霍夫变换)来查找圆,但是这种方式只能检测出60%的头部,包括许多误报。 我可以使用其他一些简单的技术,例如颜色分割,但是我发现人头与上面的人非常不同,因为他们的发型,颜色,头发数量,... 尽管我还有其他选择,可以使用HOG描述符或类似Haar的功能,但是我需要一个从上面看到的人的广泛数据库来训练模型。我还没有找到类似的东西。 我以为这将是一个经常发生的问题,但是我在文学或互联网上找不到很多。解决此任务的任何帮助将不胜感激:-) 更新:有关更多信息,目标是实施一些通用方法来进行行人流量跟踪。第一个原型将在购物中心进行测试。

1
通过SVD / PCA计算拟合新图像
我正在尝试从Wikipedia 的Eigenface页面复制想法。从数据矩阵表示的一百个样本图像XX\bf X(每个图像展平为长度为的向量nnn,因此XX\bf X为100100100 x nnn矩阵)中,我计算了SVD分解: X=UΣVTX=UΣVT\begin{equation} \bf X = U \Sigma V^{T} \end{equation} 因此: XXT=UΣ2UTXXT=UΣ2UT\begin{equation} \bf X X^{T} = U \Sigma^2 U^{T} \end{equation} 通过取最大的子集qqq本征模,我可以近似矩阵(让σ1≥σ2≥⋯σ1≥σ2≥⋯\sigma_1 \ge \sigma_2 \ge \cdots): X≈σ1u1vT1+σ2u2vT2+⋯+σquqvTqX≈σ1u1v1T+σ2u2v2T+⋯+σquqvqT\begin{equation} {\bf X} \approx \sigma_1 u_1 v_1^{T} + \sigma_2 u_2 v_2^{T} + \cdots + \sigma_q u_q v_q^{T} \end{equation} 现在给定一个新的向量yyy,该向量表示不在的图像XX\bf X,我如何确定qqq特征向量的权重UU\bf U以最好地表示我的新图像yyy?除病理情况外,此表示是否唯一? …


2
是否有任何好的开源(免费的)手写OCR程序?
标题问了一切。我面前有一个我不太热心的数据输入任务:50-100页的手写注销/登录日志。 日志的格式可能会有所帮助。页面被划分为清晰划定的行和列(13r x 6c,带有额外的标题行)。进一步帮助我解决的是三列与日期/时间相关(日期,超时,进入时间)。而且,或多或少地枚举了两个列(资源和名称)中的数据,因此,例如,名称“ Smith”可能一次又一次地出现在名称列中,每次都具有相同的笔迹。最后一栏“ Notes”是自由格式,但是如果我可以自动完成前6列,则我不介意手动输入Notes。 有什么建议么?(除了“开始输入”。) PS:如果有一个更好的SE网站可以询问这个问题,请告诉我,我会在那里询问。

2
为什么高斯尺度空间尺度的差异不变?
我将在此处使用比例不变特征变换算法作为示例。SIFT基于图像的比例高斯滤波创建比例空间,然后计算高斯差以检测潜在的兴趣点。这些点定义为跨越高斯分布的局部最小值和最大值。 据称这种方法是尺度不变的(除了其他令人困惑的不变性)。为什么是这样?我不清楚为什么会这样。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.