Questions tagged «computer-vision»

计算机视觉是计算机科学的一个子领域,致力于分析和理解图像。这包括检测诸如图像中的面部或分割图像之类的对象。

2
如何为PASCAL VOC挑战计算检测任务的mAP?
如何为Pascal VOC排行榜的检测任务计算mAP(平均平均精度)?http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 那里说-在第11页:http : //homepages.inf.ed.ac.uk/ckiw/postscript/ijcv_voc09.pdf 平均精度(AP)。对于VOC2007挑战,使用插值平均精度(Salton和Mcgill 1986)来评估分类和检测。对于给定的任务和类别,从方法的排序输出中计算出精度/召回曲线。召回率定义为排名高于给定等级的所有阳性示例的比例。精确度是高于该等级的所有示例中来自肯定类别的比例。AP汇总了精度/召回曲线的形状,并定义为一组11个等距召回级别[0,0.1,...,1]的平均精度: AP = 1/11 ∑ r∈{0,0.1,...,1} pinterp(r) 通过采用针对相应召回率超过r:的方法测得的最大精度来内插每个召回级别r的精度pinterp(r) = max p(r˜),其中p(r〜)是在召回〜r时测得的精度 有关地图:http://0agr.ru/wiki/index.php/Precision_and_Recall#Average_Precision 这是否意味着: 我们计算精度和召回率: A)对于许多不同的值,IoU > {0, 0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9, 1}我们计算真/假正/负值 其中True positive = Number_of_detection with IoU > {0, 0.1,..., 1},这里说:/datascience//a/16813/37736然后我们计算: Precision = True positive / (True positive …


3
符号mAP @ [。5:.95]是什么意思?
为了进行检测,确定一个对象提议是否正确的一种常见方法是“ 联合路口”(IoU,IU)。这将采用建议的目标像素的集合和真实目标像素的集合B并计算:AAABBB IoU(A,B)=A∩BA∪BIoU(A,B)=A∩BA∪BIoU(A, B) = \frac{A \cap B}{A \cup B} 通常,IoU> 0.5表示这是命中,否则是失败。对于每个类别,可以计算出 真实肯定():针对c类提出了一个建议,实际上有一个c类对象TP(c)TP(c)TP(c)cccccc 误报():针对c类提出了一个建议,但没有c类的对象FP(c)FP(c)FP(c)cccccc 平均精密类:#牛逼P (C ^ )ccc#TP(c)#TP(c)+#FP(c)#TP(c)#TP(c)+#FP(c)\frac{\#TP(c)}{\#TP(c) + \#FP(c)} mAP(平均平均精度)= 1个| ç升一个小号小号Ë小号 |∑Ç ∈ Ç 升一个小号小号ë 小号#ŤP(c )#ŤP(c )+ #FP(c )1|classes|∑c∈classes#TP(c)#TP(c)+#FP(c)\frac{1}{|classes|}\sum_{c \in classes} \frac{\#TP(c)}{\#TP(c) + \#FP(c)} 如果有人想要更好的建议,则可以将IoU从0.5增加到更高的值(最理想的是增加到1.0)。一个可以与地图@ p,其中表示这个是IOU。p ∈ (0 ,1 )p∈(0,1)p \in (0, 1) 但是mAP@[.5:.95](如本文所述)是什么意思?

3
为什么卷积总是使用奇数作为filter_size
如果我们看一下使用CNN(ConvNet)发表的论文中有90-99%。他们中的绝大多数使用奇数号的过滤器大小:{1、3、5、7}最常用。 这种情况可能会导致一些问题:使用这些滤波器大小时,通常在填充为2(普通填充)的情况下卷积运算并不完美,并且在此过程中会丢失input_field的某些边缘... 问题1:为什么仅对卷积滤波器大小使用奇数? Question2:在卷积过程中忽略一小部分input_field实际上是一个问题吗?为什么这样/不呢?

3
是否有适用于python的好的即用型语言模型?
我正在为一个应用程序制作原型,我需要一个语言模型来计算一些生成的句子的困惑度。 我可以随时使用经过训练的python语言模型吗?简单的东西 model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 < p2 我看过一些框架,但找不到我想要的。我知道我可以使用类似: from nltk.model.ngram import NgramModel lm = NgramModel(3, brown.words(categories='news')) 这在Brown Corpus上使用了很好的图林概率分布,但是我正在一些大型数据集(例如1b单词数据集)上寻找精心设计的模型。我可以真正相信一般领域的结果(不仅是新闻)
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 


5
无监督图像分割
我正在尝试实现一种算法,其中给定一个在平面表上具有多个对象的图像,期望的是每个对象的分割蒙版的输出。与CNN不同,这里的目标是在陌生的环境中检测物体。解决此问题的最佳方法是什么?另外,在线上有任何实施示例吗? 编辑:很抱歉,问题可能有点误导。我所说的“陌生环境”的意思是算法可能不知道对象。该算法不需要了解对象是什么,而应该仅检测对象。我应该如何解决这个问题?

2
如何检测图像是否被照相购物?
我想检查JPG文件是否被操纵来更改内容。 我认为不是photoshop的: 播种 旋转中 (缩放) 影像解析度 智能手机可能会自动进行更改 我考虑的photoshopping: 在旧图像的顶部添加新图像 更改图像一部分的文本 如何自动检查? (并且:是否有现成的库?)

1
卷积层的参数数量
在这篇被高度引用的论文中,作者对权重参数的数量进行了以下讨论。我不太清楚为什么它具有参数。我认为应该是因为每个输入通道共享同一个滤波器,该滤波器具有参数。49 ℃249C249C^249℃49C49CCCC494949

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.