Questions tagged «image-processing»

信号处理的一种形式,其中输入是图像。通常将数字图像视为二维信号(或多维信号)。该处理可以包括图像恢复和增强(特别是图案识别和投影)。

1
瓶颈层在神经网络中意味着什么?
我正在阅读FaceNet论文,在导言的第3段中说: 基于深度网络的先前的面部识别方法使用在一组已知面部身份上训练的分类层,然后采用中间瓶颈层作为表示,用于对训练中使用的一组身份以外的识别进行概括。 我想知道中间瓶颈层是什么意思?

1
如何自动将U-Matrix聚类?
训练完自组织图后,可以计算U-Matrix。有一些工具可以手动对其进行可视化并识别集群,但是我想知道是否有任何算法可以自动执行此过程(即,无需人工观察图形即可识别集群)。 有什么办法吗?我正在用R编写代码。在Internet上找不到任何类似的东西,因此也许有人可以在这里为我提供帮助。

2
检测点云数据中的圆形图案
对于我正在研究的一些体积重建算法,我需要检测3d点数据中的任意数量的圆形图案(来自LIDAR设备)。这些图案可以在空间中任意定向,并且可以假定(尽管不是很完美)位于薄的2d平面中。这是在同一平面上有两个圆的示例(尽管请记住,这是一个3d空间): 我尝试了许多方法。.最简单的方法(但到目前为止效果最好的方法)是基于最近邻图的不相交集进行聚类。当模式相距较远时,这可以很好地工作,但对于示例中的彼此非常靠近的圆圈,效果则较小。 我尝试了K-means,但效果不佳:我怀疑圆点排列可能不太适合。另外,我还有另一个问题,就是事先不知道K的值。 根据最近邻图中的循环检测,我尝试了更复杂的方法,但是我得到的结果太脆弱或计算量太大。 我还阅读了很多相关主题(霍夫变换等),但似乎没有什么东西可以在这种特定情况下完美地适用。任何想法或灵感将不胜感激。

3
语义分割的损失函数
对于滥用技术术语表示赞赏。我正在通过卷积神经网络(CNN)进行语义分割的项目;试图实现Encoder-Decoder类型的体系结构,因此输出的大小与输入的大小相同。 您如何设计标签?一个应该应用什么损失函数?尤其是在严重的类别不平衡的情况下(但是类别之间的比率在图像之间是可变的)。 该问题涉及两个类别(感兴趣的对象和背景)。我正在将Keras与tensorflow后端一起使用。 到目前为止,我将应用按像素标注将预期输出设计为与输入图像相同的尺寸。模型的最后一层具有softmax激活(针对2个类)或S型激活(表示像素属于对象类的概率)。我在为此类任务设计合适的目标函数时遇到麻烦: function(y_pred,y_true), 同意Keras的观点。 请尝试具体说明所涉及的张量的大小(模型的输入/输出)。任何想法和建议都非常感谢。谢谢 !

1
哪种深度学习模型可以对不互斥的类别进行分类
示例:我的职位描述中有一句话:“英国Java高级工程师”。 我想使用深度学习模型将其预测为2类:English 和IT jobs。如果我使用传统的分类模型,则只能预测softmax最后一层具有功能的标签。因此,我可以使用2个模型神经网络来预测两个类别的“是” /“否”,但是如果我们有更多类别,那就太贵了。那么,我们是否有任何深度学习或机器学习模型可以同时预测2个或更多类别? “编辑”:使用传统方法使用3个标签,它将由[1,0,0]编码,但在我的情况下,它将由[1,1,0]或[1,1,1]编码 示例:如果我们有3个标签,并且所有这些标签都适合一个句子。因此,如果softmax函数的输出为[0.45,0.35,0.2],我们应该将其分类为3个标签或2个标签,或者可以是一个?我们这样做的主要问题是:分类为1个,2个或3个标签的最佳阈值是多少?
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
如何测量人群图片中的人数?
背景:以色列(以及整个中东)充满了抗议活动。 我很好奇,当得到一张照片时,估计其中有多少人(通常是一大群人的照片)。 哪种建模可以为该问题提供一些解决方案?(当然,可以使用任何开源程序包来完成。比如,R?)
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.