参数魔鬼—当无法针对groundtruth进行验证时如何设置它们[关闭]


9

题:

我想就无法对groundtruth进行验证的情况下人们如何设置算法参数展开讨论(可能是因为groundtruth无法获得或很难/乏味地获得)。

我已经阅读了许多论文并实现了底层算法,其中---据说一组参数是“凭经验设置的” ---而且我经常发现这些参数会影响算法的通用性(即使该方法所基于的理论是优雅,诱人和稳健的。

如果您能分享您的想法,我将不胜感激。并且,此问题没有正确或错误的答案。我只想知道,其他人如何处理这个问题。

背景/问题来源:

我是一名从事图像分析,计算机视觉和机器学习领域的计算机科学家,每当我设计新算法并且每次发现自己花费了大量时间来调整参数。

另外,我想,我的问题在涉及计算算法的任何领域都更普遍,我想邀请所有相关领域的人们的想法。

我想给您一个具体的例子,以帮助您思考:

---以特征检测为例(比如说圆形斑点或显着点)。您以不同的比例(比例参数)运行某些过滤器(需要参数),并可能将响应设置为阈值(阈值参数)。在这种情况下,通常无法获得验证的依据,从而无法自动调整参数。

---采用任何涉及大量信号处理组件的计算框架。总是有需要调整的参数,通常没有基础,当您主观调整数据集的随机小子集时,总有一天会遇到无法推广的情况。

当您为算法中的某些中间步骤设置参数时,此参数魔鬼会更麻烦。

而且我经常发现,不可能将为这些参数找到合适的值的问题作为具有目标函数的优化问题,您可以对其求导,从而使用标准的优化算法来找到合适的值。

同样,在许多情况下,将这些参数暴露给最终用户也是不可取的,因为我们经常为非计算最终用户(例如生物学家,医生)开发应用程序/软件,并且当您要求他们进行调整时,它们通常变得毫无头绪。除非它非常直观(例如大约对象大小)。

请分享您的想法。


1
开头I want to kick up a discussion ...确实很好地表明您要求的内容不适合* .SE格式。
Peter K.

Answers:


2

假设有一个基本事实,(至少在理论上)可能的方式来克服“沉闷”的问题是“引导”地面实况创建一个。如果您已经有一个不错的算法可以在大约80%-90%的情况下完成任务,则可以在大量实例上运行算法,并要求用户仅标记错误。这种方法有其自身的缺陷,例如对算法的偏见。

但是,在某些情况下根本没有基础事实,只有不同的系统权衡。例如,需要图像处理系统来输出清晰,色彩准确,无噪声的图像。显然,您不能同时拥有它们。在这种情况下,您应该使用可以根据系统结果计算的客观指标。(有关图像处理,请参阅DXO 分析仪Imatest)。

一旦有了这些,就可以使用多目标优化的方法,这些方法可以创建从权衡(用户清楚)到固有参数的映射。

无论如何,永远不要给用户一个他无法理解的参数。如果全部失败,只需对参数进行硬编码。


2

这是一个非常非常困难的问题,但是该领域有很多工作要做。举一个例子,看看本文由拉马尼&费斯勒的SURE方法。简介对参数选择方法有很好的概述,请务必查看它们的参考。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.