Zinkevich的“在线凸优化”(http://www.cs.cmu.edu/~maz/publications/ICML03.pdf)将“后悔最小化”学习算法从线性设置推广到凸设置,并给出了良好的“外部遗憾” 。内部遗憾是否有类似的概括?(我不确定这到底意味着什么。)
是否可以在问题中添加简短的内部遗憾描述?
—
莫里茨
在通常的“专家”中,设置内部遗憾将意味着回想过去,您将不想在整个历史过程中始终将一个动作与另一个动作切换。Blum-Mansour论文可能是内部与外部遗憾的最佳参考:jmlr.csail.mit.edu/papers/volume8/blum07a/blum07a.pdf
—
Noam