2
用外行的术语来说,汤普森抽样是什么?
我无法理解汤普森采样及其工作原理。我正在阅读有关“多臂强盗”的信息,并且在阅读了“最高可信度绑定算法”后,许多文本都暗示汤普森采样的性能要优于UCB。用外行或简单术语来说,汤普森抽样是什么? 随时提供参考文章以进一步理解。
机器学习算法可建立训练数据模型。术语“机器学习”的定义模糊不清;它包括所谓的统计学习,强化学习,无监督学习等。始终添加更多特定标签。