我正在就统计/机器学习/数据挖掘上下文中的算法开发人员/研究人员的位置采访人们。
我正在寻找问题,以明确确定候选人对基础理论的熟悉程度,理解程度和灵活度,例如期望和方差的基本属性,一些常见分布等。
我当前需要解决的问题是:“有一个未知量,我们想估计。为此,我们有估计器,在给定,它们都是无偏且独立的,并且每个都有一个已知的方差,每个方差都不同。找到最优估计量,该方差是无偏的且方差最小。”
我希望任何认真的候选人都可以轻松地处理它(给了一些时间进行计算),但是令我惊讶的是,据称来自相关领域的候选人竟然没有取得最小的进步。因此,我认为这是一个很好的,有区别的问题。这个问题的唯一问题是它仅仅是一个。
还有什么其他问题可以使用呢?另外,在哪里可以找到此类问题的集合?
7
对于许多机器学习的人(包括优秀的人)来说,这个问题超出了他们的舒适范围。这是一个明显的统计学家问题。
—
马克·克莱森
这个问题在主题上是合法的。但是,它有很多观点,有几个投票,一个有几个投票的答案,而且是CW。它可以保持打开状态,IMO。
—
gung-恢复莫妮卡
可能出现的疑问用措辞混乱。例如,使用加上大写字母会使看起来是随机的。但是,由于您提到的是最小方差,因此您似乎希望是非随机的(在这种情况下,为什么估计量的方差没有对的书面依赖?)
—
Batman
谨慎起见,Google对内部人力资源流程进行了大量研究,发现访问员分数与随后的工作表现根本不相关!我在这里对文学的印象是(1)难题类型的问题绝对是最糟糕的,只会使访调员感到聪明(即0的预测能力);(2)履历表,基于经验的问题可能具有预测价值。过去的表现会预测未来的表现,您可能希望重点关注问题以确定过去的表现,但是面试的信息量远不如面试官想象的那样。
—
马修·冈恩
通过使权重之和达到统一,可以确保无偏。但是,即使将解决方案限制在估算器的线性组合上,也几乎总是会存在基于相同数据的多个估算器高度相关的情况。(如果它们确实是独立的,则将它们应用于不相交的,独立的数据子集。)但是,估计数的线性组合将不是最优的,这一点也不明显。
—
ub