在预测冰球运动员的职业生涯总目标时是否在Poisson回归中使用偏移


10

我有一个关于不愿使用补偿的问题。假设一个非常简单的模型,您要在其中描述曲棍球的(全部)目标数。因此,您有目标,打的游戏次数和虚拟变量“ strike”(如果玩家是前锋,则等于1,否则等于0)。那么正确指定了以下哪个模型?

  1. 目标=游戏+前锋,或

  2. 目标=偏移量(游戏)+前锋

同样,目标是整体目标,游戏数量是单个玩家的整体游戏。例如,可能有一个玩家在100场比赛中有50个进球,而另一个在50场比赛中有20个进球的玩家,依此类推。

我想估算目标数时应该怎么做?是否真的需要在此处使用偏移量?

参考文献:


你的因变量是什么?到目前为止,是特定球员职业生涯中进球总数吗?另外,您是否有理由不想预测每场比赛的平均进球?
Jeromy Anglim 2011年

是的,这是目标总数!不,我没有每个游戏的数据。我只掌握整体数据。
MarkDollar 2011年

因变量是(数量)目标。(请参见上面的方程式)
MarkDollar 2011年

我对标题进行了一些调整,以使其与先前的问题不重复。如果我误解了,请随时进行修改。
Jeromy Anglim 2011年

Answers:


16

补偿模型可以模拟每个游戏的目标,如下所示:

log(goals/games) = a+bx

相当于

log(goals) -log(games) = a+bx

相当于

log(goals)= a+bx +log(games)   <-this is an offset model, assumes coef on the last term =1

参见此处的幻灯片35:http : //www.ed.uiuc.edu/courses/EdPsy490AT/lectures/4glm3-ha-online.pdf

如果您认为a + bx与目标与游戏的对数比(比率)有关,请使用偏移量。如果您认为存在更复杂的游戏效果(可能是由于积累经验),那就不要。有关更多讨论,请参见:http : //ezinearticles.com/?The-Exposure-and-Offset-Variables-in-Poisson-Regression-Models&id=2155811


1

一些简单的要点不能直接解决您有关偏移的问题:

  • 我将看看游戏数量是否与平均进球相关。在我可以想到的许多精英进球运动中(例如,足球,澳大利亚规则足球等),我可以预测职业的长寿与职业的成功有关。至少对于进球得分角色的球员而言,成功与进球数有关。如果是这样,那么游戏数量将捕获两种效果。这可能与这样一个事实有关:更多的比赛意味着更多的进球机会。另一个将捕获与技能相关的效果。您可以检查游戏数与平均得分(例如,目标/游戏数)之间的关系以进行探索。我认为这对您所做的任何建模都有实质性的影响。
  • 我的直觉是将因变量转换为每场比赛的平均进球。我意识到,对于那些玩更多游戏的玩家,您将可以更精确地衡量其技能,所以也许这将成为一个问题。根据所需模型中的精度以及播放器均值的分布情况,您可能可以依靠标准的线性建模技术。但这也许有点适合您的目的,也许您有理由要对总得分目标建模。

你好耶罗米!您的描述绝对正确。但是无法建立衡量目标/游戏的模型。因此,我被迫采用上述模型(目标为因变量,游戏为因变量)。我知道游戏与诸如技能之类的东西有关,因此我必须探索这个问题(遗漏变量问题和内生性)。但是目前,我想知道应该使用上述两种模型中的哪一种!
MarkDollar 2011年
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.