最近,我对实现beta回归模型感兴趣,其结果是成比例的。请注意,此结果将不适合二项式上下文,因为在此上下文中没有有意义的离散“成功”概念。实际上,结果实际上是持续时间的一部分。分子是某个条件处于活动状态时的秒数,在该条件有资格处于活动状态的总秒数。我为这些变化感到抱歉,但我不想过多地关注这个精确的上下文,因为我意识到,除了beta回归外,还有多种方法可以对这种过程进行建模,而现在我对理论更加感兴趣我在尝试实施这种模型时遇到的问题(尽管我当然是,
无论如何,我能够找到的所有资源都表明,使用logit(或probit / cloglog)链接通常适合使用beta回归,并且将参数解释为对数奇数。但是,我还没有找到一个引用,该引用实际上提供了为什么要使用此链接的任何真实理由。
Ferrari&Cribari-Neto(2004)的原始论文没有提供依据。他们仅注意到logit函数“特别有用”,这是因为对指数参数进行了比值比解释。其他来源则暗示了从区间(0,1)到实线的映射的愿望。但是,考虑到我们已经假设了beta分布,我们是否一定需要链接函数来进行这种映射?链接功能除了假设开始使用beta分布所施加的约束之外,还能提供什么好处?我已经进行了几次快速模拟,即使使用概率分布很大程度上集中在0或1附近的beta分布进行模拟,也没有看到具有(identity)链接的(0,1)区间之外的预测。还不够全面,无法捕捉到某些病理。
在我看来,基于个人在实践中如何根据Beta回归模型(即,比值比)解释参数估计值,即他们隐含地推断出“成功”的几率;也就是说,他们正在使用Beta回归代替二项式模型。考虑到beta和二项式分布之间的关系,这也许在某些情况下是适当的,但是在我看来,这应该是比一般情况更特殊的情况。在这个问题中,提供了一个答案来解释相对于连续比例而不是结果的优势比,但是在我看来,尝试以这种方式解释事物比使用日志等不必要的麻烦或身份链接,并解释百分比变化或单位偏移。
那么,为什么我们将logit链接用于beta回归模型?仅仅是为了方便起见,将其与二项式模型相关联?