为什么R需要很长时间才能拟合具有多级因子的模型?


12

我用一个具有多个水平因子的模型拟合模型,并且R花费很长时间才能拟合该模型。为什么是这样?

例如,如果我拟合回归来预测球员的薪水,并包括针对所有球员各自国籍的因子预测器,那么与使用像球员的连续预测器那样的球员的薪资模型拟合起来相比,这将花费更长的时间。高度。


5
可能会意识到,虽然因子看起来像一个变量(在数据框中是一列,在模型规范中是一个项目,等等),但在幕后实际上会将其视为一堆单独的预测变量。因此,该模型比具有单个(连续)预测变量的模型复杂得多。
庆典2014年

Answers:


13

R是典型的-与大多数统计数据包一样,它使用QR分解进行回归。

对于固定(其中,仅计算分解本身实际上是二次的,因此将预测因子的数量翻倍会使计算时间乘以4。ñp<<ñp

因此,如果您从(线性回归)变为,则您期望它花费的时间大约是600倍(实际上由于各种原因,它可能会少一些)。p=2p=50

因此,添加大量预测变量将意味着更长的等待时间。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.