可以使用Poisson,Gamma或Tweedie分布作为错误分布族来评估Python / scikit-learn中的GLM吗?


12

试图学习一些Python和Sklearn,但是对于我的工作,我需要运行回归,使用Poisson,Gamma尤其是Tweedie系列的误差分布。

我没有在文档中看到关于它们的任何内容,但是它们在R发行版的几个部分中,因此我想知道是否有人在任何地方看到了Python的实现。如果您可以将我引向Tweedie发行版的SGD实现,那就太酷了!


Python中最可靠的GLM实现在[statsmodels] statsmodels.sourceforge.net中,尽管我不确定是否有SGD实现。
2014年

谢谢特雷。似乎不支持Tweedie,但他们确实对Poisson和Gamma分布进行了一些讨论。
2014年

Answers:


13

运动来实现与泊松分布,伽马广义线性模型,和特威迪误差分布scikit学习。

Statsmodels具有带有Poisson,Tweedie和gamma误差分布的广义线性模型的实现。

当我更新此答案时,Spark ML还(通过实验)支持Poisson,Tweedie和gamma分布。



@MatthewDrury太棒了!
尼尔(Neal)

@MatthewDrury真好!我刚开始使用GLM,并且statsmodels有一些限制。不确定我是否完全理解数学,但是您的内部求解可以用任意的最小二乘法求解器代替吗?我在想这会增加灵活性(例如,通过sklearn.ElasticNet来“免费”获得可伸缩性/正则化等)。
GeoMatt22 '18

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.