R中的稳健多元高斯拟合


11

我需要将广义高斯分布拟合到包含大量相当高的离群值的7维点云中。你知道这份工作有什么好的R包吗?


3
stats.stackexchange.com/questions/213/…上,您可以找到至少四个用于识别多元离群值的R包的链接。那可能是一个好的开始。
ub

也许这个问题让我望而却步,但是就拟合多元高斯分布而言,为什么不仅仅使用经验均值和SD作为MLE?如果有较高的影响力/杠杆作用点,则可以专注于诊断统计数据。
AdamO '18年

Answers:


1

还有mclust:http : //www.stat.washington.edu/research/reports/2012/tr597.pdf http://cran.r-project.org/web/packages/mclust/index.html

不过要注意一点:如果点云很大,则在高维空间中进行混合建模可能会占用大量CPU和内存。大约四年前,我正在处理一批11维,50-200K点数据,并且它倾向于运行4-11GB的RAM,并且每种情况最多需要一周的时间来计算(我有400个)。这当然是可能的,但是如果您使用共享计算群集或可用资源有限,则可能会令人头疼。


1

这听起来像经典的多元高斯混合模型。我认为BayesM软件包可能有效。

这是一些多元高斯混合套件

  • Bayesm:cran.r-project.org/web/packages/bayesm/index.html
  • mixtools:www.jstatsoft.org/v32/i06/paper
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.