用于机器学习的云计算平台


Answers:


15

我没有使用过这些公司,但是这些只是其中的一些选择。但是,在EC2上进行设置非常简单。至少在您用足够的强度和足够的频率将其撞在墙上以麻木了头之后。它还会增加您的疼痛阈值。这些天,孩子们变得如此容易。当我刚开始的时候,我们正在进行雾计算:我们对所计算的不是最迷雾。

除了让人想起...有工具和资源可以绕过这些供应商并自行开始。 JD Long使用segue,使在EMR上开始使用R变得更容易。

关于Python,boto是一个套件,可让您在EC2上轻松安装和运行Python。如果您愿意考虑使用EC2替代方案,那么在Google的AppEngine上启动并运行Python也很容易。如果您了解Python,那么除非您不了解扩展,分片,负载平衡等方面的知识,否则实际上没有必要聘请公司为您进行提升。另一方面,如果您打算在此类服务上花很多钱,那么熟悉如何提高代码效率是一个好主意。

至于云上的Octave,除了这三家公司之外,我不知道还有什么。Monkey Analytics曾经提供过此功能,但似乎它们已经消失了。我建议避免使用Octave,而将重点放在Python或R上。

一种易于设置的资源是StarCluster。同样,他们没有经验,但这可能是一条有用的途径。

老实说,Ubuntu(或Windows)和EC2并不难学习。我不会真的推荐Windows for R,因为R开发人员和Windows之间并没有太多的热爱。(注意:据我所知,没有认真的Mac OS X云服务。)一旦有了远程桌面,就可以开展业务。学习如何扩展是下一步。


更新1:其他更通用的云管理服务包括RighstScale和Scalr。

更新2:我想强调一点,学会自己在云中设置实例和集群很重要。动手工作的好处包括:

  • 了解如何管理混合资源(多个实例,多种实例类型,大量HD,不同的可用区域或区域,各种监视工具等等)
  • 如果需要,可以使用GPU进行修补(签出gputools
  • 您可以更轻松地更新或回滚选择的软件包
  • 通过使用竞价型实例或预留实例,您可能能够获得更低的成本。
  • 您可以尝试不同的R GUI或IDE,这对于云供应商而言可能不是一个选择。

使用托管提供程序有很多好处,例如学习曲线更短,可能更好地支持在组之间共享资源以及一些不错的小玩意,但是当我在使用这些功能之前就开始使用EC2时,我无法说出好处。上市。


5

还有用于在EC2上并行运行Python代码的PiCloud

从他们的产品页面

PiCloud是集成到Python编程语言中的云计算平台。它使您可以利用Amazon Web Services的计算能力,而不必管理,维护或配置虚拟服务器。

PiCloud通过自定义Python库云无缝集成到您现有的代码库中。要将功能的执行工作转移到我们的服务器上,您要做的就是将所需的功能传递到云库中。PiCloud将在其高性能群集上运行该功能。当您运行更多功能时,我们的集群会自动扩展以满足您的计算需求。上云从未如此简单!


我比较喜欢PiCloud-我发现它们非常容易安装和运行。
Fomite

3

您之前尝试过CloudStat吗?与其他云不同,CloudStat仅适用于R语言用户。没有更多设置。您只需登录即可免费使用多达7.5 Gb的RAM。

但是,使用免费帐户,您的分析将被公众查看和使用。选项是每月支付5美元,以使您的分析私有。


By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.