Questions tagged «aws»


3
使用EC2时的实例与核心
在通常被称为“中等数据”项目的工作中,我已经能够在4到32个内核之间的任何一个系统上并行化我的代码(主要用于Python中的建模和预测)。现在,我正在考虑扩展到EC2上的群集(可能使用StarCluster / IPython,但也可以接受其他建议),并且对如何协调实例与群集上实例之间的内核之间的分配工作感到困惑。 跨实例以及跨每个实例的内核并行化甚至可行吗?如果是这样,那么谁能快速总结一下运行许多每个核心很少的实例与少数几个核心很多的实例的优缺点?是否有经验法则来选择每个实例的实例与核心的正确比例? 带宽和RAM在我的项目中不是无关紧要的问题,但是很容易发现何时出现瓶颈和重新调整。我想,要在没有重复测试的情况下将正确的内核混合基准用于实例要困难得多,而且我的项目相差太大,以至于任何一次测试都无法应用于所有情况。在此先感谢您,如果我只是未能正确搜索到此内容,请随时为我指出其他地方的正确答案!
12 parallel  clusters  aws 

4
将网络上的大型数据集直接下载到AWS S3
有谁知道是否可以从URL将大型数据集导入Amazon S3? 基本上,我想避免下载大文件,然后通过Web门户将其重新上传到S3。我只想将下载URL提供给S3,然后等待他们将其下载到他们的文件系统中。这似乎很容易做到,但是我只是找不到有关它的文档。
12 dataset  aws 

3
最佳科学计算语言[关闭]
已关闭。这个问题需要更加集中。它当前不接受答案。 想改善这个问题吗?更新问题,使其仅通过编辑此帖子来关注一个问题。 5年前关闭。 似乎大多数语言都具有一定数量的科学计算库。 Python有 Scipy Rust 有 SciRust C++有几个包括ViennaCL和Armadillo Java具有Java Numerics和Colt其他几个 且不说像语言R和Julia明确的科学计算而设计。 有这么多种选择,您如何选择适合任务的最佳语言?另外,哪种语言的性能最高?Python并且R似乎在该领域具有最大的吸引力,但从逻辑上讲,编译语言似乎是一个更好的选择。会有什么表现胜过Fortran?此外编译语言往往有GPU加速,而解释性语言如R并Python没有。选择一种语言时应该考虑什么?哪些语言可以在效用和性能之间取得最佳平衡?还有我错过的具有重要科学计算资源的语言吗?
10 efficiency  statistics  tools  knowledge-base  machine-learning  neural-network  deep-learning  optimization  hyperparameter  machine-learning  time-series  categorical-data  logistic-regression  python  visualization  bigdata  efficiency  classification  binary  svm  random-forest  logistic-regression  data-mining  sql  experiments  bigdata  efficiency  performance  scalability  distributed  bigdata  nlp  statistics  education  knowledge-base  definitions  machine-learning  recommender-system  evaluation  efficiency  algorithms  parameter  efficiency  scalability  sql  statistics  visualization  knowledge-base  education  machine-learning  r  python  r  text-mining  sentiment-analysis  machine-learning  machine-learning  python  neural-network  statistics  reference-request  machine-learning  data-mining  python  classification  data-mining  bigdata  usecase  apache-hadoop  map-reduce  aws  education  feature-selection  machine-learning  machine-learning  sports  data-formats  hierarchical-data-format  bigdata  apache-hadoop  bigdata  apache-hadoop  python  visualization  knowledge-base  classification  confusion-matrix  accuracy  bigdata  apache-hadoop  bigdata  efficiency  apache-hadoop  distributed  machine-translation  nlp  metadata  data-cleaning  text-mining  python  pandas  machine-learning  python  pandas  scikit-learn  bigdata  machine-learning  databases  clustering  data-mining  recommender-system 
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.