是什么使云存储(Amazon AWS,Microsoft Azure,google Apps)与传统数据中心存储网络(SAN和NAS)不同?


8

由于我的问题有些混乱,因此使其变得简单:

“大型云提供商使用哪种存储,为什么?”

据我了解,但是我无法发现典型数据中心和云之间的任何官方存储网络差异,所有云提供商都使用与典型数据中心不同的DAS。

甚至DAS都比SAN或NAS有许多缺点,我想详细了解为什么云将DAS用于存储或应用目的。

任何资源或描述,将不胜感激。

编辑:在阅读论文“大规模云构建的网络挑战和结果方法,David Bernstein和Erik Ludvigson(思科)”时,他们提到:

奇怪的是,我们没有看到使用NAS或SAN的主要提供商提供的云。典型的云架构使用DAS,这不是数据中心存储方法所特有的。

但是这里存在一个冲突:在我看来,并且在本文的稍后部分中指出,由于VM移动到另一台服务器但仍需要从原始服务器访问存储时,由于DAS不适合,所以云应该使用SAN或NAS。

还有什么其他原因导致云偏爱DAS,NAS或SAN?大型云提供商使用哪种存储,为什么?


2
您是在问“将数据存储在云中和使用自己的SAN或NAS存储之间对我有什么区别”还是“大型云提供商使用哪种存储以及为什么?”?
兰迪·奥里森

Answers:


4

问题明确后,此答案已被编辑。

还有什么其他原因影响云选择DAS

其中“ DAS”表示直接附加存储,即SATA或SAS硬盘驱动器。

云供应商都使用DAS,因为它在价格/性能方面提供了数量级的改进。这是水平缩放的情况。

简而言之,SATA硬盘驱动器和SATA控制器是便宜的商品。它们是大众市场产品,而且价格很低。通过使用廉价的SATA驱动器构建大量廉价的PC集群,Google,Amazon和其他公司以非常低的价格获得了巨大的容量。然后,他们在顶部添加自己的软件层。他们的软件执行多服务器复制,以提高性能和可靠性,监视,在硬件故障后重新平衡复制等。

您可以将MogileFS看作是Google,Amazon和其他公司用于存储的软件的简单代表。当然,这是一种不同的实现方式,但是它具有与大型系统相同的许多设计目标和解决方案。如果您愿意,这里是学习GoogleFS的起点

本文稍后所述,云应该使用SAN或NAS,因为当VM移至另一台服务器时,DAS不适合使用

不使用SAN的原因有两个。

1)价格。 SAN的大规模生产非常昂贵。尽管它们可能是技术上“最佳”的解决方案,但由于成本原因,通常不将它们用于非常大规模的安装。

2)CAP定理 Eric Brewer的CAP定理表明,在保持可接受的可靠性,容错性和性能的同时,无法大规模保持强一致性。SAN是在硬件上实现强大一致性的一种尝试。对于5.000服务器安装,这可能效果很好,但从未被证明可用于Google的250.000+服务器。

结果: 到目前为止,云计算供应商已选择将维护服务器状态的复杂性推给应用程序开发人员。当前的云产品无法为每个虚拟机提供一致的状态。应用程序服务器(虚拟机)可能会崩溃,并且它们的本地数据随时会丢失。

每个供应商都有自己的持久性存储实现,应该将其用于重要数据。亚马逊的产品就是很好的例子。MySQLSimpleDB简单存储服务。这些产品本身反映了CAP定理-MySQL实例具有很强的一致性,但可伸缩性有限。SimpleDB和S3可以实现惊人的扩展,但最终只能保持一致。


现在问题很清楚了。感谢您的链接,我将对其进行检查。
Berkay 2010年

我检查了所有链接,感谢您的回答。通常我们可以说DAS是云提供商的首选。但是对于某些应用程序,也可以使用SAN或NAS。
Berkay 2010年

1

如果使用DAS,则可用性是您的问题

如果他们使用DAS,则可用性是他们的问题。如果他们有什么好处,他们将使用多层抽象来确保他们的问题不会成为您的问题。问题不在于他们选择如何在其数据中心内安装磁盘,而是他们在SLA中保证的可用性是否足以满足您的需求。哦,还有房间里的大象,如果他们停业了怎么办(也许对某些提供商来说不太可能,但是您仍然应该考虑),如果在本地使用此数据并且您的互联网连接是怎么做的?无法使用-后者比直接选择DAS导致停机的可能性要高得多。


0

尽管我对DAS与SAN / NAS的解决方案不满意。

数据量?如果我们要用大约Gb,那很好,带备份的NAS可以完成这项工作。如果有terrabytes的数据,价格将上涨非常快。

我认为价格是主要因素...如果您有SAN,则需要:

  • 管理员进行配置/管理。
  • 服务器机房(该机房的电,带宽,安全措施,...)

而且,您根本没有冗余。如果您有权访问数据中心,情况可能会有所不同。

要考虑的另一件事是可访问性。您要归档吗?如果这样的话,可访问性不是问题,那么每天/每周/每月几次将您存档到存储解决方案中。

另一方面,如果您有需要不断访问的数据,则会很快发现带宽,硬件限制(例如I / O)的瓶颈。但是另一方面,如果您的数据传输量很高,则在线存储解决方案很可能会花费您很多钱。

ROI(投资回报率)是所有在线存储解决方案供应商所宣传的,并且根据使用情况,它们通常是正确的。

祝好运。


0

(仅提供意见,并且具有广泛的概括性。)

区别在于(通常)要查看的抽象层。

SAN / NAS通常为您提供一个卷,您可以在该卷上安装文件系统。这种方法对终端系统的价值在于您已将物理硬件的细节(例如RAID级别,物理位置等)外包了。

相比之下,云存储通常为您提供文件系统的接口。这样做的好处是您通常可以免费获得高阶功能(例如Dropbox透明地自动对每个文件进行版本控制)。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.