我应该担心我们的服务器设置吗?


9

我为大约50人的公司工作。我们的两个服务器(相同)是根据以下规范定制构建的:

Xeon E3-1270 V3
Intel Entry Server Board
32 GB DDR3 ECC
2x 256 GB SSD RAID1 (for System)
4x 1TB SSD RAID10 (for Hyper-V VMs)
Windows Server 2012 R2 as Host and VMs

每个服务器托管两个VM(2个AD +文件共享+漫游配置文件,1个用于测试的SQL Server,1个其他(不重要))。

我们使用QNAP NAS(2个2TB RAID1)上托管的iSCSI目标上的内置Windows备份执行每日备份。

服务器没有很多负载,我们从来没有任何问题。我们的大多数数据都存储在云中(VS Online,SharePoint)。

但是我不知道继续进行此设置是否明智,还是最好切换到专业的服务器硬件,即一台大型计算机。

那么,陷阱是什么?我应该怎么做?


2
但是我不知道继续进行此设置是否明智,或者切换到专业服务器硬件(即一台大型计算机)是否更好。 ”这是两个截然不同的问题,如果您还在寻找对后一个问题的全面解答,那么可能值得分开摆姿势。除此之外,您能否阐明您在组织中的角色?我假设您负责基础架构,但如果没有,您显然不需要执行任何操作。
Lilienthal

1
我在这里可以想到几个不同的答案,因此确定一个核心问题(此设置可以吗?此硬件可以吗?我们应该合并服务吗?...)可能会帮助您获得更有用的答案。
Lilienthal

@Lilienthal我是公司的主要管理员。是的,我想知道硬件和设置是否正常。
马丁·沃尔特

设置是否正确是一个相当广泛的话题,因为它涉及许多因素:您是否具有脱机和/或异地备份?您有恢复策略吗?您是否测试过上述恢复策略?您可以忍受什么停机时间?您的预算和预期的服务水平是多少?您的更新和升级过程如何?是否记录了您的系统和凭证?您是否考虑过公交因素?……与“何时脱离消费类硬件才有意义”是一个完全不同的问题。
Lilienthal'9

1
@Lilienthal哈哈。我喜欢你如何抓住自己的中段。是的,这就是我的意思。
Ryan Babchishin

Answers:


11

听起来您已经在使用不错的硬件。它出什么问题了?还不算老吧?如果您不想太担心(不要所有人都对此表示赞同),请将其保留在保修期内或关闭。

如果您有多余的设置和良好的备份,那么您的工作做得很好。一台服务器=单点故障,无论它有多好,都会让我感到不舒服。通过明智地决定如何在软件/硬件/基础架构/支持方面实现事物,您可以在预算中做很多事情。

如果没有适当的预防措施,则可能会感到担心。如果一个系统死亡,它的服务是否消失了?这将如何影响业务?您能恢复多快?

陷阱?依靠。您没有提供太多信息。便宜的驱动器可能会失败或变慢。便宜的箱子可能会过热。廉价粉丝可能会失败。廉价的SATA / SAS / RAID控制器可能会损坏或无法达到预期的性能。廉价电源可能会失效,或者如果不是多余的话,将使您断电。主板可以做一些奇怪的事情。没有远程控制台(ILO等)的系统可能很难管理。廉价的网卡可以具有廉价的驱动程序或损坏。许多小的不可预见的问题可能会发生。另一方面,作为地狱入门级产品,您可以获得便宜的产品,它们的性能惊人。有时,更昂贵的东西也可能会变得不稳定。

我已经在体面的*服务器级别,低端服务器,工作站和消费者级别的设备中看到了所有内容。从长远来看,高端产品似乎做得更好(超过保修期)。但是,如果您负担不起?还是您只能负担一台服务器而不能实现适当的冗余?

运行有至强,ECC内存和RAID的双服务器基本上没有什么错。除非您有问题。


首先定义目标(您绝对需要的东西,很有趣的东西以及不会让您感到烦恼的东西)和预算,然后购买可以满足这些条件的最佳质量可能会有所帮助。除此之外,如果没有远程管理(IPMI,AMT等),我个人不会碰任何东西,这太方便了。冗余电源也是如此,特别是对于关机时间很长的VM主机。
user121391 '16

9

假设您的VM是冗余的(经过测试,可以关闭一个节点),由于拥有两个镜像节点,您可能相对不受硬件故障的影响。

在不了解更多信息的情况下,除非整个节点的中断对您的公司而言不是主要问题,否则我不建议您将其放到单个(较新的)框中。

也就是说,了解有关您的环境的一些其他详细信息将很有帮助……例如,您拥有这些机器多长时间了,它们是否位于特定目的的环境中(干净,干燥的机架和交流电源等) 。如您所知,精心保养的设备使用寿命更长!

一般而言,使用较少的“专业”硬件并不一定有什么错,只是它没有像更昂贵的工具包那样具有相同的保证或可靠性,因此,这些风险需要与预算相权衡。


2
感谢您的回答。我认为我们拥有服务器已有3年了。它们放在带有AC的专用房间的机架中。但是服务器未镜像。每台服务器托管不同的VM,每台托管一个AD。
马丁·沃尔特

在那种情况下(听起来您在照顾他们方面做得很好),那么我认为您现在就可以像现在这样安全地继续(假设AD是您托管在他们身上的唯一关键服务)。我建议实施某种监视以留意硬件错误(我不确定这些天最适合Windows的错误),并可能计划在接下来的2-3年中替换它们或提出其他解决方案年份。
马特·雷纳

4
@MartinWalter也许您应该担心。一个系统死亡,其服务消失了。这将如何影响业务?您能恢复多快?
Ryan Babchishin

1
@RyanBabchishin对于内部IT来说,这个问题始终很重要。但是,实际上总是存在权衡取舍,而对于企业而言,在这种罕见的情况下下降一两个小时可能是可以接受的。另外,如果OP将其VM的快照快照/导出到外部设备,则恢复就像将外部设备安装在另一个运行盒上并临时启动vm一样简单。对于AD,除了在恢复主计算机之前降低性能之外,这可能不会引起任何问题(如果它所处理的只是基本的AD东西,没有高级的东西)。
SnakeDoc '16

1
@SnakeDoc这就是为什么这对他来说是个问题。关于那个。?
Ryan Babchishin

5

由于您的存储后端是全闪存的,因此对于上述工作负载,您的硬件完全可以。对于您的配置,我唯一关心的问题是,VM是在单个服务器上拆分并运行的,而不是在服务器之间进行镜像/同步的,尤其是在它们相同的情况下。因此,我强烈建议您使用一些软件定义的存储(虚拟SAN),该存储将使您将两个服务器都连接到一个群集中,并使您的虚拟机不受可能出现的硬件故障的影响。

可能的选项是HP VSA http://www8.hp.com/us/en/products/storage-software/product-detail.html?oid=5306917或EMC Unity VSA https://store.emc.com/us/产品系列/ EMC统一产品/ EMC统一VSA / p / EMC统一虚拟存储设备是免费的,但据我所知,这是不允许生产的。由于您使用的是Hyper-V,因此理想的选择是使用本机运行在Windows之上的StarWind Virtual SAN https://www.starwindsoftware.com/starwind-virtual-san,并允许您无缝创建完全仅使用直接连接的存储的功能强大的Microsoft故障转移Hyper-V群集。

我还建议您使用具有免费版本的VEEAM B&R https://www.veeam.com/vm-backup-recovery-replication-software.html或Bacula http://blog.bacula.org/来备份您的VM。之所以使用本机Windows 2012 Server Backup,是因为它在尝试恢复VM时会导致问题而闻名。


1
感谢您的建议。我知道备份是我必须解决的问题。目前无法进行故障转移,因为计算机运行的是不同的VM,并且没有那么多的RAM,因此我无法将所有VM都放在同一台计算机上。
马丁·沃尔特

1
很想听听您提到的有关使用Windows 2012 Server Backup恢复VM的问题的更多信息
wandersick

1
@wandersick实际上是一个常见问题。Windows备份因在还原过程中产生诸如0x8XXXXXXX之类的奇怪错误而闻名,从而使还原无法进行。奇怪的是,有时错误代码甚至无法谷歌搜索:-(
Net Runner

0

在小型部署中,多台(至少两台)便宜的计算机通常比一台昂贵的计算机更好。换句话说,在小型部署中,宽度要比高度高。原因是通过这种方式,您可以有一些冗余,从而有限地增加了成本。两台3000服务器可以完成与一台5000服务器相同的功能,但是如果昂贵的服务器发生故障,您将无所适从。如果其中一个较便宜的虚拟机失败,则至少有一半的VM仍在运行,并且它可能也可以运行其他虚拟机,这只会很慢。

您应该考虑的是不要单独管理这些服务器,而是以某种方式将它们群集在一起。您的虚拟化解决方案应该能够创建故障转移群集,从而使VM驻留在哪个主机上都没有关系,如果主机死了,则该VM将自动迁移。这也减少了微管理,这意味着将来您可以在保持旧服务器运行的同时添加新服务器,直到这样做不再经济。该决定通常取决于功耗或空间限制。

如果要增长更多,可能要从服务器上的存储迁移到SAN。这样,您的服务器将成为纯计算节点,它们的运行状况对VM而言实际上并不重要。


请注意,使用此解决方案/通用路径,必须达到一定的水平才能使其正确。您还可以在昂贵的机器(PSU,磁盘,控制器,GPU,CPU,网卡)中获得冗余,同时降低管理的复杂性(第二主机的软件更新,虚拟机自动故障转移编排,网络流量注意事项,权限,监控)一点点。但是,没有硬数字很难说出什么更好。
user121391 '16

-8

只要您的网络和备份系统上没有任何问题,就可以继续进行此设置,但将来最好使Professional服务器保持100%健康。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.