Questions tagged «fault-tolerance»

3
多站点高可用性
我们需要一个高度可用的SaaS应用程序。我们已经有一个昂贵且维护良好的Hyper-V故障转移群集,但是如今托管该群集的数据中心发生了五个小时的断电,这使我们完全脱机。所以现在我们想知道更好的方法是否是在两个单独的数据中心使用服务器。假设我们在这两个站点之间完成了所有后端文件复制和数据复制,我们想知道如何处理前端路由-难怪我们如何解决该问题,我们总是在负载均衡器不断完善的情况下单点故障。 所以问题是……我们如何在两个托管站点之间设置负载平衡,以使负载平衡器不是单点故障?有没有办法使用两个单独的负载均衡器,每个站点一个?我们是否应该考虑循环DNS?

1
Systemd不会重新启动服务,尽管Restart = always
这是我的systemd服务的单位文件: [Unit] Description=Tunnel For %i After=network.target [Service] User=autossh ExecStart=/usr/bin/autossh -M 0 -N -o "ExitOnForwardFailure yes" -o "ConnectTimeout=1" -o "ServerAliveInterval 60" -o "ServerAliveCountMax 3" -R 40443:installserver:40443 -R 8080:installserver:8080 tunnel@%i Restart=always [Install] WantedBy=multi-user.target 该单元在15天前发生了故障,尽管上面的单元文件中有“ Restart = always”,但systemd并未重新启动它。 这是该服务的状态输出: salt:/srv # systemctl status autossh@eins-work autossh@eins-work.service - Tunnel For eins-work Loaded: loaded (/etc/systemd/system/autossh@.service; enabled) …

4
我是否需要第二个RAID控制器以实现容错?
我有一台装有3个硬盘驱动器的服务器,总容量为6个。我们正计划将其最大化,但我们的顾问还建议使用第二个RAID控制器“冗余”以支持新驱动器。对我来说,这没有多大意义。即使第二个RAID控制器运行一半的磁盘,但如果其中一个控制器死了,我们仍然只保留一半的磁盘/程序/数据(这比不运行一个磁盘要好得多)。我们将vmware放在服务器上,他含糊地提到了一些高级的容错/故障转移功能,但是如果由于控制器故障而无法访问磁盘,那么应该如何工作? 仅考虑冗余而不是性能的原因,为什么要在服务器中使用第二个RAID控制器?

4
容错NFS?
可能是常见问题解答,但经过一段时间的搜索,我没有发现任何有用的信息: 我是否可以通过以下方式设置NFS:掩盖每个错误(例如服务器CPU,硬盘,高清控制器,网络适配器,网络电缆,电源),而无需立即进行干预? 对于部分问题,我只有答案:RAID,冗余电源,冗余网络适配器 如何解决NFS服务器的CPU故障,以便客户端透明地故障转移?

3
ESXi HA群集的共享存储选项
我正在寻求共享存储选项的建议,支持ESXi的HA集群(注意我不是要求产品/品牌/型号建议-我知道这是对这里的规则)。我问了技术建议。 我工作的公司是一家小型企业。目前,我们有一个带有DAS和ESXi 6.0的HP DL380 G9,它在运行我们定制开发的应用程序。我们现在正在研究如何使用最经济的选择来实现HA / FT。我们需要HA / FT,因为我是一个IT团队,而且我经常出差,所以手动故障转移/恢复不是一个选择。 我了解我们至少需要2台ESXi主机(物理服务器)和共享存储才能实现HA / FT。我认为这是很有趣的地方:即使是那里最便宜的入门级存储阵列,对我们来说也可能是过大了。我们的存储容量需求可能约为200GB,并且至少5年内我们看不到这一翻倍。但是,我们需要用于HA / FT的共享存储。 因此,非常感谢您对我的选择提出任何建议。谢谢。

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.