服务器管理员 redundancy

18

我们在http://sstatic.net的网站之间提供了一组共享的静态内容。不幸的是，此内容目前根本没有负载均衡-它是由一台服务器提供的。如果该服务器出现问题，则依赖于该服务器的所有站点实际上都将关闭，因为共享资源是必不可少的共享JavaScript库和图像。我们正在寻找在此服务器上平衡静态内容的负载的方法，以避免单个服务器的依赖性。我意识到循环DNS充其量只是一个低端解决方案（有些甚至可能会说贫民窟），但我不禁要问- 循环DNS是否是静态内容基本负载平衡的“足够好”的解决方案？ [dns] [load-balancing]标记中对此进行了一些讨论，并且我阅读了有关该主题的一些不错的文章。我知道通过多个轮询A记录进行DNS负载平衡的常见弊端： DNS记录通常不会检测到心跳或故障，因此如果轮换中的给定服务器出现故障，则必须手动从DNS条目中删除其A记录必须将生存时间（TTL）设置得很短才能完全起作用，因为DNS条目会在整个Internet上积极缓存客户端计算机负责查看有多个A记录并选择正确的一个但是，对于我们的静态内容，轮循DNS是否足以作为启动器，而不是总比没有强，而“在我们研究和实现更好的替代方案时”负载均衡形式呢？还是在任何情况下DNS轮询几乎一文不值？

66 domain-name-system load-balancing redundancy

7

刀片服务器机箱故障的可能性

在我的组织中，我们正在考虑购买刀片服务器-而不是机架服务器。当然，技术供应商也使它们听起来非常不错。我在不同的论坛上经常读到的一个问题是，从理论上讲服务器机箱可能会掉下来-因此，所有刀片服务器都将掉下来。那是由于共享的基础架构。我对这种可能性的反应是拥有冗余性，并采用两个机箱而不是一个机箱（当然非常昂贵）。一些人（包括HP供应商）试图说服我们，由于许多冗余（冗余电源等），机箱极不可能发生故障。我这一边的另一个担心是，如果出现故障，可能需要备件-在我们所在地（埃塞俄比亚）这很困难。因此，我想问一问管理刀片服务器的经验丰富的管理员：您的经验是什么？它们会整体崩溃吗？可能会失败的明智的共享基础架构是什么？这个问题可以扩展到共享存储。我再次要说的是，我们需要两个存储单元，而不是仅一个。供应商再次说，这些东西非常坚固，不会出现故障。好吧-我很难相信这样一个关键的基础架构在没有冗余的情况下非常可靠-但也许您可以告诉我，您是否有成功的基于刀片的项目，这些项目在其核心部分（机箱，存储... ）目前，我们看一下HP-IBM看起来太贵了。

48 networking storage hardware redundancy blade-chassis

3

如何制作冗余负载均衡器？

我知道负载平衡器的目的是平衡服务器之间的负载并跟踪实例运行状况等。但是，如果负载平衡器本身发生故障怎么办？您如何设置冗余负载均衡器？（负载均衡负载均衡器？）我可以看到DNS运行状况检查如何有用，但是显然存在主要的延迟问题，不是吗？假设您没有使用任何第三方服务，例如AWS ELB或任何类似的东西。如果您仅使用说Nginx怎么办？

27 nginx load-balancing redundancy load-balance

5

如何防止预算造成服务器丢失

我是一家预算不多的小公司，为慈善机构和非营利性客户提供网站和数据库。我有几台Debian Linux VPS服务器，并确保我每天要备份到与托管该服务不同的VPS。最近，我的一家托管公司告诉我，两个驱动器同时发生故障，因此数据永远丢失了。事情发生了，他们说对不起，他们还能做什么？但是，这使我想知道在硬件或其他与主机相关的故障时，重新启动VPS的经济有效方法。目前，我不得不启动新的VPS 将最后一天的备份（包括数据库，Web根目录和特定于网站的配置）备份到VPS上，并像最后一天一样配置它。更新DNS并等待其传播。尽管我将TTL设置得很低（约一个小时），但要实现DNS传播仍然是一个未知数，可能要花一天左右的时间。一些主机提供了快照，可用于将设置复制到新的VPS，但是仍然有IP，如果主机公司完全取消/暂停帐户，这无济于事（我一直在阅读有关此内容的信息某些托管服务提供商的行为，这让我感到害怕！我没有做任何垃圾邮件/躲闪的事情，并密切关注安全性，但是我意识到他们确实有能力这样做，因此我非常愿意冒险。结合选择信誉良好的主机，这是否是我最好的选择，而无需昂贵的解决方案？

22 vps redundancy

7

在不使用RAID的多硬盘LVM中发生硬盘故障时，会丢失所有内容吗？

我正在讨论将LVM用于媒体/文件服务器，因为我想将多个物理硬盘合并为一个卷。我不希望在LVM中使用任何RAID，所以我的问题是：如果卷中的多个硬盘之一发生故障，我会丢失所有数据还是会丢失存储在该单个磁盘上的数据？另外，如果我只丢失单个磁盘上的数据，那么是否像更换该磁盘并从备份中还原其中的内容那样简单以进行恢复？

16 linux storage lvm redundancy

5

用自己的UPS保护两个机架供电是否有任何价值？

我已经做了一些查找，但没有找到满意的答案。对于机架的每个电源，何时需要或建议使用独立的UPS（在其自身的电源分支电路上）？详细说明; 当使用带有冗余电源的服务器时，通常建议每个“ 1”电源都进入分支电路“ A”，每个“ 2”电源都由分支电路“ B”供电，但是两个都需要UPS吗？ “ A”和“ B”供稿，还是只有一个？背景：我的任务是计划对内部使用的服务器进行基础架构升级。我们是一家制造公司，我们的许多设备和定制软件都依赖于我们办公室本地的可靠在线服务器。当前，我们有两个服务器机房，每个服务器机房各有一个机架，它们位于大型建筑物的相对两端（用于防止火灾或意外事故的冗余）。他们每个人都有一个由回路“ A”供电的UPS，而我们拥有的具有多个PSU的设备都已连接到该UPS。因此，如果UPS死了……ploop，服务器就到了。我个人的观点是，将每个服务器的PSU1连接到UPS，将每个服务器的PSU2连接到直接由市电供电的PDU，将提供可靠性和成本的良好组合。但是我的主管认为我们应该运行两个UPS单元，每个进给单元一个。如果这个问题太含糊，请让我知道，我将尝试对其进行修改。

15 redundancy electrical-power ups

21

什么时候RAID值得麻烦？

在我们的商店中，我们忠实地在所有工作站中使用RAID，可能只是因为这似乎是应该这样做的方式。我说的是使用板载RAID芯片进行科学仿真的工作站。但是我听说过很多RAID恐怖的故事。RAID控制器间接导致 Stackoverflow本身中断。 RAID可保护您避免出现非常狭窄的故障（物理磁盘故障），但同时也会引入额外的故障点。RAID控制器可能存在问题，并且经常存在。至少在我们的商店中，RAID控制器的故障似乎至少与磁盘本身一样多。您也可以轻松地更换故障驱动器的过程。什么时候RAID值得麻烦？通过在备份解决方案中增加更多的冗余，您是否可以获得更好的投资回报？在这方面，哪种类型的RAID更好或更坏？编辑：我已经从原始的标题更改“ RAID值得麻烦吗？”，所以听起来不太负面

14 raid redundancy

2

当对我们的“主要”外部DNS提供者的DDOS攻击发生时，是否可能有一个辅助托管的DNS提供者来快速委派给？

因此，我们的DNS提供商经常在其系统上遭受DDOS攻击，从而导致我们的前端网站瘫痪。在减少对单一外部托管DNS提供商的依赖方面有哪些选择？我的第一个想法是使用较低的到期TTL和其他SOA TTL，但感觉它们对辅助DNS服务器行为的影响比其他任何因素都大。即，如果您遇到DNS中断（在本例中为DDOS导致），该中断持续了超过1个小时，请将所有内容委派给第二提供商。人们在使用外部DNS并使用其他托管DNS提供程序作为备份时会做什么？请注意我们友好的主持人：这个问题比那里的“通用缓解DDOS攻击”问题更为具体。编辑：2016-05-18（几天后）：因此，首先感谢您AndrewB的出色回答。我要在此处添加更多信息：因此，我们联系了另一个DNS服务提供商，并与他们聊天。经过思考并进行了更多研究后，实际上这比我认为与两家DNS提供商进行的合作要复杂得多。这不是一个新的答案，实际上是该问题的关键所在！这是我的理解： -许多此类DNS提供商提供诸如“智能DNS”之类的专有功能，例如具有keepalive的DNS负载平衡，用于配置响应方式（基于地理位置，各种记录权重等）的逻辑链。。因此，第一个挑战是使两个托管提供者保持同步。两个托管提供者将必须由必须与他们的API自动交互的客户保持同步。这不是火箭科学，而是持续不断的运营成本，这可能是痛苦的（考虑到功能和API双方的变化）。 -但是这是我的问题的补充。假设有人确实根据AndrewB的响应使用了两个托管提供程序。我是否正确，根据规格此处没有“主要”和“次要” DNS？即，您向域注册商注册了四个DNS服务器IP，其中两个是您的DNS提供者之一，其中两个是另一个的DNS服务器。因此，您基本上只需要向世界展示您的四个NS记录，所有这些都是“主要”记录。那么，我的问题的答案是“否”吗？

13 domain-name-system ddos redundancy

8

在预算上负载均衡Apache？

我试图绕过负载平衡的概念，以确保可用性和冗余以在出现问题时使用户满意，而不是为了向数百万用户提供更快的速度而进行负载平衡。我们的预算有限，并且一直坚持要掌握很多知识，因此在一些著名的搜索引擎收购Apache之前，在Ubuntu VPS上运行Apache似乎是一种策略（包括周六具有讽刺意味的请注意）。至少对我而言，这是一个可用的不同解决方案的完整丛林。Apache自己的mod_proxy和HAproxy是我们通过谷歌快速搜索找到的两个，但是负载平衡经验为零，我不知道什么适合我们的情况，或者在选择解决方案来解决我们的问题时需要注意什么可用性问题。对我们来说最好的选择是什么？我们如何做才能在不超出预算的情况下提高可用性？

13 apache-2.2 load-balancing high-availability redundancy

2

戴尔镜像SD卡模块的替代品，用于从闪存启动小型操作系统？

戴尔为其某些服务器提供了一个附加硬件卡，该硬件卡在两个SD卡之间提供了一个穷人的RAID1（一张卡可以读取所有数据，直到它死掉，镜像被写入），以引导一个简单的OS，该OS的写入负载很少。操作系统存储（即ESXi）-请参见此处（警告：PDF链接）。非常适合运行无盘VM主机，而无需从SAN引导或担心从主机中取出一个廉价闪存而导致的故障-但它是非常专有的，以至于它已集成到支持它的系统的BIOS中。是否还有其他类似的解决方案，由服务器硬件供应商提供或以其他方式提供（我正在想象带有集成RAID1的定制USB闪存读取器？），该解决方案允许在两个廉价的小块闪存之间实现冗余，希望具有更好的兼容性。比“几个特定的戴尔服务器”？

12 hardware storage dell redundancy

9

设置DNS主/辅助/…的冗余和减少延迟的正确方法？

我认为用于冗余目的的DNS主/辅助很简单。我的理解是，您应该拥有一个主节点，并且至少要有一个辅助节点，并且应该将辅助节点设置在地理位置不同的位置，而且还应位于其他路由器后面（例如，请参见/server/48087 /为什么我的域有多个名称服务器）当前，我们在主数据中心中都有两个名称服务器。最近，由于各种原因，我们遭受了一些停机，导致两个名称服务器都被淘汰，使我们和我们的客户无法使用DNS了几个小时。我已要求系统管理员团队在另一个数据中心中完成DNS服务器的设置并将其配置为辅助名称服务器。但是，我们的系统管理员声称，如果另一个数据中心的可靠性至少不如主数据中心那么大，这将无济于事。他们声称，当主数据中心发生故障时，大多数客户端仍将无法正常查找或超时。就个人而言，我坚信我们不是唯一遇到此类问题的公司，而且很有可能已经解决了这一问题。我无法想象所有这些互联网公司都会受到我们这种问题的影响。但是，我找不到很好的在线文档来解释失败情况下的情况（例如，客户端超时）以及如何解决这些情况。我可以使用哪些参数来戳破系统管理员的推理？我可以咨询任何在线资源以更好地了解他们声称存在的问题吗？阅读回复后的一些附加说明：我们在Linux上我们还有其他复杂的DNS需求；我们的DNS条目由某些自定义软件管理，BIND当前从Twisted DNS实施中获取，并且还包含一些视图。但是，我们完全有能力在另一个数据中心设置我们自己的DNS服务器。我说的是供外部人员查找我们的服务器的权威DNS，而不是针对本地客户端的递归DNS服务器。

12 linux domain-name-system redundancy

6

您可以在DNS中为服务器设置备份IP吗？

DNS协议是否可以自然地保留备份A记录服务器地址，例如备份名称服务器或邮件服务器记录？搜索时，我仅在备份名称服务器（NS记录）上看到结果。如果DNS无法支持备份A记录，那么模拟结果的最佳方法是什么，以便在主服务器不响应的情况下将用户定向到正在运行的服务器？

10 domain-name-system backup-restoration redundancy

2

一台服务器，两台APC UPS在冗余电源上：如何触发关机？

我有一台服务器机架，其冗余电源插入了两个APC Smart-UPS 3000 XLM。每个UPS连接到两个不同的电源。正在运行两个apcupsd实例，每个实例都连接到其自己的UPS。他们都可以检测UPS何时使用电池供电，然后每个UPS都可以触发服务器关闭。问题是：如果只有一台UPS电池没电了，怎么不关机？注意：Smart-UPS 3000 XLM具有“电源同步”功能，该功能可以连接到其对等方并检测其状态。但是，当我从其中一个拔出插头时，无论如何都发出了关机命令。我正在考虑修改关闭脚本，以在其他启动失败时使用“ apcaccess”进行检查。任何经验，将不胜感激！

10 linux redundancy ups apcupsd

4

冗余电源晃动（如果晃动是正确的话）

我有一个带有两个单元的Supermicro冗余电源。我也有两个UPS单元，每个电源一个。我正在查看UPS上的LCD上的功耗。总瓦数约等于400瓦。这就是奇怪的地方。我观察到以下情况，这在我的其他30种Supermicro冗余电源设置中都没有看到。 It starts with... UPS1 200 Watts UPS2 200 Watts. Stays the same for 3 seconds and then changes with in a second to... UPS1 0 Watts UPS2 400 Watts. Stays the same for 3 seconds and then changes with in a second to... UPS1 200 Watts UPS2 200 Watts. …

9 redundancy power-supply-unit

1

用于站点冗余的VMware vSphere集群设计

我对使用vSphere群集时有关站点冗余的最佳设计有疑问。首先，我们会提供一些有关我们情况的背景信息。我们是一家中型公司，在不同国家设有两个主要办事处。我们的网络由目前未充分利用的Layer2 150Mbps租用线路链接。我们有多种服务供公司内部使用，其中一些服务在物理服务器上，而某些服务在现有的vSphere群集上。在我们的部门中，我们还运行多种服务（几乎全部在Linux的各种形式下运行），例如NTP，Syslog，跳转服务器，监视服务器等。现在，我们要求这些服务器需要在每个位置（当前不是它们）中是冗余的，并且还需要站点冗余（在某种程度上，它们是在第二个位置中重复的服务器，并且配置通过以下方式同步）应用层的各种方法）。没有适用于我们的SAN，至少目前没有可用的SAN。成本也是一个问题。尽管我们确实有一些可用的预算，但是例如，我们负担不起在两个地点都购买SAN。我查看了VSA功能，看来这可能对我们有用，但是我不确定如何解决站点冗余要求。目前出于测试目的，我正在实验室中在两台ESXi主机上设置具有VSA的vSphere 5。我目前正在使用带有VSA许可证的Essentials Plus工具包，该工具包使我可以在最多3台主机上构建VSA群集，并通过vCenter许可证来管理它们。每个主机都有两个在Raid1中运行的双端口网卡和两个600GB驱动器。在硬件方面，这足以让我们以VM的形式运行所需的所有服务，并在站点内提供冗余。目前，我仅看到两个具有站点冗余的选项：在第二个位置建立一个完全相同的VSA集群，并在应用程序层保持各种服务同步（数据库同步，rsync等）。只需将其中一台主机从现有群集移动到第二个位置，即可使VSA群集基本上跨越站点之间的150Mbps链路。我非常喜欢第二种选择，但是我不确定第二种选择是否可以正常工作。从技术上讲，我们应该可以跨租用线路跨越所需的VLAN，并使它们在第二个位置可用。这样做的好处是，我们完全不必担心同步数据库之类的问题。但是我感到带宽不足，无法知道VSA群集将在主机之间生成多少流量。我意识到这很可能取决于VM的使用情况，但是我仍然不知道VSA如何在ESXi主机之间复制数据。这些是我唯一的选择，还是可以通过其他方式实现我的目标？也许是否可以在第二个位置设置某种“冷备用”群集，使虚拟机每晚从主位置同步一次？这样做的想法是，如果第一个站点不可用，我们将能够使所有这些VM联机。我们可以接受1天的数据。任何答案表示赞赏。最好的问候，斯特凡

9 vmware-esxi vmware-vsphere redundancy

Questions tagged «redundancy»