在基于Linux的数据中心中检测时间漂移的策略是什么?


14

在所有基于Linux的数据中心中检测时间漂移的策略是什么?这个问题比起初看起来要困难得多。

时间漂移会对某些应用程序造成严重问题,而且即使安装了NTP,通常也会由于以下(以及更多)原因而导致失败:

  • NTP未正确设置为在重新启动时自动重新启动。
  • 服务器上的设置不正确,因此它指向的时间服务器不可达或不准确。
  • 主时间服务器无法访问,并且所有与其同步的服务器现在正在同步到不可靠的源。

我想要一种检测所有单个服务器是否正确的方法。请记住,带有测试脚本/应用程序的服务器可能不正确。


6
我认为您的原因是虚假的,可操作的NTP对服务器场至关重要。确保什么NTP工作正常。另外,部署本地主时钟。
user539484 2013年

NTP现在可以在许多Linux发行版中使用合理的默认值开箱即用。现在几乎没有问题了。
马特

Answers:


20

这很容易控制。配置管理是关键...

确保ntp服务正在运行并已配置...

例如,使用Monit来确保ntpd正在运行并在失败时重新启动它是一种简单的方法...在这种检查中添加cron和其他必要的守护程序可能是有意义的。

另一个选择是使用配置管理工具(如Puppet)将相同的ntpd.conf强制到您的服务器,并确保已安装,配置和运行ntpd。

NTP协议中有足够的冗余来处理时间服务器无法访问的实例。指定多个来源。


3
我必须回应这一观点。在接近“数据中心”的任何事物中,配置管理和多个NTP服务器都是基础结构的基本组成部分。中型或大型数据中心应具有硬件时钟。GPS时间源可以购买几百个,如果您的电烙铁价格低于$ 100。
克里斯S

这个解决方案+ nagios
那边的那个人

4
请注意,如何检查ntpd的状态非常重要。您不想只说“ ntpd正在运行。一切都很好!”。您实际上必须验证您的系统正在同步并且具有对等的功能,或者主机与监视盒之间的时间偏移最小。如果您想使用Nagios,Nagios拥有check_ntp_peercheck_ntp_time负责处理该问题。
voretaq13年

ntpq检查状态
kubanczyk

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.