我注意到两台服务器HA群集上的行为异常,我希望有人可以证实我的怀疑,或者提供其他解释...这是我的设置:
- 2服务器SQL 2012 SP1安装
- 已为一些数据库启用SQL AlwaysOn HA
- CPU为2.4GHz,4核
- RAM为34 GB(这是一个AWS实例,因此为奇数)
- 资源利用率相对较低-每个服务器有14 GB以上的可用内存,并且SQL没有限制要使用的内存量
- 磁盘访问时间很好-很少超过15ms /读或写
- 数据库不是很大-1 GB,1.5 GB,7.5 GB
- SQL Server进程正在使用16 GB专用字节,15 GB工作集
总体而言,没有发现资源问题。现在是奇怪的部分。SQL不会重新启动(进程已经运行了近6个月),但是似乎每隔50天,Page Life Expectancy计数器就会下降(几乎)为0。直到那一点为止,它稳步上升,没有下降。这是一个性能图:
当我查看计数器数据(我没有确切的数字,只是一个小时的汇总)时,似乎PLE计数器值每次(至少每次我有数据)都达到约4,295,000秒(约50天)。
我疯狂的理论是,PLE数字以毫秒为单位,以无符号长整数(上限为4,294,967,295)保存,并且在49.71天时会由于设计或错误而重置。这将解释两个服务器的行为以及它们具有的相同模式。或者可能是完全不同的东西,我只是没有任何意义。:)
有没有人看到过类似的东西,或者可以解释这种行为?
PS我看到了这篇文章,但我的情况似乎略有不同。
PPS这是一个重新发布-我最初在此处发布,但被告知此处的观众更合适。
谢谢!