大约50天后,SQL Server 2012页面预期寿命将重置为0


12

我注意到两台服务器HA群集上的行为异常,我希望有人可以证实我的怀疑,或者提供其他解释...这是我的设置:

  • 2服务器SQL 2012 SP1安装
  • 已为一些数据库启用SQL AlwaysOn HA
  • CPU为2.4GHz,4核
  • RAM为34 GB(这是一个AWS实例,因此为奇数)
  • 资源利用率相对较低-每个服务器有14 GB以上的可用内存,并且SQL没有限制要使用的内存量
  • 磁盘访问时间很好-很少超过15ms /读或写
  • 数据库不是很大-1 GB,1.5 GB,7.5 GB
  • SQL Server进程正在使用16 GB专用字节,15 GB工作集

总体而言,没有发现资源问题。现在是奇怪的部分。SQL不会重新启动(进程已经运行了近6个月),但是似乎每隔50天,Page Life Expectancy计数器就会下降(几乎)为0。直到那一点为止,它稳步上升,没有下降。这是一个性能图:

在此处输入图片说明

当我查看计数器数据(我没有确切的数字,只是一个小时的汇总)时,似乎PLE计数器值每次(至少每次我有数据)都达到约4,295,000秒(约50天)。

我疯狂的理论是,PLE数字以毫秒为单位,以无符号长整数(上限为4,294,967,295)保存,并且在49.71天时会由于设计或错误而重置。这将解释两个服务器的行为以及它们具有的相同模式。或者可能是完全不同的东西,我只是没有任何意义。:)

有没有人看到过类似的东西,或者可以解释这种行为?

PS我看到了这篇文章,但我的情况似乎略有不同。

PPS这是一个重新发布-我最初在此处发布,但被告知此处的观众更合适。

谢谢!


评论不作进一步讨论;此对话已转移至聊天
保罗·怀特9

Answers:


3

我已经在运行SQL2012 SP1的客户端站点上看到此行为。此处的详细信息为NUMA和PLE,但以小时为周期演示了“锯齿”模式。

SQLServerCentral上的几个线程对此进行了讨论:

http://www.sqlservercentral.com/Forums/Topic1415833-2799-1.aspx http://www.sqlservercentral.com/Forums/Topic1424826-2799-1.aspx

最终结果是,应用SP1 CU4似乎可以解决该问题。

CU4包含无害的外观修复程序SQL Server 2012内存管理KB2845380有可用的更新

值得一试?


感谢您发布此信息(抱歉,回复延迟,由于某些原因,我从未收到您的信息通知)。我看了一下链接-它们看起来确实有些相似,所以我将尝试在QA中复制设置,应用CU4(甚至可能直接转到SP2),然后再次检查。以我的步伐(每50天),我需要一段时间才能确认,但是如果有结果,我会回发。顺便说一句,我的模式仍然保持不变-持续约50天,然后急剧下降至〜0,然后再次上升-自从12月开始服务以来总共有4次。
CRCerr0r 2014年

更新...我已经在我们的质量检查环境中确认了这一点。我从那里得到的统计数据是:重置之间的总天数-49.71(+/- 1分钟);最大PLE值达到-4,294,961(在1分钟的样本中,因此可能会稍高一些)。这几乎证实了生产观察。我将使用CU4并在约50天后返回报告... :)
CRCerr0r 2014年

1
有什么消息吗?
迈克尔·格林
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.