我们有一个Graphite服务器,可以通过collected,statsd,JMXTrans收集数据。几天以来,我们的数据经常出现漏洞。挖掘我们仍然拥有的数据,我们可以看到碳缓存的大小有所增加(从50K增加到4M)。我们看不到收集的指标数量增加(metricsReceived稳定在30万左右)。我们的查询数量平均从1000个增加到1500个。
奇怪的是,当高速缓存大小增加时,cpuUsage从100%(我们有4个CPU)略微降低到50%。
再次奇怪的是,如果从磁盘读取八位位组,则数量会增加,而写入八位位组的数量会减少。
我们将carbon配置为大多数使用默认值:
- MAX_CACHE_SIZE = inf
- MAX_UPDATES_PER_SECOND = 5000
- MAX_CREATES_PER_MINUTE = 2000
显然,我们的系统已经发生了某些变化,但是我们不知道是什么,也不知道如何找到原因。
有什么帮助吗?