DevOps metrics

4

DevOps很复杂，涉及文化和流程等许多不确定性方面。有哪些方法可以衡量DevOps成功的举措？您如何向企业证明他们所做的投资正在回报（或节省）真实美元？

24 metrics roi

1

在菲尼克斯项目中，在参观工厂的其中之一时，我们被告知每个工作站都是人员，机器，测量和过程的组合。毕竟，我们有了人员，服务器，KPI和说明，这很有意义。但是，每当我对流程进行建模（例如，支持通知单的生命周期）时，我都很难考虑到这一点。我的工作流状态通常包括：一线援助技术/开发/更多技术团队协助代码审查测试中 UAT 部署方式我可以很容易地测量每个状态的周期类型，吞吐量和排队时间，但是我认为这不符合“人，机器，方法”的概念。这是本书中令人沮丧地暗示的一个想法，但并未在...上进行扩展。我们知道等待时间是利用率的函数，因此监视人员和服务器（有限资源）的繁忙程度至关重要。书中有没有定义好的过程可以将我的测量范围从简单的有限状态机扩展到“人，机器，方法，过程”概念？

17 metrics systems the-phoenix-project

3

哪些关键绩效指标（KPI）用于衡量DevOps？

我试图在DevOps转换计划中推动良好的行为，以支持这一点，我正在寻找围绕运营准则确定可行的指标：问题与事件管理容量管理变更和发布管理绝对要清楚，这些功能曾经属于运营组织，现在由Agile / DevOps组织拥有。现有导致不良行为的KPI是：根本原因分析时间已完成：驱动不完整的RCA只是为了使它们按时进入系统。测试执行时间：禁用长期运行的测试，无论其业务价值如何。云服务的平均利用率：鼓励过度使用计算资源，从而导致响应时间变慢在DevOps计划中，哪些关键绩效指标可用于鼓励良好行为？

13 culture metrics kpi

1

云术语“ Firehose”到底是什么？

我从Loggregator System Cloud Foundry文档概述中找到了Firehose定义。 Firehose是一个WebSocket端点，用于流式传输所有来自Cloud Foundry部署的事件数据。数据流包括来自所有应用程序的日志，HTTP事件和容器指标，以及来自所有Cloud Foundry系统组件的指标。来自系统组件（例如Cloud Controller）的日志不包括在firehose中，通常通过rsyslog配置进行访问。由于来自Firehose的数据可能包含敏感信息，例如应用程序日志中的客户信息，因此只有具有正确权限的用户才能访问Firehose。这个术语的根源在哪里？为什么这样称呼它？其他云产品和平台的概念是否相同？当我将此术语翻译成我的母语时，这很有趣。

10 monitoring metrics logging

2

DevOps之前的部署指标挑战

TL; DR，您如何证明开发人员（特别是部署自动化）提高变更失败率？我们都在尝试使用当前（主要是手动）方法来获取有关“部署失败”的指标。不幸的是，很少发生“故障”，对吧？因为当出现问题时，团队会聚在一起（通常与英勇专家一起）来解决问题（通常是权限，错过的配置，您知道演练）。所以……当我们询问部署的进行方式时，答案是“有效”。但是，直觉上我们都知道那不好。2017年devops状态报告说，大约有31-45％的“ 变更失败率”。虽然听起来很正确，但它们是否作为事件进行了跟踪？没事因为它们通常在验证期间很快就被修复了。实际上回滚部署的情况要少得多。因此，准确报告故障率需要纪律。我们没有动力进行这样的报告，因为我们希望事情能够正常进行，并且我们会尽一切努力实现这一目标。那么，如何证明开发人员（特别是部署自动化）提高变更失败率？（PS尝试使用“＃devops-capability-model”为它添加标签）

9 metrics

Questions tagged «metrics»