我的数据遵循什么分布?
让我们说我有1000个组件,并且我一直在收集有关这些组件记录故障的次数以及每次它们记录故障的数据,我还跟踪团队修复该问题花费了多长时间。简而言之,我一直在记录这1000个组件中每个组件的修复时间(以秒为单位)。在该问题的末尾提供了数据。 我把所有的这些值,并使用在画了R A Cullen和Frey图descdist从fitdistrplus包。我的希望是了解维修时间是否遵循特定的分配时间。这是boot=500获取引导值的图: 我看到该图告诉我观察结果属于beta分布(或者可能不是,在这种情况下,它揭示了什么?)现在,考虑到我是系统架构师而不是统计学家,那么该图揭示了什么? ?(我正在寻找这些结果背后的实际现实直觉)。 编辑: QQplot使用qqPlot包中的功能car。我首先使用该fitdistr函数估算了形状和比例参数。 > fitdistr(Data$Duration, "weibull") shape scale 3.783365e-01 5.273310e+03 (6.657644e-03) (3.396456e+02) 然后,我这样做: qqPlot(LB$Duration, distribution="weibull", shape=3.783365e-01, scale=5.273310e+03) 编辑2: 使用对数正态QQplot更新。 这是我的数据: c(1528L, 285L, 87138L, 302L, 115L, 416L, 8940L, 19438L, 165820L, 540L, 1653L, 1527L, 974L, 12999L, 226L, 190L, 306L, 189L, 138542L, 3049L, 129067L, 21806L, 456L, 22745L, 198L, …