如何在Python直方图中包含对数垃圾箱


78

据我所知,直方图函数中的选项Log = True仅指y轴。

P.hist(d,bins=50,log=True,alpha=0.5,color='b',histtype='step')

我需要将垃圾箱在log10中等距放置。有什么可以做到的吗?


1
如果要这样做,必须将每个箱中的计数除以箱宽度!
2016年

Answers:


125

使用logspace()创建几何序列,并将其传递到bins参数。并将xaxis的比例设置为对数比例。

import pylab as pl
import numpy as np

data = np.random.normal(size=10000)
pl.hist(data, bins=np.logspace(np.log10(0.1),np.log10(1.0), 50))
pl.gca().set_xscale("log")
pl.show()

在此处输入图片说明


20
请注意,这np.logspace(0.1,1.0,...)将创建从10**0.110**1.0而不是从0.1到的范围1.0
Andre Holzner 2015年

12
应该是np.logspace(np.log10(0.1),np.log10(1.0),50)
OrangeSherbet

1
看我如何使用垃圾箱=“自动”的答案
N. MCA。

20

最直接的方法是只计算极限的log10,计算线性间隔的bin,然后通过提高到10的幂进行转换,如下所示:

import pylab as pl
import numpy as np

data = np.random.normal(size=10000)

MIN, MAX = .01, 10.0

pl.figure()
pl.hist(data, bins = 10 ** np.linspace(np.log10(MIN), np.log10(MAX), 50))
pl.gca().set_xscale("log")
pl.show()

log10间隔的垃圾箱


10

以下代码指示如何使用bins='auto'对数刻度。

import numpy as np
import matplotlib.pyplot as plt

data = 10**np.random.normal(size=500)

_, bins = np.histogram(np.log10(data + 1), bins='auto')
plt.hist(data, bins=10**bins);
plt.gca().set_xscale("log")

图表


0

除了声明的内容外,还可以在熊猫数据帧上执行此操作:

some_column_hist = dataframe['some_column'].plot(bins=np.logspace(-2, np.log10(max_value), 100), kind='hist', loglog=True, xlim=(0,max_value))

我要警告,归一化垃圾箱可能存在问题。每个bin都大于前一个bin,因此在绘制之前必须将其除以大小以归一化频率,并且似乎我的解决方案和HYRY的解决方案都无法解决这个问题。

资料来源:https : //arxiv.org/pdf/cond-mat/0412004.pdf

By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.