如何绘制直方图,以使matplotlib中的条形高度之和为1?


85

我想使用matplotlib从向量绘制归一化的直方图。我尝试了以下方法:

plt.hist(myarray, normed=True)

以及:

plt.hist(myarray, normed=1)

但是没有一个选项会从[0,1]产生y轴,以使得直方图的条形高度之和为1。我想生成这样的直方图-我该怎么做?


5
我知道这是古老的,但为将来参考和访问此页面的任何人,这种轴扩展称为“概率密度”轴!
ChristineB

Answers:


48

如果您提出了更完整的工作示例(或在这种情况下为非工作示例),则将更有帮助。

我尝试了以下方法:

import numpy as np
import matplotlib.pyplot as plt

x = np.random.randn(1000)

fig = plt.figure()
ax = fig.add_subplot(111)
n, bins, rectangles = ax.hist(x, 50, density=True)
fig.canvas.draw()
plt.show()

实际上,这将产生一个y轴从到的条形图直方图[0,1]

此外,按照该hist文件(即ax.hist?ipython),我觉得总和也没关系:

*normed*:
If *True*, the first element of the return tuple will
be the counts normalized to form a probability density, i.e.,
``n/(len(x)*dbin)``.  In a probability density, the integral of
the histogram should be 1; you can verify that with a
trapezoidal integration of the probability density function::

    pdf, bins, patches = ax.hist(...)
    print np.sum(pdf * np.diff(bins))

在上面的命令后尝试一下:

np.sum(n * np.diff(bins))

我得到1.0预期的返回值。请记住,normed=True这并不意味着每个小节的值之和将是统一的,而不是在小节上的积分是统一的。在我的情况下,np.sum(n)返回约7.2767


3
是的,那是一个概率密度图,我认为他想要一个概率质量图。
NoName

200

如果希望所有条的总和等于1,请按值的总数对每个bin加权:

weights = np.ones_like(myarray) / len(myarray)
plt.hist(myarray, weights=weights)

希望有帮助,尽管线程已经很旧了...

Python 2.x的注意事项:float()为除法运算符之一添加强制转换,否则由于整数除法,运算符最终将为零


8
好答案。请注意,如果myarray是pythonarray_like而不是numpy数组,则需要转换len(myarray)float
cmh 2013年

3
另外,如果myarray是多维的并且您只使用一维,例如myarray [0 ,:],则可以将len(myarray)与np.size(myarray [0 ,:])换出,这样就可以同样的方式。(否则,它说该对象不可调用。)
ChristineB

22

考虑到问题的日期为2010年,我知道这个答案为时已晚,但由于我自己也遇到了类似的问题,因此我遇到了这个问题。如答案中已经指出的那样,normed = True表示直方图下的总面积等于1,但高度的总和不等于1。但是,为了方便物理解释直方图,我想高度之和等于1。

我在以下问题中找到了提示-Python:将面积标准化为1以外的直方图

但是我无法找到一种使条形模仿histt​​ype =“ step”功能hist()的方法。这使我转向:Matplotlib-具有已分类数据的步进直方图

如果社区认为可以接受,那么我想提出一个解决方案,该方案综合了以上两个方面的想法。

import matplotlib.pyplot as plt

# Let X be the array whose histogram needs to be plotted.
nx, xbins, ptchs = plt.hist(X, bins=20)
plt.clf() # Get rid of this histogram since not the one we want.

nx_frac = nx/float(len(nx)) # Each bin divided by total number of objects.
width = xbins[1] - xbins[0] # Width of each bin.
x = np.ravel(zip(xbins[:-1], xbins[:-1]+width))
y = np.ravel(zip(nx_frac,nx_frac))

plt.plot(x,y,linestyle="dashed",label="MyLabel")
#... Further formatting.

尽管在某些情况下,我注意到直方图最左边的“条”或最右边的“条”并没有通过触摸Y轴的最低点而关闭,但对我而言,它的工作非常出色。在这种情况下,在开头或y的末尾添加元素0即可达到所需的结果。

只是以为我会分享我的经验。谢谢。


我认为您在plt.hist中也需要normed = True。同样在Python 3中,您必须使用list(zip(...))。
塞巴斯蒂安·施米兹

11

这是使用np.histogram()方法的另一个简单解决方案。

myarray = np.random.random(100)
results, edges = np.histogram(myarray, normed=True)
binWidth = edges[1] - edges[0]
plt.bar(edges[:-1], results*binWidth, binWidth)

您确实可以使用以下方法检查总数是否等于1:

> print sum(results*binWidth)
1.0
By using our site, you acknowledge that you have read and understand our Cookie Policy and Privacy Policy.
Licensed under cc by-sa 3.0 with attribution required.