我想使用matplotlib从向量绘制归一化的直方图。我尝试了以下方法:
plt.hist(myarray, normed=True)
以及:
plt.hist(myarray, normed=1)
但是没有一个选项会从[0,1]产生y轴,以使得直方图的条形高度之和为1。我想生成这样的直方图-我该怎么做?
Answers:
如果您提出了更完整的工作示例(或在这种情况下为非工作示例),则将更有帮助。
我尝试了以下方法:
import numpy as np
import matplotlib.pyplot as plt
x = np.random.randn(1000)
fig = plt.figure()
ax = fig.add_subplot(111)
n, bins, rectangles = ax.hist(x, 50, density=True)
fig.canvas.draw()
plt.show()
实际上,这将产生一个y轴从到的条形图直方图[0,1]
。
此外,按照该hist
文件(即ax.hist?
从ipython
),我觉得总和也没关系:
*normed*:
If *True*, the first element of the return tuple will
be the counts normalized to form a probability density, i.e.,
``n/(len(x)*dbin)``. In a probability density, the integral of
the histogram should be 1; you can verify that with a
trapezoidal integration of the probability density function::
pdf, bins, patches = ax.hist(...)
print np.sum(pdf * np.diff(bins))
在上面的命令后尝试一下:
np.sum(n * np.diff(bins))
我得到1.0
预期的返回值。请记住,normed=True
这并不意味着每个小节的值之和将是统一的,而不是在小节上的积分是统一的。在我的情况下,np.sum(n)
返回约7.2767
。
如果希望所有条的总和等于1,请按值的总数对每个bin加权:
weights = np.ones_like(myarray) / len(myarray)
plt.hist(myarray, weights=weights)
希望有帮助,尽管线程已经很旧了...
Python 2.x的注意事项:float()
为除法运算符之一添加强制转换,否则由于整数除法,运算符最终将为零
array_like
而不是numpy数组,则需要转换len(myarray)
为float
。
考虑到问题的日期为2010年,我知道这个答案为时已晚,但由于我自己也遇到了类似的问题,因此我遇到了这个问题。如答案中已经指出的那样,normed = True表示直方图下的总面积等于1,但高度的总和不等于1。但是,为了方便物理解释直方图,我想高度之和等于1。
我在以下问题中找到了提示-Python:将面积标准化为1以外的直方图
但是我无法找到一种使条形模仿histtype =“ step”功能hist()的方法。这使我转向:Matplotlib-具有已分类数据的步进直方图
如果社区认为可以接受,那么我想提出一个解决方案,该方案综合了以上两个方面的想法。
import matplotlib.pyplot as plt
# Let X be the array whose histogram needs to be plotted.
nx, xbins, ptchs = plt.hist(X, bins=20)
plt.clf() # Get rid of this histogram since not the one we want.
nx_frac = nx/float(len(nx)) # Each bin divided by total number of objects.
width = xbins[1] - xbins[0] # Width of each bin.
x = np.ravel(zip(xbins[:-1], xbins[:-1]+width))
y = np.ravel(zip(nx_frac,nx_frac))
plt.plot(x,y,linestyle="dashed",label="MyLabel")
#... Further formatting.
尽管在某些情况下,我注意到直方图最左边的“条”或最右边的“条”并没有通过触摸Y轴的最低点而关闭,但对我而言,它的工作非常出色。在这种情况下,在开头或y的末尾添加元素0即可达到所需的结果。
只是以为我会分享我的经验。谢谢。
这是使用np.histogram()
方法的另一个简单解决方案。
myarray = np.random.random(100)
results, edges = np.histogram(myarray, normed=True)
binWidth = edges[1] - edges[0]
plt.bar(edges[:-1], results*binWidth, binWidth)
您确实可以使用以下方法检查总数是否等于1:
> print sum(results*binWidth)
1.0