Answers:
您可以使用matplotlib手动创建子图,然后使用ax
关键字在特定的子图上绘制数据框。例如,对于4个子图(2x2):
import matplotlib.pyplot as plt
fig, axes = plt.subplots(nrows=2, ncols=2)
df1.plot(ax=axes[0,0])
df2.plot(ax=axes[0,1])
...
这axes
是一个包含不同子图轴的数组,您只需通过index即可访问一个axes
。
如果要共享x轴,则可以提供sharex=True
给plt.subplots
。
IndexError: too many indices for array
.subplot()
在使用默认参数时很烦人。设置squeeze=False
为在任何情况下.subplot()
都始终返回ndarray
行和列的强制。
您可以看到例如 在演示joris答案的文档中。另外,从文档,您也可以设置subplots=True
和layout=(,)
大熊猫内plot
功能:
df.plot(subplots=True, layout=(1,2))
你也可以使用fig.add_subplot()
这需要插曲电网参数,如221,222,223,224,等,在后描述这里。可以在此ipython笔记本中看到有关熊猫数据框(包括子图)的漂亮绘图示例。
subplots
和和layout
kwargs只会为单个数据帧生成多个图。这与OP的将多个数据帧绘制到单个图中的问题有关,但不是解决方案。
layout=(df.shape[1], 1)
例如,可以使用)。
您可以使用matplotlib通过绘制所有数据框列表的简单技巧来绘制多个熊猫数据框的多个子图。然后使用for循环绘制子图。
工作代码:
import matplotlib.pyplot as plt
import pandas as pd
import numpy as np
# dataframe sample data
df1 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df2 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df3 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df4 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df5 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
df6 = pd.DataFrame(np.random.rand(10,2)*100, columns=['A', 'B'])
#define number of rows and columns for subplots
nrow=3
ncol=2
# make a list of all dataframes
df_list = [df1 ,df2, df3, df4, df5, df6]
fig, axes = plt.subplots(nrow, ncol)
# plot counter
count=0
for r in range(nrow):
for c in range(ncol):
df_list[count].plot(ax=axes[r,c])
count=+1
使用此代码,您可以在任何配置中绘制子图。您只需要定义行nrow
数和列数即可ncol
。另外,您需要列出df_list
要绘制的数据框。
count =+1
,但count +=1
假设条件
cat
可能重叠,但是所有数据框可能不包含的所有值cat
hue='cat'
因为要遍历数据帧,所以不能保证每个图的颜色都相同
'cat'
所有数据框的唯一值创建自定义颜色图import pandas as pd
import numpy as np # used for random data
import random # used for random data
import matplotlib.pyplot as plt
from matplotlib.patches import Patch # for custom legend
import seaborn as sns
import math import ceil # determine correct number of subplot
# synthetic data
df_dict = dict()
for i in range(1, 7):
np.random.seed(i)
random.seed(i)
data_length = 100
data = {'cat': [random.choice(['A', 'B', 'C']) for _ in range(data_length)],
'x': np.random.rand(data_length),
'y': np.random.rand(data_length)}
df_dict[i] = pd.DataFrame(data)
# display(df_dict[1].head())
cat x y
0 A 0.417022 0.326645
1 C 0.720324 0.527058
2 A 0.000114 0.885942
3 B 0.302333 0.357270
4 A 0.146756 0.908535
# create color mapping based on all unique values of cat
unique_cat = {cat for v in df_dict.values() for cat in v.cat.unique()} # get unique cats
colors = sns.color_palette('husl', n_colors=len(unique_cat)) # get a number of colors
cmap = dict(zip(unique_cat, colors)) # zip values to colors
# iterate through dictionary and plot
col_nums = 3 # how many plots per row
row_nums = math.ceil(len(df_dict) / col_nums) # how many rows of plots
plt.figure(figsize=(10, 5)) # change the figure size as needed
for i, (k, v) in enumerate(df_dict.items(), 1):
plt.subplot(row_nums, col_nums, i) # create subplots
p = sns.scatterplot(data=v, x='x', y='y', hue='cat', palette=cmap)
p.legend_.remove() # remove the individual plot legends
plt.title(f'DataFrame: {k}')
plt.tight_layout()
# create legend from cmap
patches = [Patch(color=v, label=k) for k, v in cmap.items()]
# place legend outside of plot; change the right bbox value to move the legend up or down
plt.legend(handles=patches, bbox_to_anchor=(1.06, 1.2), loc='center left', borderaxespad=0)
plt.show()
.subplots()
根据要创建的子图阵列的尺寸,它们返回不同的坐标系。因此,如果您在某个位置返回子图,则nrows=2, ncols=1
需要将轴索引为axes[0]
和axes[1]
。参见stackoverflow.com/a/21967899/1569221