如您所知,您的问题没有简单的答案!
我想您是否有兴趣寻找奇怪的或不同的书店?如果是这种情况,那么您可以尝试使用PCA之类的工具(有关更多详细信息,请参见Wikipedia 群集分析页面)。
为了给您一个想法,请考虑以下示例。您有26个书店(名称分别为A,B,.. Z)。所有书店都类似,除了:
- Z店只出售一些历史书籍。
- OY商店出售的浪漫小说数量超过平均水平。
一个主要组成部分图突出显示了这些商店,以供进一步调查。
这是一些示例R代码:
> d = data.frame(Romance = rpois(26, 50), Horror = rpois(26, 100),
Science = rpois(26, 75), History = rpois(26, 125))
> rownames(d) = LETTERS
#Alter a few shops
> d[15:25,][1] = rpois(11,150)
> d[26,][4] = rpois(1, 10)
#look at the data
> head(d, 2)
Romance Horror Science History
A 36 107 62 139
B 47 93 64 118
> books.PC.cov = prcomp(d)
> books.scores.cov = predict(books.PC.cov)
# Plot of PC1 vs PC2
> plot(books.scores.cov[,1],books.scores.cov[,2],
xlab="PC 1",ylab="PC 2", pch=NA)
> text(books.scores.cov[,1],books.scores.cov[,2],labels=LETTERS)
这给出了以下图:
PCA图http://img265.imageshack.us/img265/7263/tmplx.jpg
注意:
- z商店是一个偏僻的地方。
- 其他商店组成两个不同的组。
其他可能性
您也可以查看GGobi,我从未使用过它,但是看起来很有趣。