正如您所发现的,您的问题没有简单的答案!
我想你有兴趣寻找奇怪或不同的书店吗?如果是这种情况,那么您可以尝试诸如PCA之类的方法(有关更多详细信息,请参阅维基百科集群分析页面)。
为了给你一个想法,考虑这个例子。您有 26 家书店(名称为 A、B、..Z)。所有的书店都是相似的,除了:
- Z 店只卖几本历史书。
- OY 商店销售的言情小说比平均水平高。
主成分图突出显示这些商店以供进一步调查。
这是一些示例 R 代码:
> d = data.frame(Romance = rpois(26, 50), Horror = rpois(26, 100),
Science = rpois(26, 75), History = rpois(26, 125))
> rownames(d) = LETTERS
#Alter a few shops
> d[15:25,][1] = rpois(11,150)
> d[26,][4] = rpois(1, 10)
#look at the data
> head(d, 2)
Romance Horror Science History
A 36 107 62 139
B 47 93 64 118
> books.PC.cov = prcomp(d)
> books.scores.cov = predict(books.PC.cov)
# Plot of PC1 vs PC2
> plot(books.scores.cov[,1],books.scores.cov[,2],
xlab="PC 1",ylab="PC 2", pch=NA)
> text(books.scores.cov[,1],books.scores.cov[,2],labels=LETTERS)
这给出了以下情节:
PCA 图 http://img265.imageshack.us/img265/7263/tmplx.jpg
请注意:
- Z 店是一个边远点。
- 其他商店形成两个不同的群体。
其他可能性
你也可以看看GGobi,我没用过,但看起来很有趣。