我使用R中的Mfuzz对时间进程微阵列数据集进行聚类。Mfuzz 使用“软聚类”。基本上,个人可以出现在多个组中。
正如@Andy 在评论中指出的那样,原始论文使用 CTN 数据。但是,我怀疑它应该适用于您的离散数据。特别是因为您只是在探索数据集。这是 R 中的一个简单示例:
##It's a bioconductor package
library(Mfuzz)
library(Biobase)
## Simulate some data
## 6 time points and 90 individuals
tps = 6;cases = 90
d = rpois(tps*cases, 1) ##Poisson distribution with mean 1
m = matrix(d, ncol=tps, nrow=cases)
##First 30 individuals have increasing trends
m[1:30,] = t(apply(m[1:30,], 1, cumsum))
##Next 30 have decreasing trends
##A bit hacky, sorry
m[31:60,] = t(apply(t(apply(m[31:60,], 1, cumsum)), 1, rev))
##Last 30 individuals have random numbers from a Po(1)
##Create an expressionSet object
tmp_expr = new('ExpressionSet', exprs=m)
##Specify c=3 clusters
cl = mfuzz(tmp_expr, c=3, m=1.25)
mfuzz.plot(tmp_expr,cl=cl, mfrow=c(2, 2))
给出以下情节: