我有点困惑。有人可以向我解释如何基于以二进制术语出现作为权重的术语文档矩阵计算两个术语之间的互信息吗?
Document1Document2Document3′Why′111′How′101′When′111′Where′100′Why′′How′′When′′Where′Document11111Document21010Document31110
I(X;Y)=∑y∈Y∑x∈Xp(x,y)log(p(x,y)p(x)p(y))I(X;Y)=∑y∈Y∑x∈Xp(x,y)log(p(x,y)p(x)p(y))
谢谢
如何形成一个联合概率表来保存文档中的标准化共现。然后您可以使用该表获得联合熵和边际熵。最后,