我有 150 个可能出现在 10000 人中的属性。个人可能没有,一个或几个这些属性。这些属性不是相互排斥的,并且在总体中具有不同的频率。
我想在这里回答两个问题:
这些属性的特定集合是否相关联,即它们在一个人身上出现的频率是否比偶然预期的要多?该方法不仅应该分析两个属性的成对共现,还应该识别一起出现的属性集。理想情况下,我希望有一个概率度量,比如给定一组属性的 p 值,告诉我偶然观察到这种属性组合的可能性。
给定一个样本,例如 10000 人中的 50 人,我想知道在样本中观察到的属性的共现是否与人口中的随机样本显着不同。
我如何最好地用统计/数学术语解决这个问题?您可以推荐任何用于计算的工具吗?